படிநிலை Vs பகிர்வு கிளஸ்டரிங்

க்ளஸ்டரிங் என்பது தரவை பகுப்பாய்வு செய்வதற்கும் ஒத்த தரவுகளின் குழுக்களாகப் பிரிப்பதற்கும் ஒரு இயந்திர கற்றல் நுட்பமாகும். இந்த குழுக்கள் அல்லது ஒத்த தரவுகளின் தொகுப்புகள் கொத்துகள் என அழைக்கப்படுகின்றன. கிளஸ்டர் பகுப்பாய்வு கிளஸ்டர்களை தானாக அடையாளம் காணக்கூடிய க்ளஸ்டரிங் வழிமுறைகளைப் பார்க்கிறது. படிநிலை மற்றும் பகிர்வு என்பது க்ளஸ்டரிங் வழிமுறைகளின் இரண்டு வகுப்புகள். படிநிலை கிளஸ்டரிங் வழிமுறைகள் தரவுகளை கொத்துகளின் வரிசைக்கு உடைக்கின்றன. பகுதியளவு வழிமுறைகள் பரஸ்பர ஒத்திசைவு பகிர்வுகளாக அமைக்கப்பட்ட தரவைப் பிரிக்கின்றன.

படிநிலை கிளஸ்டரிங் என்றால் என்ன?

படிநிலை கிளஸ்டரிங் வழிமுறைகள் சிறிய கிளஸ்டர்களை பெரியவையாக ஒன்றிணைக்கும் அல்லது பெரிய கிளஸ்டர்களை சிறியதாக பிரிக்கும் சுழற்சியை மீண்டும் செய்கின்றன. எந்த வகையிலும், இது டெண்டோகிராம் எனப்படும் கொத்துக்களின் வரிசைக்குறிப்பை உருவாக்குகிறது. அக்ளோமரேடிவ் க்ளஸ்டரிங் மூலோபாயம் கொத்துக்களை பெரியவற்றுடன் இணைப்பதற்கான கீழ்நிலை அணுகுமுறையைப் பயன்படுத்துகிறது, அதே நேரத்தில் பிளவுபடுத்தும் கிளஸ்டரிங் உத்தி சிறியவற்றைப் பிரிப்பதற்கான மேல்-கீழ் அணுகுமுறையைப் பயன்படுத்துகிறது. பொதுவாக, பேராசை அணுகுமுறை எந்த பெரிய / சிறிய கொத்துக்களை ஒன்றிணைக்க / பிரிக்கப் பயன்படுகிறது என்பதை தீர்மானிப்பதில் பயன்படுத்தப்படுகிறது. யூக்ளிடியன் தூரம், மன்ஹாட்டன் தூரம் மற்றும் கொசைன் ஒற்றுமை ஆகியவை எண் தரவுகளுக்கான ஒற்றுமையின் மிகவும் பொதுவாக பயன்படுத்தப்படும் அளவீடுகள். எண் அல்லாத தரவுகளுக்கு, ஹேமிங் தூரம் போன்ற அளவீடுகள் பயன்படுத்தப்படுகின்றன. படிநிலை கிளஸ்டரிங்கிற்கு உண்மையான அவதானிப்புகள் (நிகழ்வுகள்) தேவையில்லை என்பதைக் கவனத்தில் கொள்ள வேண்டும், ஏனென்றால் தூரங்களின் அணி மட்டுமே போதுமானது. டெண்டோகிராம் என்பது கொத்துக்களின் காட்சி பிரதிநிதித்துவம் ஆகும், இது வரிசைமுறையை மிக தெளிவாகக் காட்டுகிறது. டெண்டோகிராம் வெட்டப்பட்ட அளவைப் பொறுத்து பயனர் வெவ்வேறு கிளஸ்டரிங் பெற முடியும்.

பகிர்வு கிளஸ்டரிங் என்றால் என்ன?

பகிர்வு கிளஸ்டரிங் வழிமுறைகள் பல்வேறு பகிர்வுகளை உருவாக்குகின்றன, பின்னர் அவற்றை சில அளவுகோல்களால் மதிப்பிடுகின்றன. ஒவ்வொரு நிகழ்வும் கே பரஸ்பர பிரத்தியேக கிளஸ்டர்களில் ஒன்றில் வைக்கப்படுவதால் அவை அதிகாரமற்றவை என்றும் குறிப்பிடப்படுகின்றன. ஒரு பொதுவான கிளஸ்டரிங் அல்காரிதத்தின் வெளியீடாக ஒரே ஒரு கொத்து கொத்துகள் இருப்பதால், பயனர் விரும்பிய எண்ணிக்கையிலான கிளஸ்டர்களை உள்ளிட வேண்டும் (பொதுவாக k என அழைக்கப்படுகிறது). மிகவும் பொதுவாகப் பயன்படுத்தப்படும் பகிர்வு கிளஸ்டரிங் வழிமுறைகளில் ஒன்று k-means க்ளஸ்டரிங் அல்காரிதம் ஆகும். துவங்குவதற்கு முன் கிளஸ்டர்களின் எண்ணிக்கையை (கே) வழங்க பயனர் தேவை, மற்றும் வழிமுறை முதலில் கே பகிர்வுகளின் மையங்களை (அல்லது சென்ட்ராய்டுகளை) துவக்குகிறது. சுருக்கமாக, கே-க்ளஸ்டரிங் அல்காரிதம் பின்னர் தற்போதைய மையங்களின் அடிப்படையில் உறுப்பினர்களை நியமிக்கிறது மற்றும் தற்போதைய உறுப்பினர்களை அடிப்படையாகக் கொண்ட மறு மதிப்பீட்டு மையங்களை வழங்குகிறது. ஒரு குறிப்பிட்ட உள்-கிளஸ்டர் ஒற்றுமை புறநிலை செயல்பாடு மற்றும் இடை-கிளஸ்டர் ஒற்றுமை புறநிலை செயல்பாடு உகந்ததாக இருக்கும் வரை இந்த இரண்டு படிகள் மீண்டும் மீண்டும் செய்யப்படுகின்றன. எனவே, பகிர்வு கிளஸ்டரிங் வழிமுறைகளிலிருந்து தரமான முடிவுகளைப் பெறுவதில் மையங்களின் விவேகமான துவக்கம் மிக முக்கியமான காரணியாகும்.

படிநிலை மற்றும் பகிர்வு கிளஸ்டரிங் இடையே உள்ள வேறுபாடு என்ன?

படிநிலை மற்றும் பகிர்வு கிளஸ்டரிங் இயங்கும் நேரம், அனுமானங்கள், உள்ளீட்டு அளவுருக்கள் மற்றும் விளைவாக கிளஸ்டர்களில் முக்கிய வேறுபாடுகள் உள்ளன. பொதுவாக, பகிர்வு கிளஸ்டரிங் படிநிலை கிளஸ்டரிங்கை விட வேகமாக இருக்கும். படிநிலை கிளஸ்டரிங்கிற்கு ஒரு ஒற்றுமை நடவடிக்கை மட்டுமே தேவைப்படுகிறது, அதே சமயம் பகிர்வு கிளஸ்டரிங்கிற்கு கொத்துக்களின் எண்ணிக்கை மற்றும் ஆரம்ப மையங்கள் போன்ற வலுவான அனுமானங்கள் தேவைப்படுகின்றன. படிநிலை கிளஸ்டரிங்கிற்கு எந்த உள்ளீட்டு அளவுருக்கள் தேவையில்லை, பகிர்வு கிளஸ்டரிங் வழிமுறைகளுக்கு இயங்கத் தொடங்க கொத்துக்களின் எண்ணிக்கை தேவைப்படுகிறது. படிநிலை கிளஸ்டரிங் கொத்துக்களின் மிகவும் அர்த்தமுள்ள மற்றும் அகநிலை பிரிவை அளிக்கிறது, ஆனால் பகிர்வு கிளஸ்டரிங் முடிவுகள் சரியாக k கிளஸ்டர்களில் விளைகின்றன. ஒரு ஒற்றுமை அளவை அதற்கேற்ப வரையறுக்கக்கூடிய வரையில் படிநிலை கிளஸ்டரிங் வழிமுறைகள் வகைப்படுத்தப்பட்ட தரவுகளுக்கு மிகவும் பொருத்தமானவை.