Analýza klastrů: její metoda a rozsah

14. 5. 2019

Mnozí z nás slyšeli frázi "klastrová analýza", ale to, co to znamená, není všechno. Navíc to zní víc než tajemství! Ve skutečnosti je to jen název metody rozdělení vzorku dat do kategorií prvků podle určitých kritérií. Například klastrová analýza umožňuje lidem rozdělit se na skupiny s vysokou, střední a nízkou sebeúctou. Jednoduše řečeno, cluster je typ objektů, které jsou podobné určitému atributu.

Klastrová analýza: problémy při používání

analýza klastrů Když jste se rozhodli použít tuto metodu ve svém výzkumu, musíte si uvědomit, že vybrané klastry mohou být nestabilní. Proto, stejně jako v případě faktorové analýzy, je třeba zkontrolovat výsledky na jiné skupině objektů nebo po určitém časovém období vypočítat chybu měření. Kromě toho je nejlepší použít klastrovou analýzu na velkých vzorcích, vybraných náhodně nebo stratifikací, protože pouze tímto způsobem lze pomocí indukce provést vědecký závěr. Nejlépe se ukázal, že testuje hypotézy a ne vytváří je od nuly.

Hierarchická klastrová analýza

hierarchická klastrová analýza Potřebujete-li rychle klasifikovat náhodné prvky, pak je možné začít každým z nich v počáteční fázi jako samostatný cluster. To je podstatou jednoho z nejsnadněji pochopitelných typů klastrové analýzy. Využívá ho a výzkumník ve druhém stupni vytváří dvojice prvků, které jsou podobné svým vlastnostem, a poté je navzájem spojuje potřebným počtem opakování. Klastry, které se mezi sebou nacházejí v minimální vzdálenosti, jsou určeny pomocí integračního postupu. Opakuje se, dokud nesplní jedno z následujících kritérií:

  • získání předem plánovaného počtu klastrů;
  • každý cluster obsahuje požadovaný počet prvků;
  • každá skupina má v sobě potřebný poměr heterogenity a homogenity.

Za účelem správného výpočtu vzdálenosti mezi klastry často používají následující techniky:

  • jednotná a kompletní komunikace;
  • střední propojení King;
  • centroidní metoda;
  • průměr přijímací skupiny.

K vyhodnocení výsledků seskupení se používají tato kritéria:

  • index definice;
  • faktor rozdělení;
  • normální, normalizovaná a modifikovaná entropie;
  • druhý a třetí Rubens funkční.

Metody klastrové analýzy

metody klastrové analýzy Nejčastěji při analýze vzorků objektů se používá metoda minimální vzdálenosti. Spočívá v tom, že cluster kombinuje prvky s koeficientem podobnosti, který je větší než prahová hodnota. Při použití metody místní vzdálenosti se rozlišují dva klastry: vzdálenost mezi body prvního je maximální a druhá je minimální. Metoda sdružování centroidů zahrnuje výpočet vzdáleností mezi průměrnými hodnotami ukazatelů ve skupinách. Metoda Ward je nejvíce racionální pro použití pro shlukování clusterů v sledovaném parametru.