So lesen Sie die Ausgabe von SPSS K-Means

Die Clusteranalyse ist eine statistische Technik, die verwendet wird, um Fälle in Kategorien einzuordnen, sodass die Fälle in jeder Kategorie einander ähnlich sind und sich von Fällen in anderen Kategorien unterscheiden. Jede Kategorie ist ein Cluster. Sozialwissenschaftler nutzen SPSS (Statistical Package for the Social Sciences) zur Durchführung von Clusteranalysen. Beim K-Means-Clustering bestimmt der Forscher die Anzahl der gewünschten Cluster. K ist die Anzahl der Cluster, die Forscher angeben. K-Means-Clustering ermöglicht es Forschern, sehr große Datensätze zu clustern.

Daten analysieren

Schritt 1

Klicken Sie oben im SPSS-Bildschirm auf "Analyze". Wählen Sie "Klassifizieren" aus dem Dropdown-Menü und "K-Means-Cluster".

Schritt 2

Wählen Sie ein Fallbeispiel aus. Klicken Sie im Dialogfeld auf "Variablen" und markieren Sie die Variablen, die Sie in der anfänglichen K-Means-Analyse verwenden möchten. Klicken Sie auf den linken Pfeil, um die Variablen in das Feld zu verschieben. Legen Sie die Anzahl der Cluster, normalerweise 5 in einem Datensatz mit durchschnittlicher Größe, im Feld "Anzahl der Cluster" fest. Die Anzahl der Cluster muss mehr als zwei und nicht mehr als die Anzahl der Fälle betragen. Klicken Sie im Dialogfeld auf "Iterieren und klassifizieren", um Clusterzentren zu erhalten. Klicken Sie auf "Final schreiben".

Fügen Sie die gesamte Datendatei für die endgültige K-Means-Analyse hinzu. Klicken Sie oben im SPSS-Bildschirm auf "Analysieren". Wählen Sie "Klassifizieren" aus dem Dropdown-Menü und "K-Means-Cluster". Wählen Sie im Dialogfeld "Variablen" und markieren Sie die Variablen, die Sie verwenden möchten. Klicken Sie auf den linken Pfeil. Legen Sie im Feld "Anzahl der Cluster" die Anzahl der Cluster auf 5 fest. Klicken Sie im Dialogfeld auf "Klassifizieren". Wählen Sie "Read Initial", um die Clusterzentren aus dem Beispiel in Schritt 2 abzurufen. Klicken Sie auf "Save". Klicken Sie auf „Cluster-Mitgliedschaft“. Klicken Sie auf "Weiter".

Lesen Sie die Ausgabe

Schritt 1

Sehen Sie sich die erste Tabelle in der Ausgabe mit der Bezeichnung "Final Cluster Centers" an. Oben in der Tabelle befinden sich die Zahlen 1 bis 5, die jeden der 5 Cluster anzeigen. Die linke Spalte listet den "REGR-Faktor-Score" (Regressionsfaktor-Score oder wie gut jede Variable den Score vorhersagt) für jede der Analysen auf. Wenn Sie der Linie neben Punktzahl 1 für Analyse 1 nach rechts folgen, erhalten Sie die Faktorpunktzahl für jeden Cluster.

Schritt 2

Lesen Sie die nächste Tabelle in der Ausgabe mit der Überschrift "Anzahl der Fälle in jedem Cluster". Das Feld links listet die Cluster nach Nummern von 1 bis 5 auf. Folgen Sie der Clusternummer rechts und Sie finden die Anzahl der Fälle in diesem Cluster.

Sehen Sie sich die letzte Tabelle in der Ausgabe "Cluster-Mitgliedschaft" an, die zeigt, welche Fälle sich in jedem Cluster befinden. Die Fälle werden in der linken Spalte aufgelistet und die Clusternummer befindet sich in der Spalte ganz rechts.