analisi di clustering è una tecnica statistica usata per organizzare i casi in categorie in modo che i casi in ciascuna categoria sono simili tra loro e diverse da casi in altre categorie . Ogni categoria è un cluster . I sociologi usano SPSS ( Statistical Package per le Scienze Sociali ) per condurre analisi di cluster . In K -means il ricercatore indica il numero di cluster desiderato . K è il numero di cluster ricercatori indicano che vogliono. K -means permette ai ricercatori di cluster di grandi insiemi di dati .
Istruzioni Analizzare dati
1
Clicca su " Analizza" nella parte superiore dello schermo esimo SPSS . Selezionare " Classificare " dal menu a discesa e " Cluster K-medie ".
2
Selezionare un campione di casi . Nella finestra di dialogo , fare clic su "variabili" ed evidenziare le variabili che si desidera utilizzare per l'analisi iniziale K- Means . Fare clic sulla freccia a sinistra per spostare le variabili nella casella. Impostare il numero di cluster , di solito 5 in un set di dati di media dimensione , nella casella " numero di cluster . " Il numero di cluster deve essere più di due e non più del numero di casi . Clicca su " Itera e classifica " nella finestra di dialogo per ottenere centri dei cluster . Clicca su " Scrivi finale".
3
includere il file di dati intero per l'analisi finale K- Means . Fare clic su " Analizza " nella parte superiore della schermata di SPSS . Selezionare " Classificare " dal menu a discesa e " Cluster K-medie . " Nella finestra di dialogo selezionare " Variabili " e mettere in evidenza le variabili che si desidera utilizzare . Fare clic sulla freccia a sinistra . Impostare il numero di cluster a 5 nella casella " numero di cluster . " Clicca su " adesso " nella finestra di dialogo . Scegliere "Leggi Iniziale" per ottenere i centri dei cluster dal campione al punto 2. Fare clic su "Salva ". Fare clic su " l'appartenenza del cluster . " Clicca su "Continua ".
Leggere l'output
4
Recensione la prima tabella in uscita , con l'etichetta " centri finali . " La parte superiore del tavolo ha i numeri da 1 a 5 su di esso , indicando ciascuno dei 5 grappoli. La colonna di sinistra elenca il "punteggio fattore REGR " ( Regressione punteggio fattoriale o quanto bene ogni variabile predice il punteggio ) per ciascuna delle analisi . Se si segue la linea accanto a punteggio 1 per il diritto di analisi 1 , che vi darà il punteggio fattore per ogni cluster.
5
leggere la tabella seguente nella produzione intitolata " Numero di casi in ogni cluster ". La casella a sinistra elenca i cluster per numero, da 1 a 5 . Seguire il numero di cluster a destra e troverete il numero di casi in quel cluster .
6
Guardate l'ultimo tavolo in uscita , " l'appartenenza del cluster ", il che dimostra che i casi sono in ogni cluster. I casi sono elencati nella colonna di sinistra e il numero di cluster si trova nella colonna a destra .