spss - SPSS-在因素分析后使用K-means聚类

标签 spss factor-analysis k-means

我是一名开发人员,负责研究如何使用SPSS收集以前的结果,因此我们可以使用一些新数据重复该过程。我们不能问做原始分析的人,因为可悲的是他不再与我们在一起了,所以我不得不弄清他的所作所为。

我不是统计学家,不需要了解所涉及的原则。我真的只需要知道要导航到哪些菜单项。

我们进行了一项调查,询问了10,000人的很多问题。这些问题中有15个子集正在用于分析。

我知道已进行因子分析以将数据减少到4组。然后使用K均值聚类来找到聚类中心。这就是我现在想要的。

我已经弄清楚了如何进行因子分析以获得与我数据库中的数据相匹配的成分得分系数矩阵。这是通过转到分析>降维>因子来完成的。然后,我从“提取”部分中选择了固定数量的因子(4),从“旋转”部分中选择了“ Varimax”旋转,并在“分数”部分中选中了“显示因子得分系数矩阵”。

这给出了这样的数据:

矩阵值1值2值3值4
Q1 -0.0756 0.2134 -0.0245 -0.1236
Q2………………
Q3………………
...


我不知道该如何进行k均值聚类。

我在数据库中得到的结果如下所示:

集群中心价值1价值2价值3价值4价值5
FAC1_1 -0.8373 -0.5766 0.2100 1.3499 0.2940
FAC2_1 ... ... ... ... ...
FAC3_1 ... ... ... ... ...
FAC4_1 ... ... ... ... ...


现在,我知道可以通过使用“分析”>“分类”>“ K均值聚类”对原始数据集进行k均值聚类,但是我不知道如何引用已经完成的因子分析。

有人可以给我一些有关如何使用SPSS创建这些集群中心的见解吗?

最佳答案

在用于FACTOR分析的GUI(“分析”>“降维”>“因子”)中,有一个子对话框“分数”,请确保已选中“另存为变量”。

这会将因子得分保存在数据中,即变量FAC1_1,FAC2_1,FAC3_1,FAC4_1。

然后需要将这些变量添加为K-means GUI中的输入变量。

最好使用语法来设置您的工作,这样,如果任何其他人想要复制您的工作,他们都可以这样做(理想情况下,您的前任也应该把他的面包屑也留在语法文档中。我会尽一切努力来找到它)文档(如果存在)的可能性很小,请添加.sps文件扩展名)。

这是您在语法上进行设置的方式以及他/她的工作状况:

/* Replicate the factor analysis (four factors) and save the factor score variables */.
FACTOR
  /VARIABLES < INPUT THE 15 VARIABLES HERE >
  /MISSING LISTWISE 
  /ANALYSIS < INPUT THE 15 VARIABLES HERE >
  /PRINT EXTRACTION ROTATION FSCORE
  /FORMAT SORT BLANK(.10)
  /PLOT ROTATION
  /CRITERIA FACTORS(4) ITERATE(25)
  /EXTRACTION PC
  /CRITERIA ITERATE(25)
  /ROTATION VARIMAX
  /SAVE REG(ALL)
  /METHOD=CORRELATION.

 /* Replicate the clustering using factor scores as inputs, generating 5 segments */.
QUICK CLUSTER FAC1_1 FAC2_1 FAC3_1 FAC4_1
  /MISSING=LISTWISE
  /CRITERIA=CLUSTER(5) MXITER(10) CONVERGE(0)
  /METHOD=KMEANS(NOUPDATE)
  /SAVE CLUSTER (Seg5)
  /PRINT INITIAL.

/* Check centroids match*/.
MEANS FAC1_1 FAC2_1 FAC3_1 FAC4_1 BY Seg5 /CELLS MEAN.


如果您可以复制FACTOR得分变量以使其完全匹配,那么这是一个很好的开始,如果质心不匹配,则在给定因子得分匹配的情况下,它只能是/最有可能是因为段分配现在是不同。尽管案例排序不同于以前使用相同的输入/方法,但由于随机起始点,K-Means QUICK CLUSTER可以而且很可能会产生不同的段分配。

我对此一无所知,但原则上这些是他(她)采取的可能步骤。

关于spss - SPSS-在因素分析后使用K-means聚类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30374310/

相关文章:

Python/SPSS重命名变量名

r - 计算包含缺失值的相关系数

r - R 中有序分类数据的因子分析的因子得分

python - 使用 scikit-learn.k-means 库输出最接近每个聚类中心的 50 个样本

algorithm - k均值的时间复杂度是多少?

scikit-learn - sklearn kmeans 方法中的 precompute_distances 做什么?

macros - 在 spss 宏中执行 IF 和计算

macos - 在 SPSS 宏中循环并行列表/数组

r - 如何获得 R 中探索性因子分析的初始共性?

python - 是否有标准的拟合度量来验证探索性因素分析?