spss - 创建一个新数据集,其中原始数据集中变量的每个值都有一种情况

标签 spss

我有一个数据集,其中每个案例都是学生,并且有一个性别 (SEX) 变量和一个专业 (MAJOR) 变量。性别变量有 2 个可能的值(男性和女性),而专业变量有数十个可能的值(生物学、数学等)。

我想使用该数据集创建另一个数据集,其中每个专业都有一个案例,并有 3 个变量:MAJOR、MALE 和 FEMALE。每个专业的变量 MALE 的值应该是该专业就读的男性人数,变量 FEMALE 的值应该是该专业就读的女性人数。 MAJOR的值应该只是该案例对应的原始数据集中变量MAJOR的值的标签。

很明显,当我查看要创建的数据集时,每个专业应该有一行,其中一列 MAJOR 包含每个专业的标签,一列 MALE 包含注册的男性人数每个专业都有一个 FEMALE 列,其中包含每个专业就读的女性人数。

我的数据集是用 SPSS 创建的,我从未使用过该程序,所以我不知道如何做到这一点,尽管它可能非常简单。我将非常感谢您的帮助!

最好, 菲利普

最佳答案

打开文件后,打开一个新的语法窗口,将以下代码放入其中并运行它:

dataset name OrigFile.
compute male=(SEX="MALE").
compute female=(SEX="FEMALE").
dataset declare NewFile.
aggregate /outfile='NewFile' /break=major /male female=sum(male female).

运行此命令后,您将拥有两个打开的数据集 - 原始数据集和您想要创建的新数据集。

关于spss - 创建一个新数据集,其中原始数据集中变量的每个值都有一种情况,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44533433/

相关文章:

spss - 并排列出两个或多个变量

SPSS - 在因子分析后使用 K 均值聚类

r - 成对相关表

python - 使用Python创建SPSS自定义对话框

R Box 的同方差性 M 检验

用 R 再现 SPSS 因子分析

spss - 使用 SPSS 以编程方式在案例之间复制数据

string - SPSS 宏 - DEFINE 中的字符串操作 - !ENDDEFINE

spss - 如何从 SPSS 中的另一个语法文件获取语法文件?

duplicates - SPSS:如何从包含重复 ID 的客户端 ID 变量生成 ID 号