我目前正在尝试清理相当大的数据集,但是,我注意到大量参与者未能完成调查,或者甚至没有回答第一个问题。尽管如此,他们的数据已包含在我的数据集中。
问题:有没有办法根据响应完成情况过滤掉参与者?例如,我想过滤掉所有未能对至少 30% 的问题提供答复的案例。
最佳答案
是的。
首先,您需要创建一个新变量来计算数据中缺失观测值的数量:
COUNT
countmiss = v1 v2 v3 v4 v5 v6 (MISSING).
然后,您需要过滤掉错过指定数量回复的参与者(在这里,我将过滤掉错过两次回复的参与者):
USE ALL.
COMPUTE filter_$=(countmiss >= 2).
VARIABLE LABEL filter_$ countmiss >= 2 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
请注意,第二步可以通过“数据”->“选择案例”菜单来实现。
关于根据响应完成情况过滤案例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35672974/