python - 从 SPSS 中的所有变量名称中去除前缀

我有一个与这里提出的类似的问题( Strip suffix from all variable names in SPSS )，那里的答案已经有很大帮助，但仍然有一个问题。

我有一个数据集，其中每个变量名称都有前缀“v23_1_”。我想从所有变量中删除这个前缀，但变量有数百个，所以我正在寻找一种方法来做到这一点，而无需数百次使用 RENAME 语句。

我使用了这段代码:

begin program.
vdict=spssaux.VariableDict()
mylist=vdict.range(start="v23_1_dg_mnpdocid", end="v23_1_phq9t0_asku3t0")
nvars = len(mylist)

for i in range(nvars):
    myvar = mylist[i]
    mynewvar = myvar.strip("v23_1_")
    spss.Submit(r"""
        rename variables ( %s = %s) .
                        """ %(myvar, mynewvar))
end program.

这是前几个变量的列表:

v23_1_dg_mnppusid
v23_1_dg_sigstatus
v23_1_dg_mnpvsno
v23_1_dg_mnpvslbl
v23_1_dg_mnpcvpid
v23_1_dg_mnpvisid
v23_1_dg_mnpvisno
v23_1_dg_mnpvispdt
v23_1_dg_mnpvisfdt
v23_1_dg_mnpfs0
v23_1_dg_mnpfs1
v23_1_dg_mnpfs2
v23_1_dg_mnpfs3
v23_1_dg_mnpfcs0
v23_1_dg_mnpfcs1
v23_1_dg_mnpfcs2

它对第一个变量工作正常，但随后停止并显示消息“重命名已创建两个名为 dg_mnpfs 的变量”。但剥离后下一个变量的名称为“dg_mnpfs2”。发生的情况是“v23_1_dg_mnpfs1”末尾的 1 也被删除。然后它可能还打算删除“v23_1_dg_mnpfs2”末尾的 2，这将导致相同的变量。我不明白为什么会发生这种情况以及如何避免它。

非常感谢您的支持! 亲切的问候，击败

最佳答案

正如您现在的语法所示，它将在逐个变量的基础上运行。您提交/运行 RENAME VARIABLES 命令的次数与列表中变量的数量相同。一方面，这是低效的，因为它的运行时间比我下面建议的要长。另一方面(也是更重要的)，逐个变量地执行它并不能防止重复的变量。我猜测您的数据文件中已经有一个名为 dg_mnpfs 的变量，并且您正在尝试通过重命名 v23_1_dg_mnpfs 来创建一个新变量。在你的 python 代码中断后，只需检查你的数据文件即可。

编写代码的一种更有效的方法是创建包含旧名称和新名称的列表，并仅使用一个命令提交语法。

begin program.
import spss,spssaux
vdict=spssaux.VariableDict()
mylist=vdict.range(start="v23_1_dg_mnpdocid", end="v23_1_phq9t0_asku3t0")
nvars = len(mylist)

my_new_list=[]
for i in range(nvars):
    myvar = mylist[i]
    mynewvar = myvar.strip("v23_1_")
    my_new_list.append(mynewvar)

my_syntax="ren var (" + " ".join(mylist) + "=" + " ".join(my_new_list) +")."
spss.Submit(my_syntax)
end program.

还有一件事:strip 函数会删除变量两端的文本。如果您只想删除前缀，请考虑使用lstrip。详情可参见here, in the official documentation.

关于python - 从 SPSS 中的所有变量名称中去除前缀，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49323696/

python - 从 SPSS 中的所有变量名称中去除前缀

上一篇：python - 拟合 Keras L1 模型

下一篇：python - Savitzky-Golay 过滤器的 Scipy 实现