我有一个数据集,我使用命令 outsheet
将其导出到 csv 文件中。有些行在某个地方断线。使用十六进制编辑器,我可以识别记录中换行符“0a”的控制字符。产生换行符的变量值在视觉上(在 Stata 中)仅显示 5 个字符。但如果我计算字符数:
gen xlen = length(x)
我得到 6。我可以编写一个 Perl 程序来解决这个问题,但我更喜欢在导出之前删除 Stata 中的控制字符(例如使用 regexr()
)。有谁知道如何删除控制字符?
最佳答案
char()
函数调用特定的 ASCII 字符。因此,您可以通过用空字符串替换这些字符来删除它们。
replace x = subinstr(x, char(10), "", .)
关于Stata:删除换行控制字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14497667/