我正在处理一个数据集 (PSID),该数据集以 SAS 格式提供数据(一个 .txt 和另一个包含解释数据说明的文件)。我在 Python 中找不到任何东西来读取这种类型的数据。
有人知道读取 SAS 数据的现有模块/脚本吗?
编辑(从评论添加到答案):数据采用 ascii/text 格式,一行数据的开头如下所示:
3 10 1015000 150013200 00 002500 00 00
最佳答案
从版本 17 开始,Pandas 现在支持读取文件扩展名为 .xpt 的 sas 文件。参见 this link到 pandas 文档了解更多详细信息。
df = pd.read_sas('sas_xport.xpt')
关于python - 将 SAS 数据文件导入 python 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30911872/