python - 我可以导入具有不同空格分隔符的文本文件吗?

标签 python pandas

我想导入这个 .txt 文件,但由于“No”和“Record”之间有空格,pandas 将它们作为单独的列导入。我怎样才能有不同的 sep ?正则表达式?

data = pd.read_table('file.txt', sep=' ', header=None)

数据

01/01/1933  NO RECORD   NO RECORD   MISSING     MISSING
01/02/1933  NO RECORD   NO RECORD   MISSING     MISSING
01/03/1933  NO RECORD   NO RECORD   MISSING     MISSING
01/04/1933  NO RECORD   NO RECORD   MISSING     MISSING
01/05/1933  NO RECORD   NO RECORD   MISSING     MISSING
01/06/1933  NO RECORD   NO RECORD   MISSING     MISSING
01/07/1933  NO RECORD   NO RECORD   368.00  MISSING
01/08/1933  NO RECORD   NO RECORD   MISSING     MISSING
01/09/1933  NO RECORD   NO RECORD   MISSING     MISSING
01/10/1933  NO RECORD   NO RECORD   MISSING     MISSING
01/11/1933  NO RECORD   NO RECORD   MISSING     MISSING

当前导入

**  0   1   2   3   4   5
0   01/01/1933\tNO  RECORD  \tNO    RECORD  \tMISSING   \tMISSING
1   01/02/1933\tNO  RECORD  \tNO    RECORD  \tMISSING   \tMISSING
2   01/03/1933\tNO  RECORD  \tNO    RECORD  \tMISSING   \tMISSING
3   01/04/1933\tNO  RECORD  \tNO    RECORD  \tMISSING   \tMISSING
4   01/05/1933\tNO  RECORD  \tNO    RECORD  \tMISSING   \tMISSING**

最佳答案

这看起来像一个制表符分隔的文件。您可以使用 sep='\t' 它应该可以正常工作。

事实上,pd.read_table 的默认值已经是 sep='\t

关于python - 我可以导入具有不同空格分隔符的文本文件吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48633861/

相关文章:

python - 如何在不使用 matplotlib 的情况下使用不同类型的图(条形图和线条图)绘制不同的列(仅使用 pandas)

python - 如何在中心绘制子图并使颜色条与其中一个子图的长度相同?

python - 压平 json 以获取 Pandas 中的多列

python - 使用其他列中的一些值创建列 - 有条件

python - 将数据框中其他列的值附加到列的最佳方法是什么

pandas - qtconsole 不将 Pandas 数据帧渲染为 html notebook_repr_html 选项

Python。 from dateutil.relativedelta import * 在 shell 中有效,但在脚本中无效

python - 简化一行 if 语句

Python - 如何按频率检查数字组合

python - pandas - 选择一对连续的行匹配条件