python - read_table pandas python 数字错误

标签 python pandas

我正在对 .txt 文件执行基本的 pd.read_table 操作。第一列是尖点列表。 cusip "65248E10" 被读取为数字 65248E10 = 652480000000000(E10 作为科学记数法)。

我一直在研究 Pandas ,但我不知道如何要求它保持作为一个角色。 http://pandas.pydata.org/pandas-docs/dev/generated/pandas.io.parsers.read_table.html#pandas.io.parsers.read_table

此外,即使我设置 header = 0,它似乎也将第一行作为标题,然后第 0 行作为第二行,依此类推。如果我的文本文件没有列名,如何将其默认为 NULL(或 1、2、3 等)

感谢您的帮助。我是 pandas/python 的新手

最佳答案

如果我们有一个如下所示的数据文件

65248E10 11
55555E55 22

然后我们可以用类似的方式读取它

>>> pd.read_table("cusip.txt", header=None, delimiter=" ", converters={0: str})
          0   1
0  65248E10  11
1  55555E55  22

我们使用 header=None 告诉它没有任何 header ,我们使用 delimiter="" 告诉它有一个空格分隔符(调整为匹配您的数据格式),并 converters={0: str} 告诉它在将第一列读取为字符串后,我们希望将其转换为字符串(即在本例中不执行任何操作)到它)而不是进一步处理它。除了 converters={0: str}dtype=(str, int) 也可以工作,但这样我们仍然可以让 pandas > 弄清楚其他列是什么。

使用header=0的问题是这里的0并不意味着“无标题”,它意味着使用行号#0(第一行)作为标题。

关于python - read_table pandas python 数字错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14060111/

相关文章:

python - Pandas :通过键获得第一次出现的分组

python - 在 64 位 Python 上使用 sys.platform= ='win32' 检查是否安全?

python - 如何将数据框列对转换为单独的字典映射?

pandas - Python Pandas : if the data is NaN, 然后更改为 0,否则在数据框中更改为 1

python - 与原生 sklearn 相比,Dask 性能较慢

python - 调整DataFrame中的异常格式,函数继续返回None

Python pandas dataframe 插入缺失数据

python - 在python中使用enumerate()访问列表中的 "Actions"对象

python - 如何通过取 3 个网格点编写炉子质量平衡方程的 Python 代码?我需要绘制密度剖面图

python - 单个 msi、exe 或 Egg 中的多个 python 包