具有大/无序文本文件的 Python-pandas

标签 python pandas

我有一个很大的天体物理数据文本文件(无论如何对于我的经验水平来说)，我正在尝试处理 python/pandas。作为一个Python菜鸟，它进展缓慢。 Here是文本文件的示例，文件总大小为 145Mb。当我尝试在 pandas 中阅读此内容时，我感到很困惑，因为我不知道该使用 pd.read_table(example.txt) 或 pd.read_csv(example.csv) )。无论哪种情况，我都无法在 ipython 不崩溃的情况下调用特定列，例如 here 。我知道我正在心不在焉地做一些事情。谁能解释那可能是什么？我已经用较小的文件完成了相同的过程，并且效果很好，但是这个似乎限制了它的输出，或者根本不起作用。

谢谢。

最佳答案

您的列似乎由不同数量的空格分隔，因此您需要将其指定为分隔符。尝试 read_csv(example.csv, sep=r'\s+')。 \s+ 是“任意数量的空白”的正则表达式。另外，您应该从第一行的开头删除该 # 字符，因为它将被视为额外的列并会扰乱读取。

关于具有大/无序文本文件的 Python-pandas，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16578573/

上一篇：python - 用python锁定txt文件

下一篇：python - Panda3d Blender 创建的房间无法正确显示

python - 仅使用人工定时击键和鼠标点击时能否检测到机器人？

python - 获取一个基类的所有子类作为基类的class属性

python - .loc 在多级索引数据帧上的意外行为

r - 将 R 对象导入 Python 的最佳方法？

python - 在 pandas 数据框中逐行计算 CAGR？

Python 编织列表

python - 新的 Django 应用程序中没有 admin.py 文件

python - 通过 python 运行简单查询 : No results

python - 确保 groupby 输出类型