具有大/无序文本文件的 Python-pandas

标签 python pandas

我有一个很大的天体物理数据文本文件(无论如何对于我的经验水平来说),我正在尝试处理 python/pandas。作为一个Python菜鸟,它进展缓慢。 Here是文本文件的示例,文件总大小为 145Mb。当我尝试在 pandas 中阅读此内容时,我感到很困惑,因为我不知道该使用 pd.read_table(example.txt)pd.read_csv(example.csv) )。无论哪种情况,我都无法在 ipython 不崩溃的情况下调用特定列,例如 here 。我知道我正在心不在焉地做一些事情。谁能解释那可能是什么?我已经用较小的文件完成了相同的过程,并且效果很好,但是这个似乎限制了它的输出,或者根本不起作用。

谢谢。

最佳答案

您的列似乎由不同数量的空格分隔,因此您需要将其指定为分隔符。尝试 read_csv(example.csv, sep=r'\s+')\s+ 是“任意数量的空白”的正则表达式。另外,您应该从第一行的开头删除该 # 字符,因为它将被视为额外的列并会扰乱读取。

关于具有大/无序文本文件的 Python-pandas,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16578573/

相关文章:

python - Kmeans 与 dataframe 中的 groupby 并在 python 中获取集群

python - 仅使用人工定时击键和鼠标点击时能否检测到机器人?

python - 获取一个基类的所有子类作为基类的class属性

python - .loc 在多级索引数据帧上的意外行为

r - 将 R 对象导入 Python 的最佳方法?

python - 在 pandas 数据框中逐行计算 CAGR?

Python 编织列表

python - 新的 Django 应用程序中没有 admin.py 文件

python - 通过 python 运行简单查询 : No results

python - 确保 groupby 输出类型