我有一个很大的天体物理数据文本文件(无论如何对于我的经验水平来说),我正在尝试处理 python/pandas。作为一个Python菜鸟,它进展缓慢。 Here是文本文件的示例,文件总大小为 145Mb。当我尝试在 pandas 中阅读此内容时,我感到很困惑,因为我不知道该使用 pd.read_table(example.txt)
或 pd.read_csv(example.csv) )
。无论哪种情况,我都无法在 ipython 不崩溃的情况下调用特定列,例如 here 。我知道我正在心不在焉地做一些事情。谁能解释那可能是什么?我已经用较小的文件完成了相同的过程,并且效果很好,但是这个似乎限制了它的输出,或者根本不起作用。
谢谢。
最佳答案
您的列似乎由不同数量的空格分隔,因此您需要将其指定为分隔符。尝试 read_csv(example.csv, sep=r'\s+')
。 \s+
是“任意数量的空白”的正则表达式。另外,您应该从第一行的开头删除该 #
字符,因为它将被视为额外的列并会扰乱读取。
关于具有大/无序文本文件的 Python-pandas,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16578573/