有没有一种聪明/简单的方法来告诉 pandas 中的 read_csv 不要在某个“节结束”标志之后加载数据?或者如果它到达空行就停止?
data = pd.read_csv(path, **params)
eos_line = (data['id'] == eos_string).idxmax()
data = data.drop(range(eos_line-2, data.shape[0]))
我觉得他们应该是一个更好的方式。不幸的是,我不知道在调用 read_csv 之前要跳过的行数或页脚长度。数据大致类似于
1,2,3
4,5,6
dont want any data after this line
7,8,9
10,11,12
(注意:-2是b/c,在节字符串末尾之前实际上有2个空行,但如果read_csv只读取到这一点,我猜dropna()会非常轻松地删除这两行)
最佳答案
韦斯确实想到了一切!
In [40]: data = """A,B,C
....: 1,2,3
....: 4,5,6
....: 7,8,9
....: want to skip this
....: also also skip this
....: """
In [41]: read_csv(StringIO(data), skip_footer=2)
Out[41]:
A B C
0 1 2 3
1 4 5 6
2 7 8 9
关于python - pandas read_csv 节标志结束,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16629524/