python - pandas read_csv 节标志结束

标签 python pandas

有没有一种聪明/简单的方法来告诉 pandas 中的 read_csv 不要在某个“节结束”标志之后加载数据?或者如果它到达空行就停止?

data = pd.read_csv(path, **params)
eos_line = (data['id'] == eos_string).idxmax()
data = data.drop(range(eos_line-2, data.shape[0]))

我觉得他们应该是一个更好的方式。不幸的是,我不知道在调用 read_csv 之前要跳过的行数或页脚长度。数据大致类似于

1,2,3
4,5,6


dont want any data after this line
7,8,9
10,11,12

(注意:-2是b/c,在节字符串末尾之前实际上有2个空行,但如果read_csv只读取到这一点,我猜dropna()会非常轻松地删除这两行)

最佳答案

韦斯确实想到了一切!

In [40]: data = """A,B,C
   ....: 1,2,3
   ....: 4,5,6
   ....: 7,8,9
   ....: want to skip this
   ....: also also skip this
   ....: """

In [41]: read_csv(StringIO(data), skip_footer=2)
Out[41]: 
   A  B  C
0  1  2  3
1  4  5  6
2  7  8  9

关于python - pandas read_csv 节标志结束,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16629524/

相关文章:

python - 安装旧版本的 Python 以在 Mac OS X 上进行测试

python - 使用 Bokeh 中 x 坐标的数据帧索引绘制 Pandas 数据帧

python - Pandas for 循环数据帧给出了太多的值来解压

python - 使用 np.vectorize 时出现 ValueError - 我哪里出错了?

python - 使用python在cmd中传递变量

python - 无法迭代 tf.data.Dataset

python - 将不同列的不同格式的 pandas DataFrame 写入 Excel

python - 将数据框中的逗号分隔值替换为另一个数据框中的值

python - CGI 不执行 python - 500 内部服务器错误

python beautifulsoup - 如何在下一页没有唯一地址的情况下转到下一页