我有一个大文件,导入到 Pandas 的单个数据框中。 我正在使用 pandas 按数据框中的行数将文件分成许多段。
例如:10 行: 文件 1 得到 [0:4] 文件 2 得到 [5:9]
有没有一种方法可以做到这一点而无需创建更多数据框?
最佳答案
在此处分配
一个新列 g,您只需要指定每个 groupby 中需要多少个项目,这里我使用 3。
df.assign(g=df.index//3)
Out[324]:
0 g
0 1 0
1 2 0
2 3 0
3 4 1
4 5 1
5 6 1
6 7 2
7 8 2
8 9 2
9 10 3
然后你可以调用df[df.g==1]
来得到你需要的东西
关于python-3.x - Pandas :将数据框拆分为多个 csvs,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47421880/