python - 在不知道行数的情况下,根据行数将数据框分成六等份 - pandas

标签 python pandas dataframe

我有一个 df,如下所示。

df:

ID   Job   Salary
1    A     100
2    B     200
3    B     20
4    C     150
5    A     500
6    A     600
7    A     200
8    B     150
9    C     110
10   B     200
11   B     220
12   A     150
13   C     20
14   B     50

我想根据行数将 df 分成 6 个相等的部分。 预期产出 df1:

ID   Job   Salary
1    A     100
2    B     200
3    B     20

df2:

ID   Job   Salary
4    C     150
5    A     500
6    A     600

df3:

ID   Job   Salary
7    A     200
8    B     150

df4:

ID   Job   Salary
9    C     110
10   B     200

df5:

ID   Job   Salary
11   B     220
12   A     150

df6:

ID   Job   Salary
13   C     20
14   B     50

注意:由于有 14 行,前两个 dfs 可以有 3 行,其余 4 个 dfs 应该有 2 行。

我想动态地将所有dfs保存为csv

最佳答案

您可以使用 np.array_split() :

dfs = np.array_split(df, 6)

for index, df in enumerate(dfs):
    df.to_csv(f'df{index+1}.csv')
>>> print(dfs)

[   ID Job  Salary
 0   1   A     100
 1   2   B     200
 2   3   B      20,

    ID Job  Salary
 3   4   C     150
 4   5   A     500
 5   6   A     600,

    ID Job  Salary
 6   7   A     200
 7   8   B     150,

    ID Job  Salary
 8   9   C     110
 9  10   B     200,

     ID Job  Salary
 10  11   B     220
 11  12   A     150,

     ID Job  Salary
 12  13   C      20
 13  14   B      50]

关于python - 在不知道行数的情况下,根据行数将数据框分成六等份 - pandas,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67356366/

相关文章:

python - 如何加速 DatetimeIndex 处理?

python - 为什么不在 PyPI 上使用 setup.py 元数据?

python - 如何修复我的 pandas 数据框中的索引,使其不只将值保持为零,而是增加值?

python - 匹配 Python 整数文字的正则表达式

python - 如何计算pandas数据框中单元格内的行数,这些行不是空行

调用 `.info()` 时,带有列表元素的 Python Pandas Dataframe 报告错误类型?

python - 有没有一种有效的方法对标记的相似数据点进行聚类?

r - 根据 R 数据框中的变量填充 N 个滞后

python - 如何在一系列箱形图中的箱形图旁边显示数值平均值和标准值?

python - 识别 python DataFrame 中相等的行...