python - 是否可以一次创建多个数据框?

标签 python pandas

df = pd.DataFrame( {
   'A': ['d','d','d','f','f','f','g','g','g','h','h','h'],
   'B': [5,5,6,7,5,6,6,7,7,6,7,7],
   'C': [1,1,1,1,1,1,1,1,1,1,1,1],
   'S': [2012,2013,2014,2015,2016,2012,2013,2014,2015,2016,2012,2013]     
    } );

df = (df.B + df.C).groupby([df.A,df.S]).agg(['sum','size']).
      unstack(fill_value=0)
df10 = (df.B * df.C).groupby([df.A,df.S]).agg(['sum','size']).
      unstack(fill_value=0)
df20 = (df.B - df.C).groupby([df.A,df.S]).agg(['sum','size']).
      unstack(fill_value=0)

我可以为 df、df10、df20 一次运行以下代码吗?顺便说一句,在真实数据中,我将使用与下面相同的代码运行 80 个数据帧;

df1 = df.groupby(level=0, axis=1).sum()
new_cols= list(zip(df1.columns.get_level_values(0),['total'] *     len(df.columns)))
df1.columns = pd.MultiIndex.from_tuples(new_cols)
df2 = pd.concat([df1,df], axis=1).sort_index(axis=1).sort_index(axis=1,  level=1)
df2.columns = ['_'.join((col[0], str(col[1]))) for col in df2.columns]

最佳答案

b_c_idx_locs = [df.columns.get_loc('B'), df.columns.get_loc('C')]

a = df.values[:, b_c_idx_locs]

df['B+C'] = a.sum(1)
df['B*C'] = a.prod(1)
df['B-C'] = -np.diff(a)
cols = ['B+C', 'B*C', 'B-C']

df.groupby(['A', 'S'])[cols].agg(['sum', 'size'])

enter image description here

关于python - 是否可以一次创建多个数据框?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40772634/

相关文章:

python - 合并 2 个列表时 pd.DataFrame() 失败

python - Pandas Pivot_Table 定义函数 aggfunc

python - 如何处理 Pandas 中的 2 列并使用新列名称创建新数据框

Python 格式化工具

python - 我怎样才能不要求安装 tqdm?

python - 用字符替换单词中的数字

python - Python中的对象和类有什么区别

python - Pandas 将 bool 值转换为实际值时出错

Python - 比较两个数据帧之间的范围

带有 PKCS#12 证书的 Python SSL