所以现在,如果我对一个列表进行复数,即 x = [1,2,3]* 2 我得到 x 为 [1,2,3,1,2,3]
但是这个不适用于 Pandas。
因此,如果我想复制 PANDAS DF,我必须将列设为列表和多个:
col_x_duplicates = list(df['col_x'])*N
new_df = DataFrame(col_x_duplicates, columns=['col_x'])
然后对原始数据进行连接:
pd.merge(new_df, df, on='col_x', how='left')
这现在复制了 pandas DF N 次,有没有更简单的方法?或者更快的方法?
最佳答案
实际上,由于您想复制整个数据框(而不是每个元素),numpy.tile() 可能更好:
In [69]: import pandas as pd
In [70]: arr = pd.np.array([[1, 2, 3], [4, 5, 6]])
In [71]: arr
Out[71]:
array([[1, 2, 3],
[4, 5, 6]])
In [72]: df = pd.DataFrame(pd.np.tile(arr, (5, 1)))
In [73]: df
Out[73]:
0 1 2
0 1 2 3
1 4 5 6
2 1 2 3
3 4 5 6
4 1 2 3
5 4 5 6
6 1 2 3
7 4 5 6
8 1 2 3
9 4 5 6
[10 rows x 3 columns]
In [75]: df = pd.DataFrame(pd.np.tile(arr, (1, 3)))
In [76]: df
Out[76]:
0 1 2 3 4 5 6 7 8
0 1 2 3 1 2 3 1 2 3
1 4 5 6 4 5 6 4 5 6
[2 rows x 9 columns]
关于python - 复制 Pandas DF N 次,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21385204/