python - 复制 Pandas DF N 次

所以现在，如果我对一个列表进行复数，即 x = [1,2,3]* 2 我得到 x 为 [1,2,3,1,2,3] 但是这个不适用于 Pandas。

因此，如果我想复制 PANDAS DF，我必须将列设为列表和多个:

col_x_duplicates =  list(df['col_x'])*N

new_df = DataFrame(col_x_duplicates, columns=['col_x'])

然后对原始数据进行连接:

pd.merge(new_df, df, on='col_x', how='left')

这现在复制了 pandas DF N 次，有没有更简单的方法？或者更快的方法？

最佳答案

实际上，由于您想复制整个数据框(而不是每个元素)，numpy.tile() 可能更好:

In [69]: import pandas as pd

In [70]: arr = pd.np.array([[1, 2, 3], [4, 5, 6]])

In [71]: arr
Out[71]: 
array([[1, 2, 3],
       [4, 5, 6]])

In [72]: df = pd.DataFrame(pd.np.tile(arr, (5, 1)))

In [73]: df
Out[73]: 
   0  1  2
0  1  2  3
1  4  5  6
2  1  2  3
3  4  5  6
4  1  2  3
5  4  5  6
6  1  2  3
7  4  5  6
8  1  2  3
9  4  5  6

[10 rows x 3 columns]

In [75]: df = pd.DataFrame(pd.np.tile(arr, (1, 3)))

In [76]: df
Out[76]: 
   0  1  2  3  4  5  6  7  8
0  1  2  3  1  2  3  1  2  3
1  4  5  6  4  5  6  4  5  6

[2 rows x 9 columns]

关于python - 复制 Pandas DF N 次，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/21385204/

上一篇：python - 为什么 sorted() 和 reversed() 是内置函数而不是序列方法？

下一篇：python - 如何将 jenkins 作业配置 config.xml 转换为 python 中的 YAML 格式以使用 jenkins-job-builder？

相关文章：

python - 从 python 中的字母数字列中删除字符串

python - 类型错误 : No to_python (by-value) converter found for C++ type

python - 给定元组坐标列表，找到最接近指定坐标的坐标

python，计算数据框中列表的唯一列表值

java - 从搜索数组的方法返回 boolean 值

python - 搜索大型排序文本文件的最快、最有效的方法

python - 如何将参数传递给 AutoMLConfig 中的 get_data 脚本

python - 在 Django 中测试特定模型

python - Pandas groupby 日期时间索引，可能的错误

python - Pandas 划分多个多索引列