python - Pandas :将一个数据框的特定列连接到另一个数据框

标签 python pandas dataframe merge

<分区>

我在 pandas 中有 2 个以下数据框:

电影

+---+------------------------------+--------------+-----------+
|   | movie title                  | genre        | tconst    |
+---+------------------------------+--------------+-----------+
| 0 | Edison Kinetoscopic Record   | Documentary  | tt0000008 |
+---+------------------------------+--------------+-----------+
| 1 | La sortie des usines Lumière | Documentary  | tt0000010 |
+---+------------------------------+--------------+-----------+
| 2 | The Arrival of a Train       | Documentary  | tt0000012 |
+---+------------------------------+--------------+-----------+
| 3 | The Oxford and Cambridge     | NaN          | tt0000025 |
+---+------------------------------+--------------+-----------+
| 4 | Le manoir du diable          | Short|Horror | tt0000091 |
+---+------------------------------+--------------+-----------+

船员

+---+-----------+-----------+---------+------+
|   | tconst    | directors | writers | year |
+---+-----------+-----------+---------+------+
| 0 | tt0000001 | nm0005690 | \N      | 2001 |
+---+-----------+-----------+---------+------+
| 1 | tt0000002 | nm0721526 | \N      | 2002 |
+---+-----------+-----------+---------+------+
| 2 | tt0000003 | nm0721526 | \N      | 2003 |
+---+-----------+-----------+---------+------+
| 3 | tt0000004 | nm0721526 | \N      | 2004 |
+---+-----------+-----------+---------+------+
| 4 | tt0000005 | nm0005690 | \N      | 2005 |
+---+-----------+-----------+---------+------+

如何创建一个新的数据框,将 directorsyear 列仅连接到 movies 数据框(使用 tconst 列)?

最佳答案

尝试:

pd.merge(movies, crew[["tconst", "directors", "year"]], on="tconst", how="left")

on 参数告诉函数你想在键 tconst 上合并,how 参数告诉函数你想如何合并处理两个 DataFrame 之间不相交(共享)的行。

关于python - Pandas :将一个数据框的特定列连接到另一个数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52063805/

相关文章:

python - Ubuntu python-dateutil 安装/升级问题。 dateutil.zoneinfo.gettz 返回 NoneType

python - Heroku EOFError 仅适用于两行 python 代码

python - 保存到 csv 数据透视表时出现错误 "Process finished with exit code 139"

python - 替换多个值并为多个数据帧创建新列的优雅方法

python-3.x - 使用df索引范围的条件

python - Pandas:将数据框列转换为 dict,其中 col 标题作为 dict 键,col 值作为 dict 值

python - 如何使用 python-requests 修复 flask 中的 "too many values to unpack"

python - 如何将数据集的示例加载到不同的数组中以进行决策树分类?

python - 查找并删除具有由第三个唯一特征标识的两个相同特征的重复数据条目

python - 如何根据列表元素的条件拆分 Pandas Dataframe 中的列表列?