Python dfply 包 - 加入

标签 python dfply

来自 R 并尝试在 Python 中使用 dfply 包模拟 dplyr。需要一些帮助。

我这里有两个问题,请帮忙。

  1. 如果连接列的名称不同,我如何连接两个数据集?
  2. 有没有办法让我加入多个专栏?根据文档,我只能通过一列加入。

https://github.com/kieferk/dfply#joining

我喜欢 dfply 包,但它缺少关键功能。感谢您的帮助。或者帮助我使用 Python 中的任何其他包,如 R dplyr

最佳答案

dfply 包基于 python 中的 great pandas 包构建。它的文档主要用于指导您了解其基本功能。如果你去它的 github repo 并找到 join.py 文件,你可以看到各种连接的底层实现依赖于 pandas 的 df.merge 函数。

所以回答你的问题(希望现在还不算太晚):

  1. 如果连接列的名称不同,我如何连接两个数据集?

    df>> inner_join(other, by=('A_c1','B_c1'))
    
  2. 有没有办法让我加入多个专栏?根据文档,我只能按一列加入。

    df>> inner_join(other, by=[('A_c1','B_c1'),('A_c2','B_c2')])
    

我需要补充的一件事是,在撰写本文时,即 2018 年 10 月,您必须安装该软件包的开发版本,其中添加了多列连接功能。

关于Python dfply 包 - 加入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49903567/

相关文章:

python - 如何将数据传递到scrapinghub?

python - 如何在树莓派上安装支持 JPEG 的 PIL?

python - 基于距离的分类

python 在从 .rtf 文件读取时添加乱码?

python - dfply - Python - X 名称未定义

python - 将 R 代码转换为 Python 代码

python - setup.py egg_info"尝试安装 beautifulsoup 时失败,错误代码为 1