pandas - 如何检查 pandas 数据框中一列对另一列的依赖关系

标签 pandas dataframe

我有以下数据框:

 import pandas as pd

 df=pd.DataFrame([[1,11,'a'],[1,12,'a'],[1,11,'a'],[1,12,'a'],[1,7,'a'],
                [1,12,'a']])
 df.columns=['id','code','name']

 df

    id  code name
0   1    11    a
1   1    12    a
2   1    11    a
3   1    12    a
4   1     7    a
5   1    12    a

如上面的数据帧所示,“id”列的值与“name”列的值直接相关。如果我说一百万条记录,我怎么知道某一列完全依赖于数据框中的其他列?

最佳答案

如果它们完全依赖,那么它们的分解将是相同的

(df.id.factorize()[0] == df.name.factorize()[0]).all()

True

关于pandas - 如何检查 pandas 数据框中一列对另一列的依赖关系,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45724852/

相关文章:

python - Pandas:将多列子集映射到单列子集的有效方法

python - 如何加入 pandas dataframe 以便 seaborn boxplot 或 violinplot 可以使用列作为色调?

python - 使用 Pandas 重命名数据框列中的元素

python - 使用Pandas将CSV读取到具有不同行长的dataFrame中

python - 添加列数据框 python plus 乘以数组中的数字

python - 首先对较高层的数据帧进行排名,然后对较低层的数据帧进行排名

python pandas 读取 HTML 表格

python - 如何在Python中使用pandas将多个数据集的数据组织到同一个数据框中?

Python3.7 Pandas1.0.1 Dataframe - 计算范围内的列总和并重新组合为一个新行?

python - 在根据最大列值理解行的同时查找具有最高值的行的列名