我有以下数据框:
import pandas as pd
df=pd.DataFrame([[1,11,'a'],[1,12,'a'],[1,11,'a'],[1,12,'a'],[1,7,'a'],
[1,12,'a']])
df.columns=['id','code','name']
df
id code name
0 1 11 a
1 1 12 a
2 1 11 a
3 1 12 a
4 1 7 a
5 1 12 a
如上面的数据帧所示,“id”列的值与“name”列的值直接相关。如果我说一百万条记录,我怎么知道某一列完全依赖于数据框中的其他列?
最佳答案
如果它们完全依赖,那么它们的分解将是相同的
(df.id.factorize()[0] == df.name.factorize()[0]).all()
True
关于pandas - 如何检查 pandas 数据框中一列对另一列的依赖关系,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45724852/