python - 查找数据框所有列的唯一值

标签 python pandas dataframe

如何获取数据框中所有列的唯一值?
到目前为止,我正在尝试做类似下面的事情。

for col in train_features_df.columns:
    print(train_features_df.col.unique())
但这给了我错误 AttributeError: 'DataFrame' object has no attribute 'col'例如对于下面的数据框,我想要下面的输出
 df = pd.DataFrame({'A':[1,1,3],
               'B':[4,5,6],
               'C':[7,7,7]})
我想要 A 的输出为 1,3 , B 的输出为 4,5,6 , C 的输出为 7 。

最佳答案

您可以申请 unique在每个系列上通过转置,

>>> df
   A  B  C
0  1  4  7
1  1  5  7
2  3  6  7
>>> df.T.apply(lambda x: x.unique(), axis=1)
A       [1, 3]
B    [4, 5, 6]
C          [7]
dtype: object
>>> 

关于python - 查找数据框所有列的唯一值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63101261/

相关文章:

python - 如何创建动态图以在 Flask 上显示?

python - 在 python/pandas 中为重复的 np.where 语句创建一个动态函数

Python:如何根据值的顺序在 pandas df 中生成两个新列?

python - pandas 插值函数的参数 'index' 和 'values' 有什么区别?

R:使用转换表更新 data.frame 中的行名

python - 使用 django 应用程序从 MySQL 中的现有表中检索数据

python - 旋转 Pandas 数据框

python - 没有自动增量的sqlalchemy主键

python - 在不更改原始列名的情况下合并 pandas DataFrame

python - 从特定索引开始的数据框 cummin 列