python - pandas 中多列的唯一值

标签 python python-3.x pandas

distinct_values = df.col_name.unique().compute()

但是如果我不知道列的名称怎么办?

最佳答案

我认为你需要:

df = pd.DataFrame({"colA":['a', 'b', 'b', 'd', 'e'], "colB":[1,2,1,2,1]})

unique_dict = {}

# df.columns will give you list of columns in dataframe
for col in df.columns:
    unique_dict[col] = list(df[col].unique())

输出:

{'colA': ['a', 'b', 'd', 'e'], 'colB': [1, 2]}

关于python - pandas 中多列的唯一值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58815986/

相关文章:

python - 根据行提取具有不同索引列的 pandas 数据框的值

python - 我需要更改pandas数据框中的几列类型。无法使用iloc这样做

python - 合并具有不同列名但定义相同的多个 CSV

python - 有没有办法减少 RMSProp 的代码量

python - 如何在Django中使用重定向功能发送字典数据

python - 为什么我从 matplotlib 中得到了两次图例?

Python:如何使用 new .format() 输出小数点后两位数字的浮点值?

python - pip3 和 python3 -m pip 的区别

python - 一次使用 Pandas 返回多只股票

python - 在运行时拦截子进程的标准输出