如何从 DataFrame 元素获取“设置”数据?
例如,如果我有一个数据
df = DataFrame([['a','b','z'], ['a', 'c'], ['d']])
我想得到
{'a', 'b', 'c', 'd', 'z'}
(类型:设置)
如果我使用for语句,我可以对其进行编码。但是,如果有另一种方法可以用 pandas 进行计算,我想使用它。
最佳答案
DataFrame.stack(dropna=True)默认情况下会删除所有 NaN
In [56]: df.stack().tolist()
Out[56]: ['a', 'b', 'z', 'a', 'c', 'd']
或作为一组:
In [57]: set(df.stack().tolist())
Out[57]: {'a', 'b', 'c', 'd', 'z'}
关于python 数据帧 : get 'set' from DataFrame elements,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45760368/