python - pandas 数据框的两列 - Python 中的 Concat

标签 python pandas

pandas python 新手。

我有一个带有两列尖点的数据框(df)。 我想将这些列转换为两列的唯一条目的列表。

我的第一次尝试是执行以下操作:

cusips = pd.concat(df['长'], df['短'])。

这返回了错误:具有多个元素的数组的真值不明确。使用 a.any() 或 a.all()。

我已经阅读了一些帖子,但我仍然无法理解为什么会出现这种情况。我在这里缺少什么?

此外,选择列或数据框中唯一条目的最有效方法是什么?我可以在一个函数中调用它吗?如果我想创建一个列表或一个新的单列数据框,该函数是否有所不同?

谢谢。

最佳答案

除了 Hayden 的答案之外,您还可以使用 set() 方法来获得相同的结果。如果考虑到这一点,性能会稍微好一些:

In [28]: %timeit set(np.append(df[0],df[1]))
100000 loops, best of 3: 19.6 us per loop

In [29]: %timeit np.append(df[0].unique(), df[1].unique())
10000 loops, best of 3: 55 us per loop

关于python - pandas 数据框的两列 - Python 中的 Concat,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14124710/

相关文章:

python - 在 Python/matplotlib 中从数据帧中在条形图顶部绘制线图

python - 在 Python 正则表达式中拆分 '12213123_mul_32432532'

pandas - 根据日期列 Pandas 过滤数据框

python - 从具有多列条件的数据框中获取行

python - 从具有重复列的 2 行创建多重索引

python - 比 locals() 或 dict(foo=foo) 更好的东西用于将上下文导出到模板引擎

python - 是否可以自动合并本体,以便将精确匹配合并到一个首选术语下?

python - Pandas 分钟数据可变长度窗口查找从现在到关闭时间的最小值

python - 将连续的重复字符替换为一个 - 逐列操作 - `pandas.DataFrame`

python - 为什么cherry匹配而不匹配?