python - Pandas :要列出的列的累积值[无迭代]

我正在寻找一种快速的方法来完成以下任务:

假设我有以下数据框:

            value
index 
    1        'a'
    2        'b'
    3        'c'
    4        'd'

我想将它扩展到以下数据框:

            value    cum_value
index 
    1        'a'     []
    2        'b'     ['a']
    3        'c'     ['a', 'b']
    4        'd'     ['a', 'b', 'c']

解决我的问题的最高效方法是什么？

最佳答案

这是一种匹配输出的方法，添加一个不包含在字符串类型列中的 sep

s = (df.value+'~').shift().fillna('').cumsum().str[:-1].str.split('~')
index
1           []
2          [a]
3       [a, b]
4    [a, b, c]
Name: value, dtype: object
df['New'] = s

关于python - Pandas :要列出的列的累积值[无迭代]，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57582874/

上一篇：python - 根据长度列表从 numpy 数组中选择元素

下一篇：python - python是否有等同于R语言中的符号对象？

python - 如何替换数组中的条目

python - 具有 pandas mean 函数的日期时间对象

python Pandas : create multiple empty dataframes

python - 行选择结合了 pandas 数据框中索引的条件和列的条件

python - pandas python 中的 3 个月聚合和转移周期分组

python - 如何在一个 View 中处理两个表单？

python - 如何解决 Django 管理中的 "Could not import django.contrib.syndication.views.feed"错误？

python - 通过读取特定字符 ,':' 的左侧来删除行？

python - 我应该使用什么函数将数据框的列四舍五入为数字？