list - 识别列表中连续重复项的最 Pythonic 方法是什么?

标签 list duplicates generator python

我有一个整数列表,我希望能够识别连续的重复 block :也就是说,我想生成一个保持顺序的重复列表,其中每个重复包含(int_in_question,出现次数)。

例如,如果我有一个类似的列表:

[0, 0, 0, 3, 3, 2, 5, 2, 6, 6]

我希望结果是:

[(0, 3), (3, 2), (2, 1), (5, 1), (2, 1), (6, 2)]

我有一个相当简单的方法,使用 for 循环、临时和计数器:

result_list = []
current = source_list[0]
count = 0
for value in source_list:
    if value == current:
        count += 1
    else:
        result_list.append((current, count))
        current = value
        count = 1
result_list.append((current, count))

但我真的很喜欢 python 的函数式编程习惯,我希望能够用一个简单的生成器表达式来做到这一点。但是,我发现在使用生成器时很难保持子计数。我觉得两步过程可能会让我到达那里,但现在我被难住了。

有没有一种特别优雅/pythonic 的方式来做到这一点,尤其是使用生成器?

最佳答案

>>> from itertools import groupby
>>> L = [0, 0, 0, 3, 3, 2, 5, 2, 6, 6]
>>> grouped_L = [(k, sum(1 for i in g)) for k,g in groupby(L)]
>>> # Or (k, len(list(g))), but that creates an intermediate list
>>> grouped_L
[(0, 3), (3, 2), (2, 1), (5, 1), (2, 1), (6, 2)]

Batteries included ,正如他们所说。

使用来自 JBernardo 的 sum 和生成器表达式的建议;见评论。

关于list - 识别列表中连续重复项的最 Pythonic 方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6352425/

相关文章:

git - 检查 git 中的重复文件(内容)?

algorithm - 从现有数据生成样本数据 - 算法?

python - 在python中对两个列表进行分组

c++ - 字符作为数字打印到 std::cout

python - 当我组合一类数据并分配给一个列表时,Python 中的 [...] 是什么意思?

r - 基于重复 ID 的子集,并且值是否与后续行的另一列中的值重复

excel - 如何修改重复值

python - 网络爬虫返回列表 vs 生成器 vs 生产者/消费者

python - Elasticsearch 滚动(扫描)到 Pandas DataFrame

list - 列出Dart中 map 的AS值