python - 遍历不同大小的python block 中的字符串

标签 python string list split chunks

所以我在 python 中处理文件,感觉它们有一个名称,但我不确定它是什么。它们类似于 csv 文件,但没有分隔符。无论如何,在我的文件中,我有很多行数据,其中前 7 个字符是 ID 号,然后接下来的 5 个字符是其他内容,依此类推。所以我想遍历文件,读取每一行并将其拆分并将其存储到列表中。这是一个例子:

来自文件:"0030108102017033119080001010048000000"

这些是我想将字符串拆分成的 block :[7, 2, 8, 6, 2, 2, 5, 5] 每个数字代表每个 block 的长度。

首先我尝试了这个:

n = [7, 2, 8, 6, 2, 2, 5, 5]
for i in range(0, 37, n):
    print(i)

当然这行不通,所以现在我开始考虑可能的方法,但它们看起来都很复杂。我在网上环顾四周,似乎找不到任何东西,只有大小均匀的 block 。那么有什么意见吗?

编辑:在这种情况下,我正在寻找的答案应该如下所示: ['0030108', '10', '20170331', '190800', '01', '01', '00480', '00000'] 其中列表 n 中的每个值代表每个 block 的长度。

最佳答案

如果这些是 ASCII 字符串(或者更确切地说,每个字符一个字节),我可能会为此使用 struct.unpack

>>> import struct
>>> sizes = [7, 2, 8, 6, 2, 2, 5, 5]
>>> struct.unpack(''.join("%ds" % x for x in sizes), "0030108102017033119080001010048000000")
('0030108', '10', '20170331', '190800', '01', '01', '00480', '00000')
>>>

否则,您可以根据大小的部分总和构造必要的 slice 对象,如果您使用的是 Python 3,这很容易做到:

>>> psums = list(itertools.accumulate([0] + sizes))
>>> [s[slice(*i)] for i in zip(psums, psums[1:])]
['0030108', '10', '20170331', '190800', '01', '01', '00480', '00000']

accumulate 可以在 Python 2 中用类似的东西实现

def accumulate(itr):
    total = 0
    for x in itr:
        total += x
        yield total

关于python - 遍历不同大小的python block 中的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51193920/

相关文章:

python - str.startswith 带有要测试的字符串列表

python - 什么时候需要在python中使用global关键字

python - 仅删除 alpha 重复项

c++ - 字符串大小始终为 32 字节

c++ - 循环和 strcpy

python - 使用索引手动切片列表,Python

python - 运行数小时后永久 'Temporary failure in name resolution'

python - 如何用pydub指定输出 channel (左,右)?

java - 调用 Scanner 的 nextLine 的方法上的输入不匹配异常

java - 将列表元素转换为字符串