我确实有一个字节码字符串以及所有匹配的字节码中的开始和结束索引(来自文本编辑器)。
示例mystring
:
a few names with accents are Emily Brontë, Noël Coward, Zoë Wanamaker
当我搜索包含 ë
的单词时,我在文本编辑器中找到这些(字节码)索引:
匹配 = [[35, 43], [44, 49], [58, 62]]
现在我想使用 python p.e 在这些匹配项中进行搜索。查找字母o
的所有子字符串,并在mystring
中查找这些o
的新字节码。
newmatches = []
for n in matches:
for m in reg.finditer(str(mystring[n[0]:n[1]], 'utf-8')):
newmatches.append([m.start(), m.end()])
在上面的示例中,start() 和 end() 不是字节码,也不是 mystring
中的索引,而是子字符串中的索引。
如何解决这个问题?
最佳答案
获得 matches
数组后,对 mystring
进行第二次搜索,在其中找到 o
的索引(我们称这个新数组为o_matches
)。然后循环遍历 o_matches
中的项目 - 如果该项目包含在 matches
数组中的任何间隔中,则将其添加到 newmatches
,因为这意味着它是包含重音的单词的一部分。
关于python - 如何找到匹配的字节码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48792443/