python - 如何找到匹配的字节码?

标签 python regex python-3.x search

我确实有一个字节码字符串以及所有匹配的字节码中的开始和结束索引(来自文本编辑器)。

示例mystring:

a few names with accents are Emily Brontë, Noël Coward, Zoë Wanamaker

当我搜索包含 ë 的单词时,我在文本编辑器中找到这些(字节码)索引:
匹配 = [[35, 43], [44, 49], [58, 62]]

现在我想使用 python p.e 在这些匹配项中进行搜索。查找字母o的所有子字符串,并在mystring中查找这些o的新字节码。

newmatches = []
     for n in matches:
         for m in reg.finditer(str(mystring[n[0]:n[1]], 'utf-8')):
             newmatches.append([m.start(), m.end()])

在上面的示例中,start() 和 end() 不是字节码,也不是 mystring 中的索引,而是子字符串中的索引。

如何解决这个问题?

最佳答案

获得 matches 数组后,对 mystring 进行第二次搜索,在其中找到 o 的索引(我们称这个新数组为o_matches)。然后循环遍历 o_matches 中的项目 - 如果该项目包含在 matches 数组中的任何间隔中,则将其添加到 newmatches ,因为这意味着它是包含重音的单词的一部分。

关于python - 如何找到匹配的字节码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48792443/

相关文章:

python - 生成器因 NoneType 错误而失败

java - VBScript 中的正则表达式与 Java 中的正则表达式

java - 使用 Java 从 Wolfram Alpha 检索的结果中提取所需的子字符串

python-3.x - 检查列值是否在另一列中,哪些值是列表

python - x 轴值的分组

python - 解决 python 3 与 python 2 中的 map 函数问题

Python 正则表达式在模式中用可选词拆分

regex - notepad++ 关键字仅在行首时

python - 3darray 训练/测试 TensorFlow RNN LSTM

python - 参数解包是否使用迭代或项目获取?