我试图在一个大文本文件中查找 {{rdex|001|001|Bulbasaur|2|Grass|Poison}}
格式的所有字符串,然后提取对应的子字符串到第一个 001
和 Bulbasaur
,可能作为一个元组。
我假设带有捕获组的正则表达式可以用于两者;有人可以告诉我在 Python 3.1 中使用的适当的正则表达式以及可能的代码大纲吗?我是正则表达式菜鸟。
谢谢!
最佳答案
import re
text="""{{rdex|001|001|Bulbasaur|2|Grass|Poison}}"""
re.findall("\{\{[^|]+\|(\d+)\|\d+\|([^|]+)",text)
[('001', 'Bulbasaur')]
关于Python MediaWiki 表正则表达式(查找特定格式的字符串,然后提取其中的子字符串),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2249340/