Python MediaWiki 表正则表达式(查找特定格式的字符串，然后提取其中的子字符串)

我试图在一个大文本文件中查找 {{rdex|001|001|Bulbasaur|2|Grass|Poison}} 格式的所有字符串，然后提取对应的子字符串到第一个 001 和 Bulbasaur，可能作为一个元组。

我假设带有捕获组的正则表达式可以用于两者；有人可以告诉我在 Python 3.1 中使用的适当的正则表达式以及可能的代码大纲吗？我是正则表达式菜鸟。

谢谢!

最佳答案

import re
text="""{{rdex|001|001|Bulbasaur|2|Grass|Poison}}"""
re.findall("\{\{[^|]+\|(\d+)\|\d+\|([^|]+)",text)
[('001', 'Bulbasaur')]

关于Python MediaWiki 表正则表达式(查找特定格式的字符串，然后提取其中的子字符串)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2249340/

相关文章：

Python - 如何检查系统负载？