Python MediaWiki 表正则表达式(查找特定格式的字符串,然后提取其中的子字符串)

标签 python regex mediawiki

我试图在一个大文本文件中查找 {{rdex|001|001|Bulbasaur|2|Grass|Poison}} 格式的所有字符串,然后提取对应的子字符串到第一个 001Bulbasaur,可能作为一个元组。

我假设带有捕获组的正则表达式可以用于两者;有人可以告诉我在 Python 3.1 中使用的适当的正则表达式以及可能的代码大纲吗?我是正则表达式菜鸟。

谢谢!

最佳答案

import re
text="""{{rdex|001|001|Bulbasaur|2|Grass|Poison}}"""
re.findall("\{\{[^|]+\|(\d+)\|\d+\|([^|]+)",text)
[('001', 'Bulbasaur')]

关于Python MediaWiki 表正则表达式(查找特定格式的字符串,然后提取其中的子字符串),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2249340/

相关文章:

Python - 如何检查系统负载?

c# - Mirc 颜色代码的正则表达式替换

python - 从子模块记录会忽略添加的根记录器流处理程序

python - CherryPy SSL 链式证书

python - 使用 RecycleView 时设置列宽

c# - 使用 Regex,如何找到 2 个字符之间的重复模式?

java - 为什么我的正则表达式在 android 的短信接收器上没有被正确解析?

java - gscoord 和 gspage 或 gspop 不能在 MediaWiki 中一起使用

php - MediaWiki 数据库中的访问被拒绝,甚至影响 SQL 查询

jquery - 维基背景出血