我一直在用头撞键盘,通过 Google 和我能找到的所有 Python 文档来寻求启发,但找不到我遇到的问题的答案。
我在网站上运行了以下正则表达式,但 Python 坚持在其上设置 re.DOTALL,即使我的代码没有告诉它:
\d+. +(?P<season>\d+) *\- *(?P<episode>\d+).*?(?P<day>\d+)(?:\/|\s)+(?P<month>[A-Za-z]+)(?:\/|\s)+(?P<year>\d+) +(?:<a .+><img .+></a>)? ?<a .*?>(?P<name>.*?)</a>
这会为电视节目列表创建一系列季节/剧集,除了在 epguides.com/BurnNotice(使用 TVRage 列表时)之外,由于换行符之前有一些空格(我猜测)。
使用http://re-try.appspot.com为了进行测试,我将问题范围缩小到了 re.DOTALL 的使用。如果我在重试时启用它,它会复制我在脚本上独立运行它时得到的结果。如果我取消勾选 DOTALL,那么它就会给出我期望的结果。
如何强制 Python 不使用 re.DOTALL?
该脚本可以在 Ubuntu 和 OS X 上运行。
最佳答案
.+>
应更改为 [^>]+>
和
.*?>
到 [^>]*>
您也可以尝试将其他点替换为[^\r\n]
,但以上2个更改应该足够了。
关于python - 如何强制Python忽略re.findall()语句中的re.DOTALL?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2003461/