python - 使 Python RegEx 更简洁

标签 python regex

我对 Python 还是很陌生,尽管我对 JavaScript 有相当多的经验,所以我真正需要处理的只是 Python 的特性。考虑到这一点,以及我知道 JS RegEx 和 Python RegEx 之间存在一些细微差别的事实,我对 Python RegEx 语句有疑问。有没有办法让下面的语句更简洁?

整个正则表达式

^https://www.indiegogo.com/explore/[a-z]+-?[a-z]+\?project_type=[a-z]+&project_timing=[a-z]+_?[a-z]+&tags=&sort=trending$

^https://www.indiegogo.com/explore/[a-z]+-?[a-z]+\?project_type=[a-z]+&project_timing=[a-z]+_?[a-z]+&tags =&sort=trending$

整个正则表达式的分解

我会为您进一步分解。 URL 地址将始终以 ^https://www.indiegogo.com/explore/ 开头并始终以 &tags=&sort=trending$ 结尾,所以不用担心这个,但是...

[a-z]+-?[a-z]+\?project_type=[a-z]+&project_timing=[a-z]+_?[a-z]+

...是正则表达式中重要的特定部分,可以进一步分割。

URL 结构和动态值的可能格式

  1. ^https://www.indiegogo.com/explore/
  2. worddash-separatedseparated-by-dasheswords-separated-by-dashes
  3. ?project_type=
  4. word
  5. &project_timing=
  6. wordadditional_word
  7. &tags=&sort=trending$

步骤1.3.5.7. 可以完全忽略,这留给我们...

唯一的动态值

2. worddash-separatedseparated-by-dasheswords-separated-by-dashes代码

6.wordadditional_word

这可能是我自己的无知或经验不足,但我设计的正则表达式可以这么说似乎很笨拙。 有什么方法可以改进这个正则表达式吗?!

最佳答案

在没有任何示例 URL 进行测试的情况下,我能找到的最简单的解决方案是:

^https:\/\/www.indiegogo.com\/explore\/[a-z\-?_=]+&project_timing=[a-z_]+&tags=&sort=trending$

下面是我所做的不同之处的分割:

  • 代替[a-z]+-?[a-z]+\?project_type=[a-z]+ ,我用 [a-z\-?_=]+ 简化了它
  • 代替[a-z]+_?[a-z]+我用了[a-z_]+

我看到的唯一问题是您没有充分利用您的角色类别。如果您想提供一些示例 URL,我可以解决您可能遇到的任何问题。 But as far as I can tell, it does what you need it to.

您还可以使用 ^https:\/\/www.indiegogo.com\/explore\/[\w\-]+&project_timing=[\w]+&tags=&sort=trending$如果您真的想要简化,但限制可能不够。

关于python - 使 Python RegEx 更简洁,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51031139/

相关文章:

python - 计算数据框 Pandas 的多列中某个值的出现次数

python - 如何在atom上运行python脚本?

python - 在 pandas 数据框中查找元素

python - 替换 XML 文件中的单词

r - R 3.5.0 是否支持正则表达式\\L?

python - 在 sympy 绘图中,如何获得具有固定纵横比的绘图?

python - 在 ipdb session 中如何使用 list()?

python - django_openid_auth TypeError openid.yadis.manager.YadisServiceManager 对象不是 JSON 可序列化的

c# - 如何根据父 div 中的符号删除它?

java - 从Java中的另一个字符串列表中替换字符串的最后一个子字符串的最有效方法