Python 正则表达式什么也找不到

标签 python regex beautifulsoup

尝试使用 Beautiful Soup 4 在 html 代码中查找某些标签。有这样的标签:

<a href='obec.php?kod_obce=511226'>Ábelová</a>

在 html 中。

问题是,当我尝试使用 re.compile 时,bs4 找不到这些标签。

部分代码如下:

obce = soup.findAll("a", attrs={'href':re.compile("obec.php?kod_obce.*")})

它什么也没找到。

你知道哪里出了问题吗?

最佳答案

? 是正则表达式的特殊字符:表示p 或无字符。带问号的字符串被拒绝。使用转义:

r"obec.php\?kod_obce.*"

关于Python 正则表达式什么也找不到,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25928025/

相关文章:

python - 如何使用 boto 有效地将所有文件从一个目录复制到另一个目录中的 amazon S3 存储桶中?

python - 为什么 Python 的 `re.split()` 不在零长度匹配上拆分?

python - 如何使用python抓取aspx页面

python - 如何用其子级替换跨度并对 BeautifulSoup 中的内部文本执行正则表达式

python - 使用正则表达式将空格替换为连字符

python - 来自 2500 个链接的网页抓取 - 行动方案?

python - 如何使用 Deform 和 Colander 使文件上传成为兼性?

python - kill linux 命令执行后结构进程中断

python - Python 中的希尔伯特矩阵

javascript - 文本框接受字符和数字或字母但不接受数字