尝试使用 Beautiful Soup 4 在 html 代码中查找某些标签。有这样的标签:
<a href='obec.php?kod_obce=511226'>Ábelová</a>
在 html 中。
问题是,当我尝试使用 re.compile
时,bs4 找不到这些标签。
部分代码如下:
obce = soup.findAll("a", attrs={'href':re.compile("obec.php?kod_obce.*")})
它什么也没找到。
你知道哪里出了问题吗?
最佳答案
?
是正则表达式的特殊字符:表示p
或无字符。带问号的字符串被拒绝。使用转义:
r"obec.php\?kod_obce.*"
关于Python 正则表达式什么也找不到,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25928025/