f=open("galcode.txt")
for element in f:
galcode_scan = re.search(ur'http://i\.imgur\.com/\w{5,8}', element)
if galcode_scan:
print galcode_scan.groups()
f.close()
本例中的 Galcode.txt 是 imgur 上图库的 html。我正在尝试获取发布到 imgur 的画廊的所有链接列表。如果我在输入画廊名称并收到 galcode 后运行它,我得到的大约是 15 ()。如何获取链接列表?
谢谢
最佳答案
您没有任何捕获组,因此 .groups()
返回一个空元组。使用 .group()
代替或用括号括起您的正则表达式 (ur'(http://i\.imgur\.com/\w{5,8})'
).
也就是说,我强烈建议使用 BeautifulSoup、cssselect 或任何其他 HTML 解析库。
关于python - re.search 返回空元组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27536815/