我正在尝试运行这段代码:
picture = re.search("#4F9EFF;\"><img src=\"(.+?)\" width=\"120\" height=\"90\"", data)
当我执行 print picture.groups(1)
时
它返回值但带有括号,为什么?
输出:
('http://sample.com/img/file.jpg',)
最佳答案
组是一个包含一个元素的元组。您可以作为 output[0]
访问字符串(这是第一个匹配项)。重要的部分是字符串后面的逗号。
但是
DON'T PARSE HTML WITH REGEX
您应该使用合适的 HTML 解析器。当您的正则表达式无法匹配或变得太多时,这将为您节省无数的麻烦。查看 BeautifulSoup 或 lxml。
关于Python Regex 返回带括号的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6732923/