我正在尝试使用允许空格和句点的正则表达式编写一个 python scraper。
我正在尝试从某个网站获取棒球队名称,因此有些是 Miami
(全字),但其他是 San Francisco
(带空格),其他是 志。 Cubs
(句号和空格)。
我知道城市名称之前的模式,也知道城市名称之后的模式名称,我试图找到与之间的所有内容相匹配的内容,无论字符、空格或句点的数量如何。我更喜欢使用正则表达式,但如果使用不同的库更容易,我对此持开放态度。
最佳答案
这是一个匹配任意数量的空格、句点或字母的正则表达式:
[ .a-zA-Z]+
示例:
>>> re.search(r'[ .a-zA-Z]+', 'Miami').group(0)
'Miami'
>>> re.search(r'[ .a-zA-Z]+', 'San Francisco').group(0)
'San Francisco'
>>> re.search(r'[ .a-zA-Z]+', 'Chi. Cubs').group(0)
'Chi. Cubs'
关于允许空格和句点的 Python scraper 正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11024191/