允许空格和句点的 Python scraper 正则表达式

我正在尝试使用允许空格和句点的正则表达式编写一个 python scraper。

我正在尝试从某个网站获取棒球队名称，因此有些是 Miami (全字)，但其他是 San Francisco (带空格)，其他是 志。 Cubs(句号和空格)。

我知道城市名称之前的模式，也知道城市名称之后的模式名称，我试图找到与之间的所有内容相匹配的内容，无论字符、空格或句点的数量如何。我更喜欢使用正则表达式，但如果使用不同的库更容易，我对此持开放态度。

最佳答案

这是一个匹配任意数量的空格、句点或字母的正则表达式:

[ .a-zA-Z]+

示例:

>>> re.search(r'[ .a-zA-Z]+', 'Miami').group(0)
'Miami'
>>> re.search(r'[ .a-zA-Z]+', 'San Francisco').group(0)
'San Francisco'
>>> re.search(r'[ .a-zA-Z]+', 'Chi. Cubs').group(0)
'Chi. Cubs'

关于允许空格和句点的 Python scraper 正则表达式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11024191/

上一篇：python - 如何定义引用其自身模型的 django 外键 limit_choices_to 约束？

下一篇：python - 第一次写脚本，不知道用什么语言(解析excel等文件)

python - 通过仅指定键的一部分从字典中删除键

regex - Access-Control-Allow-Origin FilesMatch 不适用于 EOT 以外的类型

regex - 带前缀的有效十进制或十六进制的正则表达式

regex - Perl 中除 0 和 1 之外的所有字符的正则表达式

python - 为什么 cv2.rectangle 有时返回 np.ndarray，有时返回 cv2.UMat

python - 如何将此 python 循环转换为矢量编码？

python - django 1.8 SESSION_EXPIRE_AT_BROWSER_CLOSE 不工作

Java正则表达式匹配单词的开头？

regex - 中间件上的通配符或正则表达式 Node 表示安装路径