允许空格和句点的 Python scraper 正则表达式

标签 python regex

我正在尝试使用允许空格和句点的正则表达式编写一个 python scraper。

我正在尝试从某个网站获取棒球队名称,因此有些是 Miami (全字),但其他是 San Francisco (带空格),其他是 志。 Cubs(句号和空格)。

我知道城市名称之前的模式,也知道城市名称之后的模式名称,我试图找到与之间的所有内容相匹配的内容,无论字符、空格或句点的数量如何。我更喜欢使用正则表达式,但如果使用不同的库更容易,我对此持开放态度。

最佳答案

这是一个匹配任意数量的空格、句点或字母的正则表达式:

[ .a-zA-Z]+

示例:

>>> re.search(r'[ .a-zA-Z]+', 'Miami').group(0)
'Miami'
>>> re.search(r'[ .a-zA-Z]+', 'San Francisco').group(0)
'San Francisco'
>>> re.search(r'[ .a-zA-Z]+', 'Chi. Cubs').group(0)
'Chi. Cubs'

关于允许空格和句点的 Python scraper 正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11024191/

相关文章:

python - 以 y_true 取决于 y_pred 的方式自定义 Keras 的损失函数

python - 通过仅指定键的一部分从字典中删除键

regex - Access-Control-Allow-Origin FilesMatch 不适用于 EOT 以外的类型

regex - 带前缀的有效十进制或十六进制的正则表达式

regex - Perl 中除 0 和 1 之外的所有字符的正则表达式

python - 为什么 cv2.rectangle 有时返回 np.ndarray,有时返回 cv2.UMat

python - 如何将此 python 循环转换为矢量编码?

python - django 1.8 SESSION_EXPIRE_AT_BROWSER_CLOSE 不工作

Java正则表达式匹配单词的开头?

regex - 中间件上的通配符或正则表达式 Node 表示安装路径