python - 会给出某些单词python的正则表达式

标签 python regex split

我正在寻找一个正则表达式,它给出以字母、数字或下划线 ('_') 开头的单词。它只能在单词之间包含点('.'),而不是在末尾,并且应该删除所有其他特殊字符。 例如

WARC-_Target-URI: http://www.allchocolate.com/health/basics/

应该给

WARC、_Target、URI、http、www.allchocolate.com、健康、基础

我们将不胜感激任何形式的帮助。

最佳答案

给你:

from re import findall

print findall(r'\w[\w.]*\w', 'WARC-_Target-URI: http://www.allchocolate.com/health/basics/')

['WARC', '_Target', 'URI', 'http', 'www.allchocolate.com', 'health', 'basics']

与其他解决方案不同,这适用于任何情况(不仅仅是您发布的示例)。

关于python - 会给出某些单词python的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33066075/

相关文章:

MYSQL:以可变的出现次数分割字符串

python - 将每个 pytest 测试函数包装成 try-except

python - 如何在 django 中进行管理操作来下载用户的 pdf 文件

java - 从给定字符串替换\n\r 和\t 的最佳方法

java - 为字符串生成 RegExr

javascript - 为javascript中的重复元素创建新数组

python - 根据 Python Pandas 中的其他列对列进行分组

python - 无法在 ubuntu 上使用 Python 3.5 安装 Gensim

正则表达式,忽略字符串中可能出现的匹配项

java - 拆分后为两个变量赋值