我正在寻找一个正则表达式,它给出以字母、数字或下划线 ('_') 开头的单词。它只能在单词之间包含点('.'),而不是在末尾,并且应该删除所有其他特殊字符。 例如
WARC-_Target-URI: http://www.allchocolate.com/health/basics/
应该给
WARC、_Target、URI、http、www.allchocolate.com、健康、基础
我们将不胜感激任何形式的帮助。
最佳答案
给你:
from re import findall
print findall(r'\w[\w.]*\w', 'WARC-_Target-URI: http://www.allchocolate.com/health/basics/')
['WARC', '_Target', 'URI', 'http', 'www.allchocolate.com', 'health', 'basics']
与其他解决方案不同,这适用于任何情况(不仅仅是您发布的示例)。
关于python - 会给出某些单词python的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33066075/