Python 全新!!!我得到了一个文本文件 https://en.wikipedia.org/wiki/Character_mask我需要将文件拆分为单个单词(超过一个字母,由多个其他字符之一分隔)我尝试使用正则表达式,但似乎无法正确拆分它而不出现错误。这是我到目前为止的代码,任何人都可以帮我修复这个正则表达式
import re
file = open("charactermask.txt", "r")
text = file.read()
message = print(re.split(',.-\d\c\s',text))
print (message)
file.close()
最佳答案
您可以使用 re.findall
和以下正则表达式模式来查找长度超过 1 个字符的所有单词。
更改:
message = print(re.split(',.-\d\c\s',text))
至:
message = re.findall(r'[A-Za-z]{2,}', text))
关于python - 在python中使用正则表达式将文本文件拆分为单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52510524/