我有一长串 (28MB) 的普通句子。我想删除所有完全大写的单词(例如 TNT、USA、OMG)。
所以从句子来看:
Jump over TNT in There.
我想得到:
Jump over in There.
有什么办法,如何在不将文本拆分为列表和迭代的情况下做到这一点?是否可以使用正则表达式来做 is?
最佳答案
您可以使用用单词边界捕获的大写字母集 [A-Z]
\b
:
import re
line = 'Jump over TNT in There NOW'
m = re.sub(r'\b[A-Z]+\b', '', line)
#'Jump over in There '
关于Python - 从长字符串中删除大写单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37943611/