我正在处理一个文本,其中所有“\n”都已被删除(它将两个词合并为一个,例如“我喜欢香蕉,这是一个新行。还有另一个。”)我想做什么现在是告诉 Python 查找小写字母后跟大写字母/标点符号后跟大写字母的组合并插入空格。
我认为使用 reg 会很容易。表达式,但它不是 - 我找不到“插入”函数或任何东西,字符串命令似乎也没有帮助。我该怎么做呢? 任何帮助将不胜感激,我在这里感到绝望......
谢谢,帕特里克
最佳答案
尝试以下操作:
re.sub(r"([a-z\.!?])([A-Z])", r"\1 \2", your_string)
例如:
import re
lines = "I like bananasAnd this is a new line.And another one."
print re.sub(r"([a-z\.!?])([A-Z])", r"\1 \2", lines)
# I like bananas And this is a new line. And another one.
如果您想插入换行符而不是空格,请将替换更改为 r"\1\n\2"
。
关于python - 在python中拆分合并的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5366513/