python - 在python中拆分合并的单词

标签 python

我正在处理一个文本,其中所有“\n”都已被删除(它将两个词合并为一个,例如“我喜欢香蕉,这是一个新行。还有另一个。”)我想做什么现在是告诉 Python 查找小写字母后跟大写字母/标点符号后跟大写字母的组合并插入空格。

我认为使用 reg 会很容易。表达式,但它不是 - 我找不到“插入”函数或任何东西,字符串命令似乎也没有帮助。我该怎么做呢? 任何帮助将不胜感激,我在这里感到绝望......

谢谢,帕特里克

最佳答案

尝试以下操作:

re.sub(r"([a-z\.!?])([A-Z])", r"\1 \2", your_string)

例如:

import re
lines = "I like bananasAnd this is a new line.And another one."
print re.sub(r"([a-z\.!?])([A-Z])", r"\1 \2", lines)
# I like bananas And this is a new line. And another one.

如果您想插入换行符而不是空格,请将替换更改为 r"\1\n\2"

关于python - 在python中拆分合并的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5366513/

相关文章:

python - 没有掩码的OpenCV匹配模板?

python - Lisp vs Python——静态编译

python - 椭圆曲线点乘有时会产生错误的结果

python - 如何在 django 管理列表顶部添加链接

python - len(unicode 字符串)

python - 在同一张图表上绘制 matplotlib 图(中位数回归)和 pandas 箱线图

python - 在 Python 中从多个文本文件中查找并提取字符串

python - Cartopy 和 matplotlib TypeError : unhashable type: 'MultiLineString'

python - 文档中的 Mongoengine creation_time 属性

python - 无法通过 Python 的 psycopg2 连接到 Postgresql 数据库