我对 python 很陌生,对编程也很陌生。我一直在尝试将某些 .txt 文件解析到 Excel 中,并且已经成功地将其中一些文件轻松分割成我可以编码的行。
但是,我现在有一堆包含我的信息的文件,但没有合理的换行符。我的数据如下所示:
company1 name _______ 123 company2 name 456 company3 name
789
名称和数字之间没有良好的指示符——有时之间有下划线,有时只有空格,有时之间有换行符。如果我可以将所有这些分成在每个完整数字之后结束的行,那么我已经编写的代码将完成其余的工作。理想情况下,我会有一个如下所示的字符串:
company1 name ______ 123
company2 name 456
company3 name 789
解析出原始字符串中的换行符。
希望有人能帮忙!
最佳答案
您可能应该使用正则表达式来查找文本中的模式,并允许您使用换行符修改该模式。
例如:
import re
line = 'company1 name _______ 123 company2 name 456 company3 name 789'
output = re.sub(r'(\s\d+\s*)', r'\1\n', line)
print output
返回
company1 name _______ 123
company2 name 456
company3 name 789
关于python - 在python中分割数字后的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30610706/