python - Python 中的 `re.split()` 工作异常

标签 python split

在 python 中遇到了一些困境。我想获取一个包含许多评论的 .txt 文件并将其拆分为一个列表。但是,我想拆分所有标点符号、空格和\n。当我运行以下 python 代码时,它会将我的文本文件分割成奇怪的地方。 注意:下面我只是尝试拆分时间段和结束时间来测试它。但它仍然经常去掉单词中的最后一个字母。

import regex as re
with open('G:/My Documents/AHRQUnstructuredComments2.txt','r') as infile:
    nf = infile.read()
    wList = re.split('. | \n, nf)

print(wList)

最佳答案

您需要修复引号并对正则表达式稍作更改:

import regex as re
with open('G:/My Documents/AHRQUnstructuredComments2.txt','r') as infile:
    nf = infile.read()
    wList = re.split('\W+' nf)

print(wList)

关于python - Python 中的 `re.split()` 工作异常,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45245081/

相关文章:

java - 如何将一个字符串数组拆分为多个字符串?

string - Lua将字符串拆分为表的键和值

python - 如何做一个Python argparse 相互需要的参数组

python - 如何将字符串 json 转换为 python float 并返回 json 中的数字

java - Jhipster/Spring Kafka 消费者与 Python 生产者

arrays - PowerShell将字符串拆分为二维数组

Java - 将数据分割成二维数组

python - hash(None) 是如何计算的?

python - 为什么我的表面位于网格后面?希望能覆盖格子

mysql - 在mysql中文本字符串的之前/之后/特定位置添加特定字符