python - 如何使用 python 将文本拆分为子句?

标签 python nlp nltk

我想将文本拆分为子句。我该怎么做?

例如:

text = "Hi, this is an apple. Hi, that is pineapple."

结果应该是:

['Hi,',
 'this is an apple.',
 'Hi,',
 'that is pineapple.']

(附:我尝试使用 string.split(r'[,.]'),但它会删除分隔符。)

最佳答案

也许这也行:

text.replace(', ', ',, ').replace('. ', '., ').split(', ')

结果:

['Hi,', 'this is an apple.', 'Hi,', 'that is pineapple.']

关于python - 如何使用 python 将文本拆分为子句?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47964378/

相关文章:

python - 如何使用 sklearn 的 CountVectorizer and() 获取包含任何标点符号的 n 克作为单独的标记?

python - 将 pandas 数据框分组并将多个值收集到集合中

python - Fiddler 请求到 Python Requests 请求

python - Celery 中的顺序任务执行

python - 使用 python 进行正则表达式处理

python - 如何找到文本特征并打印它们?

python - 带 ffill 的 GroupBy 删除组并且不将组放入索引

python - 检查数百万搜索查询中是否存在大量单词的有效方法

python - 保存朴素贝叶斯分类器 nltk

python - 如何从 NLTK 扩展停用词列表并使用扩展列表删除停用词?