python - 如何在 python 中标记输入文件中的自然英文文本?

标签 python nltk

我想在 python 中标记输入文件请建议我,我是 python 的新用户。

我阅读了一些关于正则表达式的内容,但仍然有些困惑,所以请建议任何链接或代码概述。

最佳答案

尝试这样的事情:

import nltk
file_content = open("myfile.txt").read()
tokens = nltk.word_tokenize(file_content)
print tokens

NLTK 教程也充满了易于理解的示例:https://www.nltk.org/book/ch03.html

关于python - 如何在 python 中标记输入文件中的自然英文文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12703842/

相关文章:

python - 如何使用 Django 中的表单来发布多个变量

python - Django:从 `Q` 中提取 `QuerySet` 对象

python - 为什么我不能在 VS - Python 中导入turtle或turtle.Screen?

python - 如何删除上位词和下位词上的 'Synset' 、 '( )' 和 '.pos_tag.numbers' ?

nlp - 标记文本文档 - 监督机器学习

python - 按类名查找元素

python - 从 synset 获取同义词返回错误 - Python

python - 从 Python 字符串列中删除停用词

python - NLTK 的 Vader 评分文本示例

python - python 多处理的内存使用情况