我想在 python 中标记输入文件
请建议我,我是 python 的新用户。
我阅读了一些关于正则表达式的内容,但仍然有些困惑,所以请建议任何链接或代码概述。
最佳答案
尝试这样的事情:
import nltk
file_content = open("myfile.txt").read()
tokens = nltk.word_tokenize(file_content)
print tokens
NLTK 教程也充满了易于理解的示例:https://www.nltk.org/book/ch03.html
关于python - 如何在 python 中标记输入文件中的自然英文文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12703842/