python - 通过 Python 代码阅读阿拉伯语语料库

标签 python nltk

我想阅读阿拉伯语词典 Bw,然后通过 Python 提取一些词汇项,如 "N"、 "V"。另外,我有 Arabic Pen treebank 我想从中提取 trigram。我对使用 Python 很陌生,我应该从哪里开始?

最佳答案

只有一个地方可以开始。

http://www.nltk.org/

Python 是最常用的自然语言处理工具,构建和使用 NLTK 的学术社区可能已经开发出可以满足您大部分需求的工具。

最好从这样的教程开始,http://www.desilinguist.org/pdf/crossroads.pdf并使用简单的欧洲语言工作。然后,当您更加熟悉这些工具时,就可以开始使用阿拉伯语文本了。

关于python - 通过 Python 代码阅读阿拉伯语语料库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6219539/

相关文章:

python - 在 python 的 opencv 3.0 中找不到 SimpleBlobDetector

Python 命令行参数

python - 怎样才能让球朝正确的方向弹跳

python - 如何获取 CFG 语法词典中没有的单词?

python-2.7 - 标记具有双引号的字符串

python - 以编程方式监听发送到 Python/Django 记录器的日志消息

python - 违反了 CPython 中的字符串不可变性

python nltk处理文本,快速去除停用词

python - NLP 句子意义提取方法

python - 从网页中仅提取有意义的文本