machine-learning - 如何使用木槌提取主题关键词

标签 machine-learning mining mallet

我已将文件导入到 mallet 中,现在我想根据导入的数据对主题进行建模并将其存储在文本文件中,以便我可以从其中读取这些主题。任何人都可以帮助编写主题提取命令,因为我在下面键入命令进行主题提取,但它抛出异常。

bin\mallet import-dir --input D:\Data\test1 --output test1.mallet --keep-sequence --remove-stopwords --extra-stopwords extra.txt

通过删除 --keep-sequence --remove-stopwords --extra-stopwords extra.txt 我可以在之后导入文件,当我尝试训练模型时抛出异常。

最佳答案

我建议您使用 GUI 进行木槌。

https://code.google.com/p/topic-modeling-tool/

关于machine-learning - 如何使用木槌提取主题关键词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33504418/

相关文章:

topic-modeling - 木槌的基本用法。第一步

java - 在 Java 中使用 Mallet 在 LDA 中折叠(估计新文档的主题)

nlp - 用于词性标注器的 Baum-Welch 算法

r - 将文档术语矩阵转换为包含大量数据的矩阵会导致溢出

php - 虚拟主机不支持 cron 作业。如何远程运行抓取脚本来挖掘数据,然后将其发送到我的主机的 mysql 数据库?

python和redis,语法不清楚

java - Mallet 输出主题权重 0.0 或 1.0,不输出任何中间值

java - 使用 Java 访问数据集的最快方法是什么?

python - 构建图像分类的初始架构。喀拉斯。值错误

python - 从 Python 中的 ONNX 模型获取预测