java - 如何使用 mallet 获得单词主题概率

标签 java mallet

我已经使用 mallet 制作了一个并行主题模型。

我想获取每个文档的热门词。

为此,我试图获得一个词-主题概率矩阵。

我将如何实现这一点?

最佳答案

当您使用 MALLET 构建主题时,您有一个名为 --word-topic-counts-file 的选项。当您提供此选项并指定文件时,MALLET 会在文件的每一行中写入(主题、单词、概率)值。您稍后可以用 C、Java 或 R(当然,任何语言)阅读此文件以创建您想要的矩阵。

关于java - 如何使用 mallet 获得单词主题概率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19661094/

相关文章:

java - 找不到方法格式的符号(DateTimeFormatter)?

java - Android 自定义 ArrayAdapter - 崩溃

java - 使用 Java 版 Mallet Api 进行主题建模

java - 我应该将哪个版本的 Java JDK 与 MALLET 一起使用?

java - JPanel inside JScrollPane 绘画问题

java - Java数据结构中的搜索函数

java - 无法执行目标 Maven/Eclipse

machine-learning - Mallet 训练模型负载

java - Mallet Java 中的错误

python - 相干图空白 - nan 的相干值