我已经使用 mallet 制作了一个并行主题模型。
我想获取每个文档的热门词。
为此,我试图获得一个词-主题概率矩阵。
我将如何实现这一点?
最佳答案
当您使用 MALLET 构建主题时,您有一个名为 --word-topic-counts-file
的选项。当您提供此选项并指定文件时,MALLET 会在文件的每一行中写入(主题、单词、概率)值。您稍后可以用 C、Java 或 R(当然,任何语言)阅读此文件以创建您想要的矩阵。
关于java - 如何使用 mallet 获得单词主题概率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19661094/