我一直在使用 mallet 为包含 100,000 行的文本文件(大约 34 MB 的 mallet 格式)推断主题。但是现在我需要在一个包含一百万行(大约 180MB)的文件上运行它并且我得到一个 java.lang.outofmemory 异常。有没有办法将文件拆分成更小的文件并为所有文件中存在的数据构建模型? 提前致谢
最佳答案
在 bin/mallet.bat 中增加这一行的值:
set MALLET_MEMORY=1G
关于java - 木槌主题建模,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5168342/