deeplearning4j:在线 Word2Vec 训练

Word2vec是deeplearning4j的一个很棒的工具。我成功地为一个语料库创建了一个向量 tutorial 。

现在的问题是如何用新句子更新模型，而不必从头开始重新构建模型。

对此的一些想法，这个方法有帮助吗？

public void trainSentence(List<VocabWord> sentence){}

这会更新模型吗？如果是，如何准备发送到该方法的句子？

最佳答案

是和否。在文档中here ，它提到:

Weights update after model serialization/deserialization was added. That is, you can update model state with, say, 200GB of new text by calling loadFullModel, adding TokenizerFactory and SentenceIterator to it, and calling fit() on the restored model.

这意味着可以使用新语料库重新训练和更新模型权重。但词汇表中不会添加新单词。

检查代码和Javadoc here .

关于deeplearning4j:在线 Word2Vec 训练，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36989291/

上一篇：php - Laravel 验证不适用于文件数组

下一篇：php - 如何关闭 mysqli 准备好的语句中的结果集，但保留语句 - 而不缓冲整个结果？

相关文章：

java - GPU 上的 DL4J 示例不起作用(对于学校项目)

deeplearning4j - 我可以在 AMD GPU 上运行 DeepLearning4J 吗？

java - ND4J 数组及其形状 : getting data into a list

java - 迭代DataSet Iterator并添加到DataSet中

java - TransformProcess 在使用 DataSetIterator 时转换数据

java - 如何从 ND4j 中的 NDArray 中选择一组给定的索引，类似于 numpy 的 arraydata[arrayIndex]？

java - CSVRecordReader 和 CSV 行末尾未终止的引用字段

python - 在 keras 中加载模型后的不同预测

keras - 使用 deeplearning4j 在 Java 中加载 Keras 模型时出现异常

java - 需要一些关于 deeplearning4j 单 RBM 使用的帮助