java - word2vec 是否可以很好地处理包含两种语言文本的语料库?

标签 java word2vec

我想建立一个小型搜索引擎,向用户推荐相关词。我认为word2vec可以帮助我解决这个问题。原则上,该搜索引擎将允许用英语和德语进行查询。我的问题很明确:word2vec 可以很好地处理包含英语内容但同时也包含德语内容的语料库吗?

最佳答案

我使用了土耳其语英语中的词 vector 进行文本分类。它非常适合我的情况。我认为,你可以同时使用两种语言。

关于java - word2vec 是否可以很好地处理包含两种语言文本的语料库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35150555/

相关文章:

java - 用Java连接Advantage数据库

java - 如何使用一组中的键和另一组中的值填充 HashMap

machine-learning - 词嵌入训练

nlp - Word2Vec的特征是相互独立的吗?

java - JScrollPane 不起作用

java - 如何从 ArrayList<String> 中删除括号

tensorflow - Word2Vec 应该训练多少个 epoch?推荐的训练数据集是什么?

word2vec - 从 fastText 理解 wordNgram

word2vec - 如何构建合适的 H2O word2vec 训练框架

java - 如何将 DefaultListModel 中的数据追加到 .txt 文件中