从早上开始我已经读了很多教程了。我的问题涉及找到两个文档之间的相似性。我期待在 java 中使用 LSA 来实现此目的。
我理解了术语文档矩阵的创建,然后对其应用了 SVD(维度减少)。结果获得了 3 个矩阵。这可能听起来很愚蠢,但我已经坚持这个问题有一段时间了。现在,如果我必须找到两个文档之间的相似性,我该怎么办?
最佳答案
使用 SVD 计算出 3 个矩阵后,您需要计算要比较的两个文档的 vector 之间的相关性。您可以使用斯 PIL 曼相关性。 另一种方法是使用余弦距离。
您可以在 LSA 找到更多详细信息,有一个完整的示例和解释。
您可能会搜索一些用于 LSA 的 java 库。
关于java - LSA - 找到 SVD 后的步骤,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8922442/