java - 如何计算查询和文档之间的相似度?

标签 java

我有一组文档,并且我已经计算了这两个文档

  • 词频得分
  • 逆频率分数
  • TF/IDF 得分

现在我需要计算特定查询和文档之间的相似度,这将产生一个分数,该分数将文档从与查询的最高相似度到最低相似度进行排名。

我查了很多资料,但我不明白这个公式。

来源:http://en.wikipedia.org/wiki/Vector_space_model

有人可以指导我吗?我只需要知道如何从目前的进度出发。

最佳答案

Lucene是一个开源库,可以为您完成这一切。

关于java - 如何计算查询和文档之间的相似度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5296688/

相关文章:

java - 重复字符串的简单方法

java - public void actionPerformed(ActionEvent ae) 中表达式的非法开始

Java:如何在Java中从xml中获取属性名称?(JDOM)

java - Android:从 "Downloads"文件夹中删除下载的文件快捷方式

java - 使用简单 XML 进行特殊解析 XML

Java MVC 项目——要么我不能更新绘图,要么我看不到它

java - 如何从 SWIG 中的 C 指针生成 Java 数组

java - -XX :+PrintTenuringDistribution not printing the tenuring age

Java实践OCAJP混淆答案

java - 如何在编译时确保枚举开关的完整性?