java - Java中的搜索引擎算法?

标签 java search-engine information-retrieval

好吧,我对这个网站真的很陌生,我想刚刚才 2 个小时,所以我需要一段时间才能习惯该网站并提出不违反指南的问题。

我想做的就是实现一个小型搜索引擎,这不是家庭作业,也不是我仅仅通过学习就能获得报酬的工作。

搜索引擎将有一个简单的用户界面,供用户提出问题并显示结果。

这个结果显然需要进行组织,需要显示找到的结果数量,并且最相关的结果将显示在顶部 它还会有指向它找到的 Material 的链接。 我有一些java经验,因此我需要一个算法来实现它。

有一百万种不同的搜索引擎,有些是 Java 的,有些是 php 和其他语言的,但是它们已经实现了,我需要从头开始实现这个算法。

我专门为此目的买了一本书,名为“算法导论”,但这并没有我想象的那么有帮助。 我需要一些 java 指南,一个以代码形式列出我需要做什么的菜单。

如果有人能提供帮助,我将非常感激。 谢谢

最佳答案

您可以使用库Apache Lucene ,这是一个成熟的基于java的信息检索系统。
您必须创建一个IndexWriter ,并将其用于 index您的文件集合。
然后,您应该使用 IndexSearcher 搜索文档。 。请阅读文档,因为可能您需要的一切都已构建。

如果您想从头开始实现它,我建议首先阅读 Information Retrieval 。一个很好的起点是 Introduction to Information Retrieval

关于java - Java中的搜索引擎算法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7865816/

相关文章:

java - 我想了解我为 java return 语句显示的代码

java - iMacros for loop POS={{k}} k 不持有整数值/存储问题

.htaccess - 单独的网站页面如果都是通过index.php解析的,谷歌会注册吗

search - 用于 Intranet 文档搜索引擎的基于 Web 的免费解决方案?

gensim - 如何使用gensim的LDA从查询中进行文本检索?

python - 基于投票的用户之间的相似性

python - 如何估计特定文档的查询的重要性?

java - EJB 容器是否驻留在所有应用程序服务器中。 EJB容器深入

java - 是否可以在 Spring 存储库中使用原始 SQL

django - AttributeError: 'ElasticSearch'对象没有属性 'bulk_index'“