search - 维基百科的搜索是如何进行的?

标签 search data-structures webserver wikipedia

我是网络技术的初学者,所以如果这是一个蹩脚的问题,我很抱歉。

维基百科和其他此类网站拥有数百万个网页。搜索在这些页面中的工作方式。他们是否将所有 html 页面存储在内存中?如果是的话,可以使用什么数据结构来存储所有 html 页面以存储在内存中并在这些页面中快速搜索?

最佳答案

维基百科使用 Lucene全文搜索引擎。另一个流行的全文搜索引擎是Sphinx .

关于search - 维基百科的搜索是如何进行的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6256429/

相关文章:

python - CherryPy 以 Cheetah 作为插件 + 工具 - 空白页

Java/Swing(以及一般的 GUI)- 使用条件/过滤器构建动态搜索表单的技术或模式

search - 如何在 magento 中将搜索结果页面从 3 列更改为 1 列?

mysql - 如何构建即时搜索引擎? (具有排名/相关性)

适用于将字符串与正则表达式模式匹配的数据库或结构

Apache 多个 DocumentRoot

ruby-on-rails - 如何让 Unicorn 在开发日志中显示 post 参数?

algorithm - 防止 2D-grid traveler 重复自身的最小数据结构

c++ - 是否有针对搜索优化的类似集合的数据结构,提前知道会有很高的匹配率?

c++ - 斐波那契数列的递归二叉树类