search - 维基百科的搜索是如何进行的？

标签 search data-structures webserver wikipedia

我是网络技术的初学者，所以如果这是一个蹩脚的问题，我很抱歉。

维基百科和其他此类网站拥有数百万个网页。搜索在这些页面中的工作方式。他们是否将所有 html 页面存储在内存中？如果是的话，可以使用什么数据结构来存储所有 html 页面以存储在内存中并在这些页面中快速搜索？

最佳答案

维基百科使用 Lucene全文搜索引擎。另一个流行的全文搜索引擎是Sphinx .

关于search - 维基百科的搜索是如何进行的？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6256429/

上一篇：django - 模型管理排序？

下一篇：internet-explorer - 网站图标在 IE 中不工作

相关文章：

python - CherryPy 以 Cheetah 作为插件 + 工具 - 空白页

Java/Swing(以及一般的 GUI)- 使用条件/过滤器构建动态搜索表单的技术或模式

search - 如何在 magento 中将搜索结果页面从 3 列更改为 1 列？

mysql - 如何构建即时搜索引擎？ (具有排名/相关性)

适用于将字符串与正则表达式模式匹配的数据库或结构

Apache 多个 DocumentRoot

ruby-on-rails - 如何让 Unicorn 在开发日志中显示 post 参数？

algorithm - 防止 2D-grid traveler 重复自身的最小数据结构

c++ - 是否有针对搜索优化的类似集合的数据结构，提前知道会有很高的匹配率？

c++ - 斐波那契数列的递归二叉树类

©2024 IT工具网联系我们