python - BM-25搜索算法在python中的实现

标签 python algorithm

我正在用 python 设计一个基于 okapi bm25 的搜索引擎,我应该使用什么来存储页面数据(相关性等)和 tf、idf 以便快速访问? python shelf 是否足以用于可扩展的设计?

谢谢。

最佳答案

我建议你看看wiredtiger它是强大的键值存储,比 leveldb 或 bsddb(shelf 模块使用 bsddb)更快,可以构建您的存储。它们是不同的模式,您可以在此处查看 stackoverflow 以了解有关 leveldb 或 bsddb 的问题。 .

如果您不熟悉键/值存储,我建议您使用 leveldbplyvel这是一个好的开始,但扩展性不如 wiredtiger。

关于python - BM-25搜索算法在python中的实现,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32537117/

相关文章:

python - 使用批处理将文件和文件夹复制到另一个路径

mysql - MySql 中使用了哪种数据结构?

具有 1 个参数的 C++ 默认模板化构造函数

algorithm - 简单最大利润调度算法

python - 在 Python 中搜索()一个 zip 文件中的文件而不将其传递到内存

python - 按值对 python 字典中的键/值对进行分组,保持原始键关联

java - 如何解决优先队列池?这是最好的选择吗?

algorithm - “cracking the coding interview(fifth edition)” : 9. 10盒堆叠

python - Python 中 if 语句中 or、and 和 not 的问题

python - Tkinter 按钮未定义