StackOverflow 上的第一篇文章,但我一直将此网站视为共享知识的重要来源,我很高兴看到这个问题的结果。
我觉得我现在已经达到了 SQL 索引、统计信息和全文搜索的极限,我目前正在寻找一个可以为我们提供所需功能的搜索库。我不反对自己写它(如果我能得到老板的批准就开源它),但我更愿意找到一些已经存在的开源,natch。
我们追求的是一个搜索引擎,它可以提供有关用户搜索特定关键字时匹配的结果的统计信息。比方说,我们正在谈论在线商店中的产品数据库。我们需要能够返回有关有多少产品与一组给定关键字匹配的统计信息(并且能够按价格、类别等过滤此结果集),以及库存产品总数(假设这存储在产品表的一个字段中)。我找到的所有搜索引擎都返回前 n 个结果,如果你想统计结果集的大小,你需要枚举整个集。即使您没有这样做,您仍然需要这样做来检索库存产品的总数。
有没有人知道能够实现此功能的?正如我所说,我很乐意亲自动手并自己构建它,或者修改 Lucene 之类的功能,但我无法在 Google 上找到合适的东西。
提前谢谢大家!
最佳答案
你可以看看Solr ,这是一个构建在 Lucene 之上的分面搜索引擎。除了进行全文搜索之外,Solr 还会为您计算很多不同的东西。它擅长处理结构化数据和全文数据的组合。
关于sql - 返回统计信息而不是点击的关键字搜索引擎,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6127348/