我使用嵌入的 Neo4j 作为数据库。我每天必须存储数千篇文章,并且需要提供搜索功能,我应该返回内容与用户输入的关键字匹配的文章。我对每篇文章的内容建立了索引,并在索引上进行了查询,如下所示
val articles = article_content_index.query("article_content", search string)
这很好用。但是,当搜索字符串包含“the”、“a”等常见单词时,这会花费大量时间,这些单词将出现在每篇文章中。
如何解决这个问题?
最佳答案
可能是 lucene 问题。
您可以配置自己的分析器,该分析器可以省略那些频繁的(停用)词:
http://docs.neo4j.org/chunked/stable/indexing-create-advanced.html http://lucene.apache.org/core/3_6_2/api/core/org/apache/lucene/analysis/Analyzer.html http://lucene.apache.org/core/3_6_2/api/core/org/apache/lucene/analysis/standard/StandardAnalyzer.html
关于lucene - Neo4j - 使用 Lucene 查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18073194/