在开发知识库中的文章数据库时(例如)- 排序和显示与用户问题最相关的答案的最佳方法是什么?
您会根据以前的用户是否找到帮助文章来使用关键字权重等额外数据,还是您认为简单的关键字匹配算法就足够了?
最佳答案
也许最简单和最天真的方法将立即提供有用的结果是实现*tf-idf :
Variations of the tf–idf weighting scheme are often used by search engines as a central tool in scoring and ranking a document's relevance given a user query. tf–idf can be successfully used for stop-words filtering in various subject fields including text summarization and classification.
在我最近在这里的一个相关问题中,我了解到一本关于这个主题的优秀免费书籍,您可以下载或在线阅读:
关于algorithm - 搜索排名/相关性算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/177753/