在堆栈溢出中进行搜索时,大多数情况下会显示搜索摘录(帖子/问题的前40个单词左右)。在某些情况下,会显示更多文本,并且该文本包含搜索词。两个文本块均以省略号结尾。
如果您查看元标记“description”或“og:description”,则会包含类似的文本,从而使Google能够正确编制索引。
我的问题:
我之所以提出这些问题,是因为我想防止我开始编写一种算法来确定html文章的前40个字(在我们的情况下为博客文章)。
谢谢
马克
最佳答案
Stackoverflow uses Elasticsearch。
Elasticsearch具有highlighting功能,可以处理这些事情。
确定代码段的搜索时间,以查找最有可能与用户查询相关的代码段。
关于elasticsearch - 如何确定帖子的搜索代码段和meta “description”?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22149887/