计算关键字与短文本(50 - 100 字)相关性的算法

标签 algorithm string matching heuristics

我想计算关键字与简短描述文本的相关性。就效率和易于实现而言,最好的方法是什么?我在使用 C++?

最佳答案

简单的解决方案:计算单词在文本中的出现次数。

不过,要做好工作是谷歌等公司多年来一直致力于解决的难题。如果可能的话,您可能想看看 using their technology

要扩展,请尝试以下操作:

到目前为止,这仍然只能帮助您。您需要执行一些自然语言处理才能真正理解描述的内容,以区分包含相同次数的关键字的多个文本。

关于计算关键字与短文本(50 - 100 字)相关性的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4546193/

相关文章:

C++ 强随机数生成器 - 必要吗?

javascript - 如何像 String() 那样遵循转义序列

string - 字符串匹配中的前缀与后缀 Trie

algorithm - 瓦片的成对匹配

c - 开源三角方程简化器(最好是基于 C 的)?

python - 查找一个字符串在另一个字符串中的所有排列

c++ - 字符串输出不完整 - 奇怪的行为

java - 覆盖 toString() 给出错误

c++ - 满足以下条件的高效图算法?

c# - 如何在 C# 中比较两个字典