php - 搜索文本以找到相似之处

标签 php search text filter elasticsearch

我正在为客户构建一个网站,该网站基本上将来自不同来源的大量提要重新组合在一起。

我目前的问题是来源之间可能有重复的内容,我需要找到一个解决方案来比较在网站上发布之前收到的数据。

我的问题是,即使内容重复,有些内容可能会因来源而略有不同。 示例:

来源 1:

"Start your career in IT"

来源 2:

"Start your career in Information Technology"

来源 3:

"Starting your career in Information Technology"

所以我的问题是:是否有一种方法可以比较这些文本并在内容与现有内容相似(根据示例,我所说的相似,不一定相等)时收到警告网站?

Elasticsearch 可以帮助我吗? 实际上,我需要任何指示 :)

谢谢

最佳答案

我想你可以引用以下链接, Elasticsearch "More Like This" API vs. more_like_this query 它回答了类似的问题

关于php - 搜索文本以找到相似之处,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32185230/

相关文章:

Java 代码从网站获取数据并将其写入文本文件

C++ 计算功能词出现次数

php - 如何使 <title> 标签动态化

javascript - 具有动态经度和纬度的 Algolia 地理搜索 - 距离不正确

c++ - 什么是最好的自动完成/建议算法,数据结构 [C++/C]

java - 在 Android 中搜索带有关键字的任何网页

c++ - 文本文件解析C++ |由空格分隔。

javascript - 循环遍历json编码对象

php - MySQL 使用变量准备语句

php - Eloquent 查询构建器替换 and