我正在开发一个基于 PHP 的系统,用户可以在其中使用 MySQL 数据库创建、发布和查看内容片段,每个内容片段都存储在表格行中。当用户发布内容时,PHP 脚本会提取常用词或标签(删除任何停用词,如“and”和“or”),按出现次数对它们进行排序,并将它们全部存储为数据库中的数组。
除了查看每条内容和生成的标签外,我还想要一个功能来显示已发布的类似内容的列表,这些内容具有一个或多个正在显示的内容所具有的标签(类似于 YouTube 的相关视频或新闻网站上的相关报道)。此外,我希望根据每段内容具有的这些标签的数量来对列表进行排序。
我做了一些研究并开发了两个不同的脚本,它们可以根据是否存在任何标记从数据库中选择行。但是,这两个脚本都有问题;
我首先尝试的是 LIKE 查询;
$tags=$row['tags'];
$tags2=explode(",",$tags);
foreach ($tags2 as $key => $keyword) {
$sql = ("SELECT DISTINCT * FROM table WHERE tags LIKE '%$keyword%' ");
if ($key != (sizeof($tags2)-1)){
$sql .= " OR ";
}
$sql .= " LIMIT 20";
}
这个查询的问题在于它没有对结果进行排序。然后我尝试了 MATCH AGAINST 查询;
$tags=$row['tags'];
$tags2=explode(",",$tags);
$searchstring="";
foreach ($tags2 as $word){
$searchstring = $searchstring .' +'.$word;
}
$sql = ("SELECT * FROM table WHERE MATCH (tags) AGAINST ('$searchstring' IN BOOLEAN MODE)");
虽然结果按相关性排序,但它只检索包含所有标签的行,如果该行甚至缺少一个标签,则查询不会检索到它。
我想要的是结合这两种功能的优点,选择包含一个或多个标签的行,然后根据存在的标签数量对它们进行排序。例如;如果 row1 包含 10 个标签,row2 有 20 个标签,其中 9 个在 row1 中找到,row3 有 50 个标签,其中 8 个在 row1 中找到,则将检索 row2 和 row3,其中 row2 比 row3 更相关。
任何帮助将不胜感激
最佳答案
在 $searchstring
中包含 +
字符是强制所有标 checkout 现的原因。如果您只输入单词并省略 +
,引擎将对其结果进行排名,而不需要每个单词都存在。
看看 docs for fulltext searching in MySQL .
每个单词都有很多选项。 +
将强制在结果中的某处找到单词,-
将强制在结果中的任何地方找不到单词,~
将允许找到一个词,但如果找到,则降低结果的排名。阅读文档,它们非常有用。
关于php - 使用 PHP 和 MySQL 创建基于标签的相关链接功能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8793478/