MySQL 产品配对

标签 mysql sql

我的系统存储来自许多不同电子商店的产品,我需要根据它们的名称对产品进行配对。例如:

输入: MySQL 表产品

id | name                       | id_seller
1    porsche 911 red edition      1
2    red porsche 911 gt           2
3    icecream                     1

期望输出:产品 1 与产品 2 相似的建议。

在第一步中,仅根据常用词的数量提出建议就足够了 - 在这个保时捷示例中,4 个中有 3 个。

更复杂的解决方案将涉及比较单词的顺序,而不仅仅是它们的出现,但我想这不会是微不足道的。

可以仅使用 MySQL 查询及其内置函数来完成,还是必须使用任何复杂的库/附加组件?

最佳答案

这是一个SQLFiddle examplename 列中查找至少有一个常用词的产品对:

select t.id id1, t.name name1, t1.id id2, t1.name  name2 from t
join t t1
where t.id<t1.id
      AND
      t.name regexp 
        CONCAT('([[:<:]]',
               REPLACE(
                   TRIM(t1.name),
                   ' ',
                   '[[:>:]]|[[:<:]]'
               ),
               '[[:>:]])');

如果您需要查找包含至少 N 个常用词的行,您应该创建 tmp 表,将每一行拆分为单词。 Here is an example and stored procedure to do it .对于您的示例,此表如下所示:

id | name                       
1    porsche
1    911
1    red
1    edition      
2    red
2    porsche
2    911
2    gt           
3    icecream                     

在这种情况下,您可以使用以下查询来查找至少包含 N 个常用词的 ID(在这种情况下 N=3):

select t1.id,t2.id,count(*)
from tmp t1,tmp t2
where t1.id<t2.id and t1.name=t2.name
group by t1.id,t2.id having count(*)>=3

关于MySQL 产品配对,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12529936/

相关文章:

php - 使用案例更新表中的 mysql 日期字段

android.database.sqlite.SQLiteException : table X has no column named Y: , 编译时:INSERT INTO

sql - Hive 中的时间戳解析

python - 如何让我的 django 日期时间字段显示秒数

mysql - 如果存在匹配的日期和 ID 对,则合并两个表并对列求和

php - 通过引用传递 PDO 连接对象?

sql - RegExp_替换 Oracle 中某个单词列表之后的所有内容

PHP-从表单插入记录到mysql

mysql - 非重复计数查询

sql - Oracle 11g 和 SQL TOP 查询