sql - 查找相关属性

标签 sql postgresql

我有一个名为 Attributes 的表,其中包含用 ItemId 标识的项目的属性名称和值包。

╔════════╦═══════╦══════════╗
║ ItemId ║ Name  ║  Value   ║
╠════════╬═══════╬══════════╣
║      1 ║ color ║ green    ║
║      1 ║ mood  ║ happy    ║
║      1 ║ age   ║ 5        ║
║      1 ║ type  ║ A        ║
║      2 ║ color ║ blue     ║
║      2 ║ mood  ║ sad      ║
║      2 ║ age   ║ 5        ║
║      2 ║ type  ║ B        ║
║      3 ║ color ║ red      ║
║      3 ║ mood  ║ angry    ║
║      3 ║ age   ║ 5        ║
║      3 ║ type  ║ B        ║
║      4 ║ color ║ yellow   ║
║      4 ║ mood  ║ whatever ║
║      4 ║ age   ║ 7        ║
║      5 ║ color ║ green    ║
║      5 ║ mood  ║ happy    ║
║      5 ║ age   ║ 2        ║
║      5 ║ type  ║ D        ║
╚════════╩═══════╩══════════╝

这是一个具有上述结构和数据的 SQLFiddle:http://sqlfiddle.com/#!17/08c4b/1

我想获得一组不同的属性名称列表。 ItemId + Name 组合是唯一的(同一项目的同一属性不能有多个值)。

在上面的例子中,这样的一组是color + mood,因为以下总是正确的:

  • 当颜色是绿色时,心情是快乐
  • 当颜色为红色时,心情为生气
  • 当颜色是blue时,心情是sad
  • 当颜色是黄色时,心情是whatever

例如,如果有一个额外的项目具有颜色 red 和心情 happy,这将使上述相关性无效。

另外,在这个数据集中:

  • 年龄与类型无关,因为:

    • 项目 1 的年龄为 5,类型为 A
    • 项目 2 的年龄也为 5,但类型为 B
  • 颜色与类型无关,因为:

    • 项目 1 是绿色并且类型为A
    • 项目 5 也是绿色,但类型为D
  • 等等...

是否可以编写 SQL 语句来自动发现属性之间的这些相关性?

最佳答案

绝对有可能。一种可能不是最简单的方法就是这样。

with pairs as (
 select l.*, r.name as name2, r.value as value2
 from Attribute l join Attribute r on l.ItemId = r.ItemId and l.name < r.name),
counts as (
 select name,name2,count(distinct value2)
 from pairs l join pairs r using (name,value,name2,value2)
 where l.itemid <= r.itemid group by name,value,name2)
select name,name2 from counts group by name, name2 having max(count)=1;

此版本假设缺失的属性与一切相关,这可能是也可能不是预期的。

关于sql - 查找相关属性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47175486/

相关文章:

MySQL 连接/子查询,其中结果由外部表的多个值过滤

python - Django 'Key(field)=() is duplicated'

regex - 如何在 PostgreSQL 中匹配句子中的最后两个单词?

node.js - 如何在 Postgres URL 中指定模式名称以连接到 Heroku 上的 PostgreSQL 数据库

sql - 为什么我的 SQL SUM 在包含 NULL 值时不返回 NULL?

sql - 使用 SQL 提取 2 个日期之间的行

mysql - MYSQL中自动递增的列

php - 创建盲SQL注入(inject)漏洞

python - 值错误 : Cannot cast DatetimeIndex to dtype datetime64[us]

mysql - 复杂的 MySql 连接 - rails