我有一个名为 Attributes
的表,其中包含用 ItemId
标识的项目的属性名称和值包。
╔════════╦═══════╦══════════╗
║ ItemId ║ Name ║ Value ║
╠════════╬═══════╬══════════╣
║ 1 ║ color ║ green ║
║ 1 ║ mood ║ happy ║
║ 1 ║ age ║ 5 ║
║ 1 ║ type ║ A ║
║ 2 ║ color ║ blue ║
║ 2 ║ mood ║ sad ║
║ 2 ║ age ║ 5 ║
║ 2 ║ type ║ B ║
║ 3 ║ color ║ red ║
║ 3 ║ mood ║ angry ║
║ 3 ║ age ║ 5 ║
║ 3 ║ type ║ B ║
║ 4 ║ color ║ yellow ║
║ 4 ║ mood ║ whatever ║
║ 4 ║ age ║ 7 ║
║ 5 ║ color ║ green ║
║ 5 ║ mood ║ happy ║
║ 5 ║ age ║ 2 ║
║ 5 ║ type ║ D ║
╚════════╩═══════╩══════════╝
这是一个具有上述结构和数据的 SQLFiddle:http://sqlfiddle.com/#!17/08c4b/1
我想获得一组不同的属性名称列表。
ItemId
+ Name
组合是唯一的(同一项目的同一属性不能有多个值)。
在上面的例子中,这样的一组是color + mood
,因为以下总是正确的:
- 当颜色是
绿色
时,心情是快乐
- 当颜色为
红色
时,心情为生气
- 当颜色是
blue
时,心情是sad
- 当颜色是
黄色
时,心情是whatever
例如,如果有一个额外的项目具有颜色 red
和心情 happy
,这将使上述相关性无效。
另外,在这个数据集中:
年龄与类型无关,因为:
- 项目 1 的年龄为
5
,类型为A
- 项目 2 的年龄也为
5
,但类型为B
- 项目 1 的年龄为
颜色与类型无关,因为:
- 项目 1 是
绿色
并且类型为A
- 项目 5 也是
绿色
,但类型为D
- 项目 1 是
等等...
是否可以编写 SQL 语句来自动发现属性之间的这些相关性?
最佳答案
绝对有可能。一种可能不是最简单的方法就是这样。
with pairs as (
select l.*, r.name as name2, r.value as value2
from Attribute l join Attribute r on l.ItemId = r.ItemId and l.name < r.name),
counts as (
select name,name2,count(distinct value2)
from pairs l join pairs r using (name,value,name2,value2)
where l.itemid <= r.itemid group by name,value,name2)
select name,name2 from counts group by name, name2 having max(count)=1;
此版本假设缺失的属性与一切相关,这可能是也可能不是预期的。
关于sql - 查找相关属性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47175486/