php - 多重引用的数据类型是什么?

标签 php mysql database performance pdo

我需要最快的性能方式来检索需要快速提取的整数。这是我的用例:我的网站上有一个“排序/过滤器”选项。我有狗的属性,如长毛、短毛、大、狗等...我希望用户能够按狗的属性进行过滤。

这是我的表格:

dogs
- id
- attributes

这里是关于狗的属性的引用(对问题来说不是很重要,只是给你一个想法):

0 = adoptable pet
1 = short hair
2 = long hair
3 = fluffy
4 = black
5 = brown
6 = white
7 = golden/yellow
8 = etc...

现在,我将属性保存在 JSON 格式的 TEXT 数据类型中。例如,["0","4"]["0"]["2"]

所以我想像这样选择所有属性:

SELECT * FROM dogs WHERE attributes LIKE %0% OR attributes LIKE %1% OR attributes LIKE %4% attributes LIKE %7%

如何选择属性包含 0、1、4 或 7(不是和)的所有行。如果一行具有这些属性之一,请选择它们。

处理它的最佳方法是什么?我应该在 MySQL 中存储为 JSON 数据类型还是应该做其他事情?我希望能够 SELECT 并快速将其拉起。我觉得我的 LIKE 不会很快。

什么是最好和最快的方法,尤其是在数十万到数百万行的情况下?

先谢谢你!

最佳答案

逗号分隔列表是一个有问题的反模式。 (Bill Karwin 在他的《SQL AntiPatterns:避免数据库编程的陷阱》一书中做了精彩的介绍,所以我不打算深入讨论为什么我们要避免这种情况。相反,我将跳入一个经过验证的通常用于实现多值属性的模式。)


规范的关系模式是创建一个表,每行有一个属性。例如这样的事情:

CREATE TABLE dog_attribute 
( dog_id  int not null comment 'fk ref dog.id'
, attr    int not null comment '1=adoptable, 2=...'
, PRIMARY KEY (dog_id, attr) 
, CONSTRAINT FK_dog_attribute_dog FOREIGN KEY dog_id REFERENCES dog (id)
  ON UPDATE CASCADE ON DELETE CASCADE
, UNIQUE KEY dog_attribute_UX (attr, dog_id)
);

--

要为给定的 dog_id 添加三个属性,我们添加三行:

INSERT INTO dog_attibute (dog_id, attr) VALUES
 (1,2)
,(1,3)
,(1,5)

--

有几种可能的查询模式。作为几个简单的例子:

要找到同时具有属性 2 和属性 3 的 dog_id,我们可以这样做:

SELECT da.dog_id 
  FROM dog_attribute da
 WHERE da.attr IN (2,3) 
 GROUP
    BY da.dog_id 
HAVING COUNT(1) = 2 

还有其他查询模式可以给出相同的结果,例如

SELECT da.dog_id 
  FROM dog_attribute da
  JOIN dog_attribute dd
    ON dd.dog_id = da.dog_id 
   AND dd.attr = 3
 WHERE da.attr = 2

可以扩展第一个查询模式以查找至少具有两个给定属性集的 dog_id。例如

 WHERE da.attr IN (2,3,5,7)

HAVING COUNT(1) >= 2

可以扩展第二个查询,为单个属性添加连接和反连接,

--

要查找具有属性 2 且具有属性 3 和 4 中的一个(或两者)且既不具有属性 7 也不具有属性 8 的行,我们可以这样做:

SELECT da.dog_id 
  FROM dog_attribute da
  LEFT
  JOIN dog_attribute dn 
    ON dn.dog_id = da.dog_id 
   AND dn.attr IN (7,8) 
 WHERE dn.dog_id IS NULL 
   AND da.attr = 2
   AND EXISTS ( SELECT 1 
                  FROM dog_attribute de
                 WHERE de.dog_id = da.dog_id 
                   AND de.attr IN (3,4)
              )

(反加入以排除具有属性 7 的 dog_id,...)


如果我不能实现上面演示的表格模式,...如果我绝对必须使用逗号分隔列表,将多个属性保存在一个列中...对于一个小的静态属性集(定义在表定义,不是动态添加或删除)我会使用 MySQL SET 数据类型。

https://dev.mysql.com/doc/refman/8.0/en/set.html

 attributes  SET('','adoptable','short hair','long hair','fluffy','black','brown','white','golden')

要查询它,我们可以这样做:

WHERE FIND_IN_SET('black',t.attributes)
  AND FIND_IN_SET('long hair',t.attributes)

关于php - 多重引用的数据类型是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54638853/

相关文章:

PHP 未定义索引

php - Wordpress 2015 主题 : Space on top of page. 找不到相关的 css

php - 使用字符串调用 php 方法

PHP:使用 LIKE 选择器时防止 SQL 注入(inject)

c# - 如何为我的用户自己的电脑设置自己的 MySQL 数据库

android - 离线到在线同步数据库

php - CakePHP 3.x : Query to exclude records in which a field can be either NULL or empty ('' )

MYSQL:子查询到主查询中更新的表

php - 表中每一列中的每个匹配项都将存储在数组中

mysql - 备份非常大的 MySQL 数据库