我正在使用 IMDb 数据来查找一些选定电影的完整工作人员信息。
我有一个名为movie的表,我在其中隔离了符合我要求的电影,总共476行,其中movie_id是每部电影的唯一标识符。
我有一个名为 crew_info 的表,其中包含 movie_id、person_id 和 role_id 列。
第一步,我想创建一个新表,仅隔离那些参与过我的电影表中电影工作的人员。我想要一个不同人员的列表,因此即使同一个人参与了电影中的多部电影的制作,也不会出现重复。
我可以想到几种方法来做到这一点,但不确定是否有区别/哪一种更好。首先,我创建了一个新表:
CREATE TABLE person
(
id INTEGER PRIMARY KEY AUTOINCREMENT,
person_id INTEGER,
person_name TEXT,
person_birth INTEGER
);
现在我认为我需要执行以下操作之一:
INSERT INTO person (person_id)
SELECT DISTINCT person_id
FROM cast_info
WHERE movie_id IN
(
SELECT movie_id
FROM cast_info
INTERSECT
SELECT movie_id
FROM movie
);
或者
INSERT INTO person (person_id)
SELECT DISTINCT person_id
FROM cast_info
INNER JOIN movie
ON cast_info.movie_id=movie.movie_id;
或者
INSERT INTO person (person_id)
SELECT DISTINCT person_id
FROM cast_info
WHERE EXISTS
(
SELECT movie_id
FROM cast_info
WHERE cast_info.movie_id=movie.movie_id
);
稍后,我打算使用类似的语句,使用从其他相关表交叉查询的 person_name 和 person_birth 值来更新该表。
这些表达式会产生相同的结果吗?如果不是,哪一个效果最好?
最佳答案
您将从这三个方面获得相同的结果。我会推荐 INNER JOIN
,因为它写起来最简单。性能的提升可能总是可以忽略不计,但查询 2 和 3 将需要减少一次索引扫描。查询1将扫描cast_info两次。
要在之后更新表格,您可以执行以下操作:
UPDATE P
SET P.Person_Name = T.Person_Name
FROM Person P
INNER JOIN OtherTable T on T.Person_ID = P.Person_ID
当然,运行 SELECT
、验证您的列,然后将前两行更改为更新并充满信心地启动总是好的。
SELECT P.Person_ID, P.Person_Name, T.Person_ID, T.Person_Name
FROM Person P
INNER JOIN OtherTable T on T.Person_ID = P.Person_ID
关于sql - 使用 IN/INTERSECT、INNER JOIN 或 EXISTS 进行交叉查询?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36654888/