mysql - 使数千个 SELECT 查询更快

情况

使用 Python 3.7.2
我已阅读过服务器上具有 5M 行的 MariaDB 表的特权。
我有一个包含 7K 整数的本地文本文件，每行一个。
整数代表表的 IDX。
表的 IDX 列是主键。 (所以我想它会自动索引？)

问题

我需要选择 IDX 位于文本文件中的所有行。

我的努力

版本 1

进行 7K 次查询，文本文件中的每一行一个查询。这使得每秒大约 130 个查询，大约需要 1 分钟才能完成。

import pymysql
connection = pymysql.connect(....)
with connection.cursor() as cursor:
    query = (
        "SELECT *"
        " FROM TABLE1"
        " WHERE IDX = %(idx)s;"
    )

    all_selected = {}
    with open("idx_list.txt", "r") as f:
        for idx in f:
            idx = idx.strip()
            if idx:
                idx = int(idx)
                parameters = {"idx": idx}
                cursor.execute(query, parameters)
                result = cursor.fetchall()[0]
                all_selected[idx] = result

版本 2

选择整个表，迭代光标并挑选行。 .fetchall_unbuffered() 上的 for 循环每秒处理 30-40K 行，整个脚本大约需要 3 分钟才能完成。

import pymysql
connection = pymysql.connect(....)
with connection.cursor() as cursor:
    query = "SELECT * FROM TABLE1"

    set_of_idx = set()
    with open("idx_list.txt", "r") as f:
        for line in f:
            if line.strip():
                line = int(line.strip())
                set_of_idx.add(line)


    all_selected = {}
    cursor.execute(query)
    for row in cursor.fetchall_unbuffered():
        if row[0] in set_of_idx:
            all_selected[row[0]] = row[1:]

预期行为

我需要更快地选择，因为文本文件中的 IDX 数量将来会增长到 10K-100K。

我查阅了其他答案，包括this ，但我无法使用它，因为我只有读取权限，因此无法创建另一个表来加入。

那么如何才能更快地进行选择呢？

最佳答案

临时表的实现如下所示:

connection = pymysql.connect(....,local_infile=True)
with connection.cursor() as cursor:
    cursor.execute("CREATE TEMPORARY TABLE R (IDX INT PRIMARY KEY)")
    cursor.execute("LOAD DATA LOCAL INFILE 'idx_list.txt' INTO R")
    cursor.execute("SELECT TABLE1.* FROM TABLE1 JOIN R USING ( IDX )")
    ..
    cursor.execute("DROP TEMPORARY TABLE R")

关于mysql - 使数千个 SELECT 查询更快，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54900574/

mysql - 使数千个 SELECT 查询更快

情况

问题

我的努力

版本 1

版本 2

预期行为

上一篇：MySQL 追加到 JSON 字段

下一篇：mysql - 将 COUNT 与 CASE 结合使用，如何对结果列进行排序？