python - 如何提高包含 sqlalchemy 查询语句作为条件的循环的速度

标签 python sqlite sqlalchemy

这个循环检查一条记录是否在 sqlite 数据库中,并为那些丢失的记录构建一个字典列表,然后使用该列表执行多个插入语句。这有效但它非常慢(至少我认为它很慢)因为它需要 5 分钟来循环超过 3500 个查询。我是 python、sqlite 和 sqlalchemy 的新手,所以我想知道是否有更快的方法。

list_dict = []

session = Session()

for data in data_list:
    if session.query(Class_object).filter(Class_object.column_name_01 == data[2]).filter(Class_object.column_name_00 == an_id).count() == 0:
        list_dict.append({'column_name_00':a_id,
                          'column_name_01':data[2]})

conn = engine.connect()
conn.execute(prices.insert(),list_dict)
conn.close()
session.close()

编辑:我将 session = Session() 移到了循环之外。没有影响。

解决方案:

感谢 mcabral 的回答,我将代码修改为:

existing_record_list = []
list_dict = []

conn = engine.connect()
s = select([prices.c.column_name_01], prices.c.column_name_00==a_id)
result = conn.execute(s) 
for row in result:       
    existing_record_list.append(row[0])

for data in raw_data['data']:
    if data[2] not in existing_record_list:
        list_dict.append({'column_name_00':a_id,
                          'column_name_01':data[2]}

conn = engine.connect()
conn.execute(prices.insert(),list_dict)
conn.close()

现在这需要 6 秒。这是一些改进!!

最佳答案

3500 次查询似乎是一个很大的数字,

您是否考虑过在一个查询中获取所有实体?然后您将遍历内存中的列表,而不是为每个项目查询数据库。

关于python - 如何提高包含 sqlalchemy 查询语句作为条件的循环的速度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2603905/

相关文章:

python - os.getuid() 和 os.geteuid() 有什么区别?

python - 如何将请求响应与请求映射?

python - SQLAlchemy hybrid_property 和表达式

python - 为什么python的递归复制和命令行不一样?

node.js - 迭代如何等待 Node.js 中的 sqlite3 查询?

c# - 如何组织自定义 SQl 查询集合

android - 使用 ContentResolver 选择 SQLite DB 中两个日期之间的数据?

python - 批量保存复杂对象 SQLAlchemy

python - 如何检查是否需要生成Alembic迁移?

python - 使用 CNN 和 RNN 进行图像序列训练