python - SQLAlchemy 在多线程应用程序中正确的 session 处理

标签 python multithreading session sqlalchemy

我很难理解如何有效地正确打开和关闭数据库 session ,正如我在 sqlalchemy 文档中所理解的那样,如果我使用 scoped_session 构造我的 Session 对象,然后使用返回的 Session 对象来创建 session ,它是线程安全的,所以基本上每个线程都会得到它自己的 session ,并且不会有问题。现在下面的例子工作了,我把它放在一个无限循环中,看看它是否正确关闭了 session ,如果我正确监控它(在 mysql 中通过执行“SHOW PROCESSLIST;”),连接只是不断增长,它不会关闭它们,即使我使用了 session.close(),甚至在每次运行结束时删除了 scoped_session 对象。我究竟做错了什么?我在大型应用程序中的目标是使用所需的最少数据库连接数,因为我当前的工作实现在需要它的每个方法中创建一个新 session 并在返回之前将其关闭,这似乎效率低下。

from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker, scoped_session
from threading import Thread
from Queue import Queue, Empty as QueueEmpty
from models import MyModel


DATABASE_CONNECTION_INFO = 'mysql://username:password@localhost:3306/dbname'


class MTWorker(object):

    def __init__(self, worker_count=5):
        self.task_queue = Queue()
        self.worker_count = worker_count
        self.db_engine = create_engine(DATABASE_CONNECTION_INFO, echo=False)
        self.DBSession = scoped_session(
            sessionmaker(
                autoflush=True,
                autocommit=False,
                bind=self.db_engine
            )
        )

    def _worker(self):
        db_session = self.DBSession()
        while True:
            try:
                task_id = self.task_queue.get(False)
                try:
                    item = db_session.query(MyModel).filter(MyModel.id == task_id).one()
                    # do something with item
                except Exception as exc:
                    # if an error occurrs we skip it
                    continue

                finally:
                    db_session.commit()
                    self.task_queue.task_done()
            except QueueEmpty:
                db_session.close()
                return

    def start(self):
        try:
            db_session = self.DBSession()
            all_items = db_session.query(MyModel).all()
            for item in all_items:
                self.task_queue.put(item.id)

            for _i in range(self.worker_count):
                t = Thread(target=self._worker)
                t.start()

            self.task_queue.join()
        finally:
            db_session.close()
            self.DBSession.remove()


if __name__ == '__main__':
    while True:
        mt_worker = MTWorker(worker_count=50)
        mt_worker.start()

最佳答案

您应该只调用一次 create_enginescoped_session 进程(每个数据库)。每个人都会有自己的连接或 session 池 (分别),所以你要确保你只创建 one 池。只需将其设为模块级全局即可。如果您需要比这更精确地管理 session ,您可能不应该使用 scoped_session

另一个需要做的改变是直接使用 DBSession,就好像它是一个 session 。在 scoped_session 上调用 session 方法将透明 如果需要,创建一个线程本地 session ,并将方法调用转发到 session 。

另一件需要注意的是 pool_size 的连接池,其中 默认为 5。对于许多应用程序来说,这很好,但如果您正在创建 很多线程,你可能需要调整那个参数

DATABASE_CONNECTION_INFO = 'mysql://username:password@localhost:3306/dbname'
db_engine = create_engine(DATABASE_CONNECTION_INFO, echo=False)
DBSession = scoped_session(
    sessionmaker(
        autoflush=True,
        autocommit=False,
        bind=db_engine
    )
)


class MTWorker(object):

    def __init__(self, worker_count=5):
        self.task_queue = Queue()
        self.worker_count = worker_count
# snip

关于python - SQLAlchemy 在多线程应用程序中正确的 session 处理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9619789/

相关文章:

Python 速成类(class)游戏 : Bullets not firing

ios - 无法更新 UILabel!在具有字符串值的 ViewController 中

java - 使用 PriorityBlockingQueue 提供记录的对象进行处理

php - 将用户数据从js发送到php

python - 使用 pip freeze 忽略某些包及其依赖项

python - 如何删除字符之间的空格而不删除数据框中的所有空格?

Python/Brython 类型错误 : Cannot use cached_property instance without calling __set_name__ on it

multithreading - 如何从完全不相关的类更新 ListView

php - 打印出登录用户数据匹配登录SESSION

asp.net - 如何在 ASP.NET 和 Tomcat 之间同步 session /安全?