python - 我如何确定我的数据库的连接限制应该是多少?

标签 python database sqlalchemy pylons connection-pooling

在我的组织中,创建 PostgreSQL 数据库时有 20 个连接限制作为政策问题。当使用连接池的多个应用程序同时运行时,这往往会导致交互效果不佳,因为其中许多应用程序会打开它们的全套连接并保持空闲状态。

如您所料,一旦有多个应用程序与数据库联系,我们就会耗尽连接。

池化行为在这里是一个新事物;到目前为止,我们已经通过基于 Web 的数据库网关(?!)序列化对它们的访问或根本不池化任何东西来管理池化连接。因此,我不得不一遍又一遍地解释(从字面上看,一个人在项目过程中提出了 5 份故障单)合并是如何工作的。

我想要的是以下之一:

  1. 为了更好地使用池,增加数据库可用连接数的可靠、无可争辩的理由。
    如果是这样,什么是安全限制?是否有任何理由将限制保持在 20 个?

  2. 我错的原因是我们应该缩小池的大小或完全消除它们。

就其值(value)而言,以下是发挥作用的组件。如果其中之一的配置方式相关,请权衡:

数据库:PostgreSQL 8.2。不,我们不会升级它。
Web 服务器:Python 2.7、Pylons 1.0、SQLAlchemy 0.6.5、psycopg2

  • 这很复杂,因为系统的某些方面使用手动配置的引擎使用 SQLAlchemy ORM 访问数据,而其他方面使用不同的引擎工厂(仍然是 sqlalchemy)访问数据,该引擎工厂由我的一位同事编写,将连接包装在匹配旧 PHP API 的对象。

任务运行器:Python 2.7、celery 2.1.4、SQLAlchemy 0.6.5、psycopg2

最佳答案

我认为每个并发事件需要一个连接是合理的,并且假设并发 HTTP 请求是并发执行的也是合理的。

现在,您要处理的并发 HTTP 请求的数量应该与 a) 服务器上的负载和 b) 可用的 CPU 数量成比例。如果一切顺利,每个请求都会在某处(在 Web 服务器、应用程序服务器或数据库服务器中)消耗 CPU 时间,这意味着您无法同时处理比 CPU 数量更多的请求。实际上,并非一切顺利:某些请求会在某个时刻等待 IO,并且不会消耗任何 CPU。因此,可以同时处理比 CPU 多的请求。

不过,假设您有 4 个 CPU,允许 20 个并发请求已经是相当大的负载了。我宁愿限制 HTTP 请求,也不愿增加可以并发处理的请求数。如果您发现单个请求需要多个连接,则您的应用程序存在缺陷。

所以我的建议是应对限制,并确保没有太多空闲连接(与您实际并发处理的请求数相比)。

关于python - 我如何确定我的数据库的连接限制应该是多少?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4729361/

相关文章:

sql - 电影评级数据库的新手 SQL 查询问题

mysql - 如何选择 ORM 属性的 MIN() 和文字日期时间?

database - 涉及大量磁盘 I/O 的大批量处理的并行方法

database - 编写一个 postgresql 查询,返回以 'sa' 开头并以 's' 结尾的名称列表

python - zip(*[iter(s)]*n) 在 Python 中是如何工作的?

python - 如何使用 FPDF 从 AWS 存储桶下载图像以生成 PDF?

python - 将 PyQt 与 sql orm 库(sqlalchemy、peewee 等)集成

postgresql - docker-compose:postgres 数据不持久

python - 如何在另一台计算机上打开 Tensorflow 保护程序

python - 当分离 < 1 px 时在 python 中使用 PIL 检测图像形状边缘的算法