python - 如何在 SQLAlchemy 中连接来自不同数据库的 2 个表?

标签 python sqlalchemy

我正在使用 python/SQLAlchemy 从 MySQL 数据库中提取数据。我有 2 个不同的主机,每个主机都有一个数据库,我需要加入 2 个表(每个主机/数据库中一个)。我该怎么做?

我正在阅读 this documentation但我得不到任何直接的帮助。连接到一个数据库非常简单:

engine = create_engine('mysql+pymysql://user:pass@host/database')

但我不确定如何使用两个引擎。

有人吗?提前致谢。

最佳答案

你可以使用 Pandas作为两个数据库之间的粘合剂。例如,

import config
import pandas as pd
import sqlalchemy as SA

engine_postgresql = SA.create_engine('postgresql+psycopg2://{u}:{p}@{h}/{d}'.format(
    u=PGUSER, p=PGPASS, h=PGHOST, d='pgtest'))
engine_mysql = SA.create_engine('mysql+mysqldb://{u}:{p}@{h}/{d}'.format(
    u=MYUSER, p=MYPASS, h=MYHOST, d='mytest'))

sql = 'SELECT col1, col2, col3 FROM tableA'
df1 = pd.read_sql(sql, con=engine_postgresql)
sql = 'SELECT col1, col2, col4 FROM tableB'
df2 = pd.read_sql(sql2, con=engine_mysql)

result = pd.merge(df1, df2, how='left', on=['col1', 'col2'])

pd.read_sql将 SQL 查询传递给数据库并返回一个 DataFrame。 pd.merge连接两个 DataFrame 并返回一个 DataFrame。

DataFrame 也可以使用 to_sql method 作为表格插入到数据库中.例如,

result.to_sql('tablename', engine_postgresql, if_exists='append')

关于python - 如何在 SQLAlchemy 中连接来自不同数据库的 2 个表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54715244/

相关文章:

python - 按 ID 分组和完整时间序列 Pandas

python - 奇怪的相似性导致空旷

python - 使用python进行频率分析

mysql - 如果使用 SqlAlchemy 在 ORM 级别模拟它们,是否需要数据库中的 FK?

Pandas read_sql 没有读取所有行

python - 如何抑制 sqlalchemy.engine.base.Engine 记录到标准输出?

python - rpy2:加载conda环境下安装的R版本,不是系统中的那个

Windows 上的 Python 2.x 和 3.x 一起使用

python - isinstance 不适用于 AppEngine 中的 Decimal

python - 蒸馏器。 env.py 中的 ModuleNotFoundError