python - sqlalchemy 如何与 automap_base 生成(多对多)关系

标签 python orm sqlalchemy many-to-many

作为背景:我正在基于现有数据库的架构创建 ORM。 - 这是因为 python 应用程序不会是所述数据库的“所有者”。

现在在这个数据库中有一个名为“task”的表和一个名为“task_notBefore__task_relatedTasks”的表——后者是“task”表中不同条目之间的多对多关系。

现在 automap_base()具有对这些关系的自动检测,如 here 所述.然而,这对我的情况来说失败了,并且没有建立任何关系。

然后我尝试手动创建关系:

from sqlalchemy.ext.automap import automap_base
from sqlalchemy.ext.automap import generate_relationship
from sqlalchemy.orm import sessionmaker, interfaces, relationship
from sqlalchemy import create_engine

class DBConnection:
    def __init__(self, connection_url, **kwargs):
        self.engine = create_engine(connection_url, **kwargs)
        self._Base = automap_base()

        self._Base.prepare(self.engine, reflect=True)

        self.Task = self._Base.classes.task
        self.Order = self._Base.classes.order
        self.Poller = self._Base.classes.poller

        rel = generate_relationship(self._Base, interfaces.MANYTOMANY, relationship, 'related', self.Task, self.Task,
                                    secondary=self._Base.classes.task_notBefore__task_relatedTasks, backref='notBefore')

        self._Session = sessionmaker()
        self._Session.configure(bind=self.engine)

        self.session = self._Session()

然而,这仍然没有“做”任何事情:它没有向 self.Task 添加任何内容。 “类(class)”。

怎么做呢?

最佳答案

在这种情况下,主要问题不仅是多对多关系,而且是一种自我参照的多对多关系。因为 automap只是将映射的类名称转换为关系名称,它构造相同的名称,例如task_collection , 对于关系的两个方向,命名冲突会产生错误。 automap的这个缺点感觉很重要,因为这种自我参照,多对多的关系并不少见。

使用您自己的名字显式添加您想要的关系并不能解决问题,因为 automap仍会尝试创建 task_collection关系。为了解决这个问题,我们需要覆盖task_collection .

如果您同意保留名称 task_collection对于关系的前向方向,我们可以简单地预先定义关系——为 backref 指定我们想要的任何名称。 .如 automap发现预期的属性已经到位,它会假设关系被覆盖,而不是尝试添加它。

这是一个精简的示例,以及 sqlite用于测试的数据库。

Sqlite 数据库

CREATE TABLE task (
    id INTEGER, 
    name VARCHAR,
    PRIMARY KEY (id)
);

CREATE TABLE task_task (
    tid1 INTEGER,
    tid2 INTEGER,
    FOREIGN KEY(tid1) REFERENCES task(id),
    FOREIGN KEY(tid2) REFERENCES task(id)
);

-- Some sample data
INSERT INTO task VALUES (0, 'task_0');
INSERT INTO task VALUES (1, 'task_1');
INSERT INTO task VALUES (2, 'task_2');
INSERT INTO task VALUES (3, 'task_3');
INSERT INTO task VALUES (4, 'task_4');

INSERT INTO task_task VALUES (0, 1);
INSERT INTO task_task VALUES (0, 2);

INSERT INTO task_task VALUES (2, 4);
INSERT INTO task_task VALUES (3, 4);

INSERT INTO task_task VALUES (3, 0);

将其放入名为 setup_self.sql 的文件中, 我们可以做的:
sqlite3 self.db < setup_self.sql

Python代码
from sqlalchemy.ext.automap import automap_base
from sqlalchemy.orm import Session
from sqlalchemy import create_engine

from sqlalchemy import Table, Column, Integer, ForeignKey
from sqlalchemy.orm import relationship
from sqlalchemy.ext.declarative import declarative_base

DeclBase = declarative_base()

task_task = Table('task_task', DeclBase.metadata,
                  Column('tid1', Integer, ForeignKey('task.id')),
                  Column('tid2', Integer, ForeignKey('task.id')))

Base = automap_base(DeclBase)

class Task(Base):
    __tablename__ = 'task'

    task_collection = relationship('Task', 
                                   secondary=task_task, 
                                   primaryjoin='Task.id==task_task.c.tid1',
                                   secondaryjoin='Task.id==task_task.c.tid2',
                                   backref='backward')

engine = create_engine("sqlite:///self.db")

Base.prepare(engine, reflect=True)

session = Session(engine)

task_0 = session.query(Task).filter_by(name ='task_0').first()
task_4 = session.query(Task).filter_by(name ='task_4').first()

print("task_0.task_collection = {}".format([x.name for x in task_0.task_collection]))
print("task_4.backward        = {}".format([x.name for x in task_4.backward]))

结果
task_0.task_collection = ['task_1', 'task_2']
task_4.backward        = ['task_2', 'task_3']

使用不同的名称

如果你想有一个不是 task_collection 的名字,您需要使用 automap用于覆盖集合关系名称的函数:
name_for_collection_relationship(base, local_cls, referred_cls, constraint)

参数 local_clsreferred_cls是映射表类的实例。对于自引用、多对多的关系,它们都是同一个类。我们可以使用这些参数来构建一个允许我们识别覆盖的键。

这是此方法的示例实现。
from sqlalchemy.ext.automap import automap_base, name_for_collection_relationship
from sqlalchemy.orm import Session
from sqlalchemy import create_engine

from sqlalchemy import Table, Column, Integer, ForeignKey
from sqlalchemy.orm import relationship
from sqlalchemy.ext.declarative import declarative_base


DeclBase = declarative_base()

task_task = Table('task_task', DeclBase.metadata,
                  Column('tid1', Integer, ForeignKey('task.id')),
                  Column('tid2', Integer, ForeignKey('task.id')))

Base = automap_base(DeclBase)

class Task(Base):
    __tablename__ = 'task'

    forward = relationship('Task', 
                           secondary=task_task, 
                           primaryjoin='Task.id==task_task.c.tid1',
                           secondaryjoin='Task.id==task_task.c.tid2',
                           backref='backward')


# A dictionary that maps relationship keys to a method name
OVERRIDES = {
    'Task_Task' : 'forward'
    }

def _name_for_collection_relationship(base, local_cls, referred_cls, constraint):

    # Build the key
    key = '{}_{}'.format(local_cls.__name__, referred_cls.__name__)

    # Did we have an override name?
    if key in OVERRIDES:
        # Yes, return it
        return OVERRIDES[key]

    # Default to the standard automap function
    return name_for_collection_relationship(base, local_cls, referred_cls, constraint)


engine = create_engine("sqlite:///self.db")

Base.prepare(engine, reflect=True, name_for_collection_relationship=_name_for_collection_relationship)

请注意覆盖 name_for_collection_relationship只需更改 automap 的名称即可用于关系。在我们的例子中,该关系仍由 Task 预先定义。 .但是,覆盖告诉 automap寻找forward而不是 task_collection ,它找到并因此停止定义关系。

考虑的其他方法

在某些情况下,如果我们可以覆盖关系名称而不必预先定义实际关系,那就太好了。首先考虑,这应该可以使用 name_for_collection_relationship .但是,由于两个原因的组合,我无法将这种方法用于自我参照的多对多关系。
  • name_for_collection_relationship及相关 generate_relationship被调用两次,对于多对多关系的每个方向调用一次。在这两种情况下,local_clsreferred_cls是相同的,因为自我参照。此外,name_for_collection_relationship 的其他参数是有效等效的。因此,我们无法从函数调用的上下文中确定我们要覆盖的方向。
  • 这是问题中更令人惊讶的部分。看来我们甚至不能指望一个方向先于另一个方向发生。换句话说,两次调用 name_for_collection_relationshipgenerate_relationship非常相似。实际决定关系方向性的参数是constraint ,这是关系的两个外键约束之一;这些约束被加载,来自 Base.metadata , 变成一个名为 m2m_const 的变量.问题就在这里。约束在 m2m_const 中结束的顺序是不确定的,即有时它是一个订单;其他时候则相反(至少在使用 sqlite3 时)。因此,关系的方向性是不确定的。

  • 另一方面,当我们预先定义关系时,以下参数创建了必要的确定性。
    primaryjoin='Task.id==task_task.c.tid1',
    secondaryjoin='Task.id==task_task.c.tid2',
    

    特别值得注意的是,我实际上试图创建一个解决方案,它只是覆盖关系名称而不预先定义它。它表现出所描述的不确定性。

    最后的想法

    如果您有合理数量的不经常更改的数据库表,我建议您只使用 Declarative Base .设置可能需要更多的工作,但它可以为您提供更多控制权。

    关于python - sqlalchemy 如何与 automap_base 生成(多对多)关系,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49053739/

    相关文章:

    python - 为什么即使没有引用大对象,Python 2 也会消耗大量内存?

    android - 如何在 Android 中更新 DBFlow?

    java - osgi 的好 orm

    python - Python 3 中的意外导入行为

    python - 如何将标记化数据帧转换为字符串以生成词云

    带 { } 的 python 格式函数

    java - FindBy 在 JPA 中使用外键

    python - 在 Pyramid 应用程序中记录到 SQLAlchemy 记录器

    python - 带有外连接的 sqlalchemy 中的 Order_by

    postgresql - Sqlalchemy 和 pgpool-II - OperationalError