我正在尝试提出一个关系模型和数据库实现,但不断遇到这个问题。但我什至不知道该叫什么!改进标题的建议将不胜感激。
我试图将问题归结为基本问题。
简化示例:
这是 MySQLWorkbench 图表:
如您所见,问题全部出在 Atom
表上。
期望目标概述:
- 我需要存储特定蛋白质原子的数据
- 我可能有某些原子的数据,也可能没有任何原子的数据
- 我不希望能够插入垃圾数据 - 我希望数据库约束能够防止这种情况发生
我不确定的是:
- 是否应该有一个
Atom
表——Atom_ref
和Residue
之间的连接似乎会生成蛋白质的所有原子-- 但我还需要存储有关原子的数据
问题概要:
- 每个原子需要一个残基和一个atom_ref
- 但是由于残基与残基引用相关联,因此原子引用只能是关联的(与残基引用)原子引用之一
- 不知道如何将Residue的residue_ref与atom_ref的residual_ref匹配
到目前为止我已经尝试过:
- 将
Atom_ref
的 pk 添加到Atom
的 pk 中 - 但随后残基引用可能与Residue
的不匹配 - 将
Residue.rr_name
更改为 pk 的一部分 - 违反了域语义
我知道这对问题的解释很糟糕,我正在尝试如何更清楚地解释它!非常欢迎提出改进建议!
最佳答案
如果我理解正确,那么您所追求的是 (a) Atom 和 Residue 的连接与 (b) Atom_ref 之间的包含依赖关系。 (即 Atom 中的所有原子名称,与残差中为其定义的 rr_name 相结合,必须声明为有效组合,即必须出现在 Atomref 中)。
仅使用 RI/FK 来实现此目的的方法是将 rr_name 冗余地包含在 Atom 中。将 FK 从 Atom 扩展到 Residue 到所有三列。这将保证Atom中记录的rr_names与Residue中的信息保持一致。但是由于您现在已经在 Atom 中引入了 rr_name,因此您现在可以确保(通过从 Atom 到 Atom_ref 的 FKatomname+rrname)Atom 中记录的任何内容也与已声明的原子名称一致(在 Atomref 中)存在于所涉及的残基引用中。
请注意,此“解决方案”使更新数据库变得更加困难(需要维护更多冗余,从而导致更多违规可能性),因为您刚刚降低了设计的 NF 级别。
另一种方法是保持设计不变,并通过对每个涉及的表(其中更新可能会导致违反业务规则)的适当触发器强制执行约束。也就是说,对 Atom_ref 进行删除和更新(即,任何导致有效存在于某处的有效组合消失的任何事情),对 Residue 进行(rr_name 的)更新,以及对 Atom 进行插入和更新(即,任何可能导致出现某些组合的事情)。组合可能无效)。
关于sql - 实现关系数据模型: what are the constraints for this table?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7932870/