我对标记数据库模式的 Toxi 解决方案有点头疼。我正在开发一个用户可以向其提交项目的系统,并且这些项目可以具有与之关联的标签。在阅读了 tagschemas 之后,我发现 Toxi 解决方案最适合我的需求。但是,我不完全确定我的计划是否正确,所以我想请教您对此的意见。
我将拥有三个数据库。
items
包含 item_id
和其他
tagmap
使用 item_id
和 tag_id
作为外键
标签
包含tag_id
和tag_text
添加新项目时,我是否可以假设将标签添加到数据库的过程如下?
- 将提交的标签排序到数组中
- 对于数组中的每个标签:
- 从 tag_text 匹配当前标签的标签中获取 tag_id
- 如果返回 0 行:
- 将标签添加到标签表
- 获取tag_id
- 将 item_id 和 tag_id 添加到 tagmap
- 完成(给用户一个好的,等等)
这意味着我们最终会在标签图中为每个项目的每个标签创建一个条目。这似乎是正确的,但我忍不住认为有一种更好的方法可以做到这一点,而不是在那里结束大量的条目......
至于编辑标签,我想到了以下过程,尽管我认为还有更好的方法我还没有找到。
- 使用 item_id 获取标签并插入可编辑字段
- 用户进行更改。提交时:
- 从 tagmap 中删除 item_id 与正在编辑的行匹配的行
- 与上面列出的过程相同
我对第 3 点有点怀疑。有没有办法让我检查是否有任何标签已被删除,这样我就可以有选择地删除标签,而不是仅仅删除并重新添加它们? 并且可以肯定的是:删除标记映射行时,相关项不会随之删除,因为它指向一个外键而不是一个外键,对吧?
此外,我可能想跟踪标签的使用次数,但我不想运行查询来计算每次需要显示标签的次数。我正在考虑让 cron 作业每小时或每两小时计算一次 tagmap 中每个 tag_id 的实例数,然后更新 tags 表中的 tag_use 值。这是正确的方法,还是有更好的方法?
回过头来看,这是相当多的文字。好吧,宁可太详细而不是遗漏信息,宁可问太多问题和学习很多新东西而不是问太少。 很有可能我今天花了太多时间研究这个问题,明天一切都会变得更有意义。
提前致谢!
最佳答案
首先“toxi”不是一个标准术语。始终定义您的条款!或者至少提供相关链接。
现在回到问题本身......
I'll have three databases.
不,您将有 3 个表。
When adding a new item...
除了您可以使用 SQL 的基于集合的特性来“合并”其中的许多步骤之外,您几乎走在了正确的轨道上。例如,用标签标记项目 1:'tag1'、'tag2' 和 'tag3' 可以像这样完成...
INSERT IGNORE INTO tagmap (item_id, tag_id)
SELECT 1, tag_id FROM tags WHERE tag_text IN ('tag1', 'tag2', 'tag3');
IGNORE
允许此操作成功,即使 item 已经连接到其中一些标签。
这假设所有必需的标签都已在 tags
中。假设 tag.tag_id
是自动递增的,你可以做这样的事情来确保它们是:
INSERT IGNORE INTO tags (tag_text) VALUES ('tag1'), ('tag2'), ('tag3');
This means we'll end up with an entry in the tagmap for every tag for every item. It seems correct, but I can't help but think there's a better way to do that then ending up with a huge amount of entries there...
没有魔法。如果“项目连接到特定标签”是您要记录的知识片段,那么它必须在数据库中具有某种物理表示。
As for editing the tags...
你的意思是重新标记项目(而不是修改标签本身)?
要删除所有不在列表中的标签,请执行以下操作:
DELETE FROM tagmap
WHERE
item_id = 1
AND tag_id NOT IN (
SELECT tag_id FROM tags
WHERE tag_text IN ('tag1', 'tag3')
);
这将断开项目与除“tag1”和“tag3”之外的所有标签的连接。依次执行上面的 INSERT 和这个 DELETE 以“覆盖”添加和删除标签。
您可以在 SQL Fiddle 中使用所有这些.
And just to be sure: when deleting tagmap rows, the related items won't be deleted with it because it points to a foreign key instead of acting as one, right?
正确。 FK 的子端点不会触发引用操作(例如 ON DELETE CASCADE),只有父端点会。
顺便说一句,您使用此架构是因为您需要在 tags
中添加其他字段(在 tag_text
旁边),对吗?如果您这样做了,则不会因为所有连接都消失而丢失这些额外数据,这是理想的行为。
但是如果您只想要 tag_text
,您可以使用更简单的架构,其中删除所有连接与删除标签本身相同:
这不仅会简化 SQL,还会提供更好的 clustering .
乍一看,“toxi”可能看起来像是在节省空间,但实际上可能并非如此,因为它需要额外的表和索引(而且标签往往很短)。
Also, I may want to keep track of the amount of times a tag ... cron job ...
在你决定做这样的事情之前先测量一下。上面提到的我的 SQL Fiddle 在 tagmap
PK 中使用了非常谨慎的字段顺序,因此数据以对这种计数非常友好的方式聚集(记住:InnoDB tables are clustered)。在这成为问题之前,您必须拥有真正大量的项目(或需要异常高性能)。
无论如何,衡量的是真实的数据量!
关于mysql - 标记系统 : Toxi solution questions,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10506181/