mysql - SQL 将作者/故事关系从 Drupal 迁移到 WordPress

标签 mysql sql database wordpress drupal

我正在处理一系列 SQL (MySQL) 查询,以将网站从 Drupal 6 迁移到 WordPress(目前为 4.5.3)。我在笔记本电脑上的本地主机上运行所有查询(因此它只是将数据从一个数据库移动到另一个数据库),所以此时性能不是问题。

我在迁移作者节点和故事节点之间的关系时遇到问题。在 Drupal 中它是这样工作的:

  • 有一个文章节点。为此目的,这不是习俗。其中有 50,000 多个。
  • 有一个针对作者的自定义内容类型(因为许多作者实际上并不是 Drupal 用户,也因为它允许我们对作者页面进行更多自定义显示)。大约有 2000 个。
  • content_field_op_author 表包含以下列:vid(用于修订)、nid(用于文章节点)和 field_op_author_nid(用于作者节点)。

我尝试运行此查询以了解有多少对:

SELECT COUNT(*) FROM content_field_op_author GROUP BY nid;

这产生了 57,898 行(这对我来说很现实)。

在 WordPress 中,设置是这样的:

  • wp_posts 具有标准的帖子内容类型。已成功导入所有文章,主ID与Drupal中的节点行匹配。
  • 客座作者有一个自定义帖子类型(这是由插件运行的)。所有 ~2000 已成功导入,主 ID 也与此处 Drupal 中的节点行匹配。
  • 每位客座作者还在 wp_termswp_term_taxonomy 中作为一行存在。我创建了一个名为 user_node_id_old 的列,只是为了保留用户帖子 ID 的节点 ID。我不确定这是否有必要,但它确实存在。

我一直无法通过一些不同的查询尝试在 wp_term_relationships 中创建正确的行。

我尝试过的查询:

INSERT IGNORE INTO `wordpress`.wp_term_relationships(object_id, term_taxonomy_id)
    SELECT nid as object_id, tax.term_taxonomy_id as term_taxonomy_id
    FROM `drupal`.content_field_op_author author
    INNER JOIN `wordpress`.wp_terms t ON t.user_node_id_old = author.field_op_author_nid
    INNER JOIN `wordpress`.wp_term_taxonomy tax ON t.term_id = tax.term_id
    INNER JOIN `wordpress`.wp_posts p ON author.nid = p.Id
    WHERE field_op_author_nid IS NOT NULL
    GROUP BY object_id
;

这导致 52,754 行被添加到 wp_term_relationships,这对我来说似乎是一个奇怪的差距。

我运行此查询以尝试查找在我的 Drupal 数据库中但不在 WordPress 中的行:

SELECT DISTINCT `wordpress`.p.ID as wordpress_post_id, `wordpress`.t.name as wordpress_author_name, n.nid as drupal_id, au.title as drupal_author_name
FROM `wordpress`.wp_posts p
INNER JOIN `wordpress`.wp_term_relationships r ON r.object_id = p.ID
INNER JOIN `wordpress`.wp_term_taxonomy tax ON tax.term_taxonomy_id = r.term_taxonomy_id
INNER JOIN `wordpress`.wp_terms t ON t.term_id = tax.term_id
LEFT OUTER JOIN `drupal`.node n ON p.ID = n.nid
LEFT OUTER JOIN `drupal`.content_field_op_author a ON n.nid = a.nid
LEFT OUTER JOIN `drupal`.node au ON a.field_op_author_nid = au.nid
WHERE tax.taxonomy = 'author'
AND `wordpress`.t.name != au.title
;

这导致了 333 行。

这个我也试过:

INSERT IGNORE INTO `wordpress`.wp_term_relationships(object_id, term_taxonomy_id, user_node_id_old)
    SELECT nid as object_id, 0 as term_taxonomy_id, field_op_author_nid as user_node_id_old
    FROM `drupal`.content_field_op_author
    WHERE field_op_author_nid IS NOT NULL
    GROUP BY CONCAT(nid, field_op_author_nid)
;

这导致了 331 行。我认为这个查询对于它实际迁移的内容要准确得多,但它仍然没有得到我认为我需要的数字匹配。它似乎也与总行数的差异无关。

最佳答案

我已经确定我不匹配的至少部分原因是 Drupal 以任意顺序存储故事/作者对。它不是按字母顺序排列的,也不是按作者的节点 ID 排列的。在插入 WordPress 之前,我尝试通过多种不同的方式对插入内容进行排序后发现了这一点。

我试过这个查询,结果是 0 行。这是应该的,但我仍然有点紧张,这意味着一切都成功了:

SELECT DISTINCT `wordpress`.p.ID as wordpress_post_id, `wordpress`.t.name as wordpress_author_name, n.nid as drupal_id, au.title as drupal_author_name
FROM `wordpress`.wp_posts p
INNER JOIN `wordpress`.wp_term_relationships r ON r.object_id = p.ID
INNER JOIN `wordpress`.wp_term_taxonomy tax ON tax.term_taxonomy_id = r.term_taxonomy_id
INNER JOIN `wordpress`.wp_terms t ON t.term_id = tax.term_id
LEFT OUTER JOIN `drupal`.node n ON p.ID = n.nid
LEFT OUTER JOIN `drupal`.content_field_op_author a ON n.nid = a.nid
LEFT OUTER JOIN `drupal`.node au ON t.name = au.title
WHERE tax.taxonomy = 'author'
AND `wordpress`.t.name != au.title
;

这个查询 - 我认为 - 对作者的名字而不是它附带的 ID 进行连接,即使顺序被翻转也应该允许匹配。这种颠倒的顺序是我在之前的查询中一直注意到的——如果一个故事有多个作者,他们的顺序将在两个系统之间翻转。

关于mysql - SQL 将作者/故事关系从 Drupal 迁移到 WordPress,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38206224/

相关文章:

php - 具有多重连接、子查询和半径的高级 mysql 查询

SQL 数据项目 : Incorrect Syntax '$('

php - 如何从mysql中转义php中的空格和中断

mysql - 存储过程计算应纳税额

php - 查找 "a"行是否与 ORM 中的 "b"行有关系的最有效方法?

c# - 处理 XML 更改的好方法

mysql - 备份和恢复数据库

mysql - SQL 语法错误 near except

mysql - Rails 4 ActiveRecord - 如何查看如何解释数据库查询?

sql - Tsql,有没有办法使用行中的现有字段作为同一行中另一个字段中字符串的一部分来更新行?