Git - 重写所有受影响的提交用户电子邮件 - 不适用于事件

标签 git gitlab commit git-filter-branch

两年来,我对 Gitlab 上的许多存储库进行了大量提交。但是我意识到我没有设置正确的电子邮件。

我使用 git filter-branch 来过滤历史记录并更改用户电子邮件。

$ git filter-branch --env-filter '
OLD_EMAIL="old@example.com"
NEW_NAME="New Example"
NEW_EMAIL="new@example.com"
if [ "$GIT_COMMITTER_EMAIL" = "$OLD_EMAIL" ]
then
  export GIT_COMMITTER_NAME="$NEW_NAME"
  export GIT_COMMITTER_EMAIL="$NEW_EMAIL"
fi
if [ "$GIT_AUTHOR_EMAIL" = "$OLD_EMAIL" ]
then
  export GIT_AUTHOR_NAME="$NEW_NAME"
  export GIT_AUTHOR_EMAIL="$NEW_EMAIL"
fi
' --tag-name-filter cat -- --branches --tags

然后我使用 git push --force 强制推送这些更改。 它更新主分支上的贡献者。

git push --force --tags origin 'refs/heads/master' 之后,它也改变了标签上的贡献者。

问题:
它不会更改事件页面上的提交。转到 {Repository} > Project information > activity(显示更新的贡献者)但点击任何提交编号 --> 它加载一个没有更新的贡献者的提交。

问题:
如何重写正确的历史记录,包括在事件日志中发布的提交。

最佳答案

事件流是不可变的

不幸的是,事件提要直接来自数据库事件记录,并且一旦创建记录就与 git 完全分离。据我所知,除非您具有数据库级别的访问权限,否则无法删除事件提要中的条目。

但是,可以使用 git-filter-repo 并运行存储库清理来完全删除这些提交,这样它们就可以“在 GitLab 中查看。这些链接仍将存在于事件提要中,但当您尝试查看重写/删除的提交 SHA 时,您将获得 404 页面。

另一种可能的解决方法是完全删除事件提要——做 这个,只需导出您的项目,然后导入它。如果您推送 git-filter-repo 更改之前这样做,那么所有提交的所有事件都将显示为您推送这些更改的时间戳:

activity after pushing filter repo

如果您在之后执行此操作,则提要中将根本没有任何事件:

import fresh with no activity log

来自 GitLab 的深度清理引用

除了分支上的提交之外,GitLab 还保留(额外的)内部引用,这些引用通常在您克隆本地 git 存储库时不存在。包括 merge 请求、管道、注释和其他地方的引用。即使您更新了 refs/heads/*,您也可能需要更新 Remote 上的其他 refs 才能看到更改在不同地方生效。

这会破坏某些 UI 页面并可能导致数据丢失,但这是除了删除和重新创建项目之外让 GitLab 完全删除旧引用的唯一方法。

在开始之前通过导出备份您的存储库

要彻底改变事物,您还需要改变这些引用:

refs/merge-requests/* for merge requests.
refs/pipelines/* for pipelines.
refs/environments/* for environments.
refs/keep-around/* are created as hidden refs to prevent commits referenced in the database from being removed

不幸的是,GitLab 不允许您直接访问其中一些“stash 的引用”。要完全删除这些引用,您必须将项目导出到 tarball 并从 tarball 恢复本地 git repo,然后再次应用过滤器,并推送到远程。

导出您的项目,然后在压缩包中有一个 project.bundle 文件。

git clone --bare --mirror ./project.bundle myrepo
cd myrepo

然后 use git-filter-repo彻底改变所有地方的电子邮件。

# replace with your actual filter-repo command needed
git filter-repo --name-callback '...' --email-callback '...' --commit-callback '...'

然后强制推回所有引用,包括 stash 的引用:

# reset the origin
git remote remove origin
git remote add origin https://gitlab.example.com/<namespace>/<project_name>.git

# push all refs
git push origin --force 'refs/heads/*'

# tags
git push origin --force 'refs/tags/*'

# prevent dead links to commits that no longer exist
git push origin --force 'refs/replace/*'

在此之后,您需要使用 git filter-repo 生成的 commit-map 初始化存储库清理。它位于 ./filter-repo/commit-map 的 repo 中。它看起来像这样:

$ cat filter-repo/commit-map
old                                      new
87c5016db64c6e8f4fc0feba4810b17c2c2222b5 2bb77407040e8a658eceacdf3034d24cedcc1ecd
cea6d9aa25e52dd755b694876a482a158debc60a 9a9b1d1a845d1096f4d3734191f883b52ffac6e9
5f1ac8c5fa47ac393d5e3f24b4b9812aaefbf5d7 b659497ed15ab0a3191dc5c6451c9440ca10d6e4

有了提交映射,转到设置 -> 存储库 -> 清理并上传 commit-map 文件。您会看到一条消息:

Repository cleanup has started. You will receive an email once the cleanup operation is complete.

一段时间后(取决于 repo 大小),旧的提交应该完全消失。

如前所述,在事件提要中,指向旧提交的链接仍然在那里:

activity feed

但是如果你点击链接,提交本身现在会产生一个 404 并且不能在 GitLab 中查看(永远消失!):

commit 404 link

关于Git - 重写所有受影响的提交用户电子邮件 - 不适用于事件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70286373/

相关文章:

git - 项目 repo 中的 Vagrantfile,良好的 Vagrant 工作流程?

Git "efrror: RPC failed; result=55, HTTP code = 0"推送

database - 两阶段提交会导致什么问题?

git - 是否可以防止 git 立即删除已删除分支的 reflog?

Git 跟踪点文件(例如 : . zshrc)

jenkins - 客户端错误 : HTTP 302 Found, Jenkins 连接到 Gitlab

java - Maven 在 Docker 容器内下载时挂起

git - 无法从 gitlab 克隆项目

git - merge 后如何跟踪提交的来源?

git - git revert 后回滚到原始状态