git - 什么时候 git prune objects : why is "git gc" not removing commits?

标签 git git-gc

我正在学习 git 类(class),想提一下丢失的引用在运行 git gc 之前并没有真正丢失。但是验证了一下,发现不是这样的。即使在运行 git gc --prune=all --aggressive 之后,丢失的引用仍然存在。

显然我误会了什么。在类(class)中说错话之前,我想弄清楚我的事实!这是一个示例脚本,说明了效果:

 #!/bin/bash

 git init

 # add 10 dummy commits
 for i in {1..10}; do
     date > foo.txt
     git add foo.txt
     git commit -m "bump" foo.txt
     sleep 1
 done;

 CURRENT=$(git rev-parse HEAD)
 echo HEAD before reset: ${CURRENT}

 # rewind
 git reset --hard HEAD~5

 # add another 10 commits
 for i in {1..10}; do
     date > foo.txt
     git add foo.txt
     git commit -m "bump" foo.txt
     sleep 1
 done;

此脚本将添加 10 个虚拟提交,重置为过去的 5 个提交并添加另外 10 个提交。在重置之前,它将打印当前 HEAD 的哈希值。

期望在运行 git gc --prune=all 后丢失 CURRENT 中的对象。然而,我仍然可以在该散列上运行 git show

我确实明白,在运行 git reset 并添加新提交后,我实际上已经创建了一个新分支。但是我的原始分支不再有任何引用,所以它不会出现在 git log --all 中。我想它也不会被推送到任何远程。

我对 git gc 的理解是删除那些对象。似乎并非如此。

为什么? 什么时候 git gc 删除对象?

最佳答案

对于要修剪的对象,它必须满足两个 条件。一个与日期/时间相关:它必须在足够早的时间创建1,以便收集成熟。 “很久以前”部分是您使用 --prune=all 设置的:您正在覆盖正常的“至少两周前”设置。

第二个标准是您的实验哪里出错了。要被修剪,对象必须不可访问的。作为 twalberg noted in a comment ,通过 Git 的“reflog”条目实际上引用了每个表面上被放弃的提交(以及它们相应的树和 blob)。

每个这样的提交都有两个 reflog 条目:一个用于 HEAD,另一个用于 HEAD 本身在提交时引用的分支名称(在这种情况下,refs/heads/master 的 reflog,即分支 master)。每个 reflog 条目都有自己的时间戳,git gc 也会为您使 reflog 条目过期,尽管它的规则集比对象过期的简单“14 天”默认值更复杂。 2

因此,git gc可以首先删除保留旧对象的所有 reflog 条目,然后修剪该对象。只是这里没有发生。

要手动查看甚至删除 reflog 条目,请使用 git reflog。请注意,git reflog 通过使用 -g/--walk- 运行 git log 来显示 条目reflogs 选项(加上一些额外的显示格式选项)。您可以运行 git reflog --all --expire=all 来清除所有内容,尽管当手术刀可能更合适时,这是一个大棒。使用 --expire-unreachable 以获得更多选择性。有关更多信息,请参阅 the git log documentation,当然还有 the git reflog documentation


1一些 Unix-y 文件系统根本不存储文件创建(“诞生”)时间:statst_ctime 字段> 结构是inode 更改时间,而不是创建时间。如果有创建时间,则在 st_birthtimest_birthtimespec 中。3 但是,每个 Git 对象都是只读的,因此文件的创建时间也是它的修改时间。因此 st_mtime 给出了对象的创建时间, 始终可用。

2the git gc documentation 中描述了确切的规则,但我认为默认情况下,30 天不可访问提交和 90 天可访问提交是一个不错的总结。不过,reachable 的定义在这里很不寻常:它意味着 可以从引用的当前值访问,该引用日志为该引用保存旧值。 也就是说,如果我们正在寻找在 master 的 reflog 中,我们找到 master 标识的提交(例如,1234567),然后查看 的每个 reflog 条目master(例如,master@{27})可以从该特定提交(再次是1234567)访问。

3这种特殊的名称混淆是由 POSIX 标准化人员带给您的。 :-) st_birthtimespec 字段是一个struct timespec,它记录秒和纳秒。

关于git - 什么时候 git prune objects : why is "git gc" not removing commits?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37733131/

相关文章:

git - 如何为 git 提交消息设置模式?

linux - git gc : no space left on device, 即使可用 3GB 而 tmp_pack 只有 16MB

c++ - 在使用 git 的企业 C++ 项目中管理 Makefile

git - 确定是什么阻止了从 git 中删除提交

multithreading - git gc 的线程数取决于 repo 大小

python - 如何将代码从 Git 更新到 Docker 容器

git - SCM与SVN的区别

git - 如何真正删除一个 git 分支(即删除它的所有对象/提交)?

git - 使用另一个分区进行临时 git 操作 (git gc)