我正在学习 git 类(class),想提一下丢失的引用在运行 git gc
之前并没有真正丢失。但是验证了一下,发现不是这样的。即使在运行 git gc --prune=all --aggressive
之后,丢失的引用仍然存在。
显然我误会了什么。在类(class)中说错话之前,我想弄清楚我的事实!这是一个示例脚本,说明了效果:
#!/bin/bash
git init
# add 10 dummy commits
for i in {1..10}; do
date > foo.txt
git add foo.txt
git commit -m "bump" foo.txt
sleep 1
done;
CURRENT=$(git rev-parse HEAD)
echo HEAD before reset: ${CURRENT}
# rewind
git reset --hard HEAD~5
# add another 10 commits
for i in {1..10}; do
date > foo.txt
git add foo.txt
git commit -m "bump" foo.txt
sleep 1
done;
此脚本将添加 10 个虚拟提交,重置为过去的 5 个提交并添加另外 10 个提交。在重置之前,它将打印当前 HEAD 的哈希值。
我期望在运行 git gc --prune=all
后丢失 CURRENT
中的对象。然而,我仍然可以在该散列上运行 git show
。
我确实明白,在运行 git reset
并添加新提交后,我实际上已经创建了一个新分支。但是我的原始分支不再有任何引用,所以它不会出现在 git log --all
中。我想它也不会被推送到任何远程。
我对 git gc
的理解是删除那些对象。似乎并非如此。
为什么? 什么时候 git gc
删除对象?
最佳答案
对于要修剪的对象,它必须满足两个 条件。一个与日期/时间相关:它必须在足够早的时间创建1,以便收集成熟。 “很久以前”部分是您使用 --prune=all
设置的:您正在覆盖正常的“至少两周前”设置。
第二个标准是您的实验哪里出错了。要被修剪,对象必须也是不可访问的。作为 twalberg noted in a comment ,通过 Git 的“reflog”条目实际上引用了每个表面上被放弃的提交(以及它们相应的树和 blob)。
每个这样的提交都有两个 reflog 条目:一个用于 HEAD
,另一个用于 HEAD
本身在提交时引用的分支名称(在这种情况下,refs/heads/master
的 reflog,即分支 master
)。每个 reflog 条目都有自己的时间戳,git gc
也会为您使 reflog 条目过期,尽管它的规则集比对象过期的简单“14 天”默认值更复杂。 2
因此,git gc
可以首先删除保留旧对象的所有 reflog 条目,然后修剪该对象。只是这里没有发生。
要手动查看甚至删除 reflog 条目,请使用 git reflog
。请注意,git reflog
通过使用 -g
/--walk- 运行
条目reflogs 选项(加上一些额外的显示格式选项)。您可以运行 git log
来显示git reflog --all --expire=all
来清除所有内容,尽管当手术刀可能更合适时,这是一个大棒。使用 --expire-unreachable
以获得更多选择性。有关更多信息,请参阅 the git log
documentation,当然还有 the git reflog
documentation。
1一些 Unix-y 文件系统根本不存储文件创建(“诞生”)时间:stat
的 st_ctime
字段> 结构是inode 更改时间,而不是创建时间。如果有创建时间,则在 st_birthtime
或 st_birthtimespec
中。3 但是,每个 Git 对象都是只读的,因此文件的创建时间也是它的修改时间。因此 st_mtime
给出了对象的创建时间, 始终可用。
2the git gc
documentation 中描述了确切的规则,但我认为默认情况下,30 天不可访问提交和 90 天可访问提交是一个不错的总结。不过,reachable 的定义在这里很不寻常:它意味着 可以从引用的当前值访问,该引用日志为该引用保存旧值。 也就是说,如果我们正在寻找在 master
的 reflog 中,我们找到 master
标识的提交(例如,1234567
),然后查看 的每个 reflog 条目master
(例如,master@{27}
)可以从该特定提交(再次是1234567
)访问。
3这种特殊的名称混淆是由 POSIX 标准化人员带给您的。 :-) st_birthtimespec
字段是一个struct timespec
,它记录秒和纳秒。
关于git - 什么时候 git prune objects : why is "git gc" not removing commits?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37733131/