git - 如何在git中找到所有更改行的先前作者?

标签 git scripting git-diff git-blame

给定一系列提交,比如说 HEAD~1HEAD(即,只是 HEAD),我想找到 在该范围内更改的行的前几位作者以及他们更改了多少行。

更准确地说:对于范围内更改的每一行,我想得到以前的作者(例如,使用 git blame)。然后我想根据这些作者总结更改的行。

例如,考虑在HEAD之前被这些人更改的文件X(我在行首标记了更改行的人,相当于git blame的输出):

Adam: Lorem ipsum dolor 
Adam: sit amet, consectetur
Adam: adipiscing elit.
Bob:  Praesent efficitur urna
Bob:  ac volutpat lacinia.
Bob:  Sed sagittis, metus non
Adam: maximus tristique, leo
Adam: augue venenatis enim,
Adam: ac rutrum nulla odio
Adam: id urna.

现在,作者 Carl 将文件更改如下(请注意,这是 git blamegit diff 的伪代码混合):

Adam: Lorem ipsum dolor 
Adam: sit amet, consectetur
- Adam: adipiscing elit.
+ Carl: adipiscing elit I love cats.
- Bob:  Praesent efficitur urna
+ Carl: Praesent efficitur urna :D
- Bob:  ac volutpat lacinia.
+ Carl: ac volutpat lacinia YOLO.
+ Carl: Added extra line, lol!
- Bob:  Sed sagittis, metus non
Adam: maximus tristique, leo
Adam: augue venenatis enim,
Adam: ac rutrum nulla odio
Adam: id urna.

所以 Carl 更改了 Bob 的 2 行,删除了 Bob 的一行,并更改了 Adam 的一行。因此,我的脚本的输出应该是:

鲍勃:3 亚当:1

我的整体解决方案是:

  1. 查找更改的行范围
  2. 将这些范围与-L 参数传递给git blame 以查询以前的作者
  3. 通过解析 git blame 的输出并总结,自己完成最后的分组。

我目前正在努力解决 1.:获取由 diff 更改的行范围(在本例中为一个范围 3,6)。一旦我有了这些范围,我就可以将它们传递给 git blame -L 以获取这些行的先前作者。 那么如何让 git diff 或其他 git 工具将行范围作为数字 start,end 对返回?

最佳答案

我不知道有什么方法可以告诉 Git 这样做,但我想出了一个解决方案来解析 git diff 的输出以获得您需要的值。

如果你运行 git diff -U0 , 在每个 block 的顶部你会看到这样的东西:

@@ -5,2 +5,3 @@

这意味着从第 5 行开始删除了 2 行,并在那里添加了 3 行。 (-U0git diff 参数 stash 了所有上下文行,因此只打印实际更改的行。如果没有该参数,行号将不正确。)对于给定的 block ,可能会出现三种不同的情况:添加行、删除行或修改行(删除和添加)。前面的示例显示了标题为修改后的行显示的内容。添加的行看起来像这样:

@@ -5,0 +6,2 @@

对于您的用例,我们可以忽略这些行。删除的行看起来像这样:

@@ -5,5 +4,0 @@

请注意,每对中的第二个数字是一个偏移量,显示添加/删除了多少行。谢天谢地,git blame也可以接受 <end> 的偏移量值,所以我们可以将其修改为 git blame 的格式可以接受。

这是一个应该可以解决问题的单行代码:

git diff -U0 HEAD~1 -- $file | grep "^@@" | grep -Ev "@@ -[[:digit:]]+,0" | sed 's/^@@ //' | sed 's/ @@.*//' | cut -d' ' -f 1 | sed 's/[+-]//' | awk '{ if ($1 !~ /,/) { print $1",1" } else { print $1 } }' | sed 's/,/,+/'

解释:

  • $file是您正在处理的当前文件。

  • 第一个grep命令将输出限制为 block 头,第二个 grep命令删除代表添加行的 block 。

  • 前两个sed命令删除范围行号以外的所有内容。

  • cut用于获取第一个范围值,即 HEAD~1 中存在的行HEAD 中不存在的.

  • 下一个sed命令去除前导状态字符。

  • 如果在给定 block 中只添加或删除一行,git diff将使用例如+2作为范围而不是 +2,1 . awk命令修复了这个问题。

  • 最后一个sed命令替换 ,,+这样git blame知道第二个值是偏移量而不是行号。

您可以使用单行输出的每一行(保存到例如 $row ),如下所示:

git blame -L$row HEAD~1 -- $file

关于git - 如何在git中找到所有更改行的先前作者?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44776778/

相关文章:

git 告诉我所有的文件在添加和暂存后都是新的

linux - Shell 脚本 - 如何根据输入模拟某些结果?

git - 如何在 github 中比较/区分 master 和 fork repo 的特定版本

java - 在 JGit 中包含 StrictHostKeyChecking 来克隆 git 存储库

git - 如何在日志中获取分支名称?

javascript - 编写一个脚本来输出修改后的javascript

Git:git diff show changes,但 merge 说是最新的?

windows - Git diff 在窗口 git bash shell (Windows) 中损坏

git - 在 Git Bash 上运行 "git difftool"会打开 Visual Studio 的多个空实例

perl - 在 Perl 中遍历多维散列