linux - 运行 `perf stat` 时 `time` (和 `perf trace -s`!)是否显示不正确的结果?

标签 linux performance perf

我正在运行 kernel-5.0.9-200.fc29.x86_64(以及具有相同版本号的 perf 包)。

在下面的命令中,报告的 msec task-clock 远大于 seconds userseconds sys 的总和。

这些是真实的数字,还是限制或错误的结果?

如果都是真实数字,那么task-clock是什么意思?它不是 CPU 时间 ( user + sys )。另外,我想知道为什么下面的第二个命令比实际时间少了大约 10 秒,但 CPU 时间多了 50 秒:-)。

编辑:在最初的几秒钟内,第一个命令显示大量红色消息:LOST 5 events!

$ sudo time perf stat perf trace -s dnf -y --releasever=30 --installroot=$HOME/nspawn/fedora-30 --disablerepo='*' --enablerepo=fedora --enablerepo=updates install systemd passwd dnf fedora-release vim-minimal

...

         91,686.29 msec task-clock                #    0.463 CPUs utilized          
           535,179      context-switches          #    0.006 M/sec                  
             5,244      cpu-migrations            #    0.057 K/sec                  
           399,484      page-faults               #    0.004 M/sec                  
   238,663,625,948      cycles                    #    2.603 GHz                    
   348,081,456,496      instructions              #    1.46  insn per cycle         
    51,406,362,901      branches                  #  560.677 M/sec                  
     1,207,307,303      branch-misses             #    2.35% of all branches        

     198.215217338 seconds time elapsed

       5.570430000 seconds user
      11.160145000 seconds sys


5.59user 11.36system 3:18.45elapsed 8%CPU (0avgtext+0avgdata 28212maxresident)k
2760inputs+0outputs (16major+6641minor)pagefaults 0swaps

比较:

$ sudo time perf stat dnf -y --releasever=30 --installroot=/home/alan-sysop/nspawn/fedora-30 --disablerepo=* --enablerepo=fedora --enablerepo=updates install systemd passwd dnf fedora-release vim-minimal

...

         69,277.16 msec task-clock                #    0.371 CPUs utilized          
            22,223      context-switches          #    0.321 K/sec                  
               858      cpu-migrations            #    0.012 K/sec                  
           380,117      page-faults               #    0.005 M/sec                  
   187,946,998,307      cycles                    #    2.713 GHz                    
   312,329,248,251      instructions              #    1.66  insn per cycle         
    44,516,425,061      branches                  #  642.584 M/sec                  
     1,020,032,328      branch-misses             #    2.29% of all branches        

     186.623370416 seconds time elapsed

      62.278802000 seconds user
       6.379658000 seconds sys


62.31user 6.57system 3:06.86elapsed 36%CPU (0avgtext+0avgdata 423700maxresident)k
0inputs+2562096outputs (23major+379286minor)pagefaults 0swaps

最佳答案

不存在实际的不一致。

seconds user/seconds sys 仅显示直接子级(进程中的所有线程)的 rusage 统计信息,而计数器,默认情况下,继承到所有子进程和孙进程。

也就是说,较低 CPU 时间仅与perf trace 实用程序相关,而较长时间则包括实际 dnf流程。

您还可以通过运行来确认

perf stat --no-inherit perf trace ...

您不能将孙子包含在资源使用情况摘要中。

附注您不应假设不同 perf 版本的资源使用情况摘要的行为保持相同。

关于linux - 运行 `perf stat` 时 `time` (和 `perf trace -s`!)是否显示不正确的结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55956011/

相关文章:

使用 open() 时出现 Python FileNotFoundError

r - 如何检查我的 Linux 上是否安装了 sp 软件包(R 软件)以及如何安装它?

java - Java中的进程管理和EventWaiter

C 没有可用于编程的内存 : unsafe to call malloc error

scala - 函数式编程是否可以减少冯·诺依曼瓶颈?

linux - 如何计算进程 ID 的已执行指令数,包括所有 future 的子线程

linux - 没有符号的 perf 顶 View 反汇编(带有剥离的二进制文件)

linux - 在调用自定义代码的 Mac OS X 和 Linux 中创建 "virtual"路径 (/bla)

javascript - 刷新时加载页面

cpu-architecture - perf stat 统计单位