perl - 如何找到perl脚本(linux进程)挂起的位置

标签 perl process

我很难重现 perl 进程挂起的情况。我不确定它卡在哪里。 ps ax | grep <process name>将 stat 列显示为 SN,我理解这意味着它正在 sleep 并且以良好的优先级运行。

我查看了脚本(那里有大量代码),但看不到任何持续超过几秒钟的特定 sleep (这个过程已经 sleep 了一天多)。

我无法重新启动并向 Perl 脚本添加日志,因为可能无法重现该条件。我可以试试strace但想知道是否有更好的机制

最佳答案

一种可能的方法是使用 gdb .

首先,您需要为 perl 解释器调试符号。例如,在我的 Debian 系统上,我必须安装 perl-debug包为此。安装后我们有 /usr/lib/debug/usr/bin/perl ,我们稍后会将其传递给gdb。请注意,原来卡住的 Perl 脚本是使用 /usr/bin/perl 启动的。 ,不是新安装的调试版本。

为了这个例子,让我们运行这个 Perl 脚本:

$ cat test.pl 
#! /usr/bin/perl

use strict;
use warnings;

print "pid: ", $$, "\n";

while (1) {
  print "line ", __LINE__, "\n"; sleep 1;
  print "line ", __LINE__, "\n"; sleep 1;
}

当我们运行它时,我们得到如下输出:
$ ./test.pl 
pid: 15764
line 9
line 10
line 9
line 10
^C

现在让我们启动 gdb。使用现在运行的 test.pl 打印的 pid。我们在一些初始信息后得到提示(“从...读取符号”):
$ gdb /usr/lib/debug/usr/bin/perl 15809
[snip]
(gdb) 

同时,由于将 gdb 附加到 perl 解释器,perl 会停止:
$ ./test.pl
pid: 15809
line 9
line 10
[snip]
line 9
line 10
line 9
[no further output]

现在,让我们回到 gdb 进行回溯:
(gdb) backtrace
#0  0x00007fd5b4479830 in __nanosleep_nocancel () at ../sysdeps/unix/syscall-template.S:82
#1  0x00007fd5b44796c0 in __sleep (seconds=<optimized out>) at ../sysdeps/unix/sysv/linux/sleep.c:138
#2  0x00007fd5b4efc1e2 in Perl_pp_sleep (my_perl=0x1a91010) at pp_sys.c:4586
#3  0x00007fd5b4ea89b6 in Perl_runops_standard (my_perl=0x1a91010) at run.c:41
#4  0x00007fd5b4e4a585 in S_run_body (oldscope=1, my_perl=0x1a91010) at perl.c:2350
#5  perl_run (my_perl=0x1a91010) at perl.c:2268
#6  0x0000000000400f89 in main (argc=2, argv=0x7fff4de87628, env=0x7fff4de87640) at perlmain.c:120

很有可能,perl 恰好在 sleep() 的中间停止。但哪一个?

现在我们需要找出在当前执行的 (Perl) 源文件和行上查找 perl 内部信息的位置。原来我找到了一些相关信息in the doumentation of mod_perl .寻找 curinfo宏在那里。
(gdb) p my_perl->Icurcop->cop_file 
$1 = 0x1abd810 "./test.pl"
(gdb) p my_perl->Icurcop->cop_line 
$2 = 9

正如我们所看到的,我们在 test.pl 中的第 9 行 - 正如基于脚本输出的预期。

链接的文档提到了关于线程化/非线程化 perl 二进制文件的一些差异(上面的示例适用于线程化 perl,v5.14.2)。它看起来也有点过时了,因为它谈论的是my_perl->Tcurcop ,而我在 my_perl->Icurcop 的名称下找到了我要找的东西.目前,我对 perl 的内部结构还不够熟悉,无法说明为什么要重命名。

我希望这有帮助。

关于perl - 如何找到perl脚本(linux进程)挂起的位置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10370324/

相关文章:

Perl:如何在多个独立脚本之间共享大量模块的导入?

c - 如何在C中打开一个进程?

c - 在 SIGALRM 处理程序中打印

PrimeFaces:CommandButton 或 CommandLink 上的 process 属性的默认值是多少?

java - 与命令行进程交互

perl - 使用 Perl 将空字符串替换为空格

perl - 使用Perl搜索并替换文件中的特定字符串

c# - 从 Windows 服务运行命令行 exe

perl - LWP::UserAgent 无法使用 TLS1.1 发布

linux - 面对使用 perl expect 编写代码的问题