我使用两个正则表达式从 MySQL 查询中提取分配并使用它们创建审计跟踪。其中一种是“挑剔”的,需要引用列名称等,另一种则不需要。
它们都经过测试并正确解析出值。我遇到的问题是,对于某些查询,“挑剔”的正则表达式实际上只会导致 Apache 出现段错误。
我尝试了多种方法来确定这是将正则表达式留在代码中的原因,并且只是修改条件以确保它没有运行(以排除某种编译时问题或其他问题) .没有问题。只有当它针对特定查询运行正则表达式时才会出现段错误,而且我找不到任何明显的模式来告诉我原因。
有问题的代码:
if ($picky)
preg_match_all("/[`'\"]((?:[A-Z]|[a-z]|_|[0-9])+)[`'\"] *= *'((?:[^'\\\\]|\\\\.)*)'/", $sql, $matches);
else
preg_match_all("/[`'\"]?((?:[A-Z]|[a-z]|_|[0-9])+)[`'\"]? *= *[`'\"]?([^`'\" ,]+)[`'\"]?/", $sql, $matches);
两者之间的唯一区别是第一个删除了引号上的问号,使它们成为非可选的,并删除了在值上使用不同种类的引号的选项——只允许单引号。将第一个正则表达式替换为第二个(出于测试目的)并使用相同的数据可以解决问题 - 肯定与正则表达式有关。
让我伤心的特定 SQL 可在以下位置找到:
http://stackoverflow.pastebin.com/m75c2a2a0
有趣的是,当我删除突出显示的部分时,一切正常。尝试单独提交突出显示的部分不会导致错误。
我对这里发生的事情感到很困惑。谁能就进一步调试或修复提供任何建议?
编辑:没有什么特别令人兴奋的,但为了完整起见,这里是 Apache 的相关日志条目(/var/log/apache2/error.log - 站点的 error.log 中没有任何内容。甚至没有提及请求在访问日志中。)
[Thu Dec 10 10:08:03 2009] [notice] child pid 20835 exit signal Segmentation fault (11)
其中一个用于包含该查询的每个请求。
EDIT2:根据 Kuroki Kaze 的建议,我尝试了相同长度的乱码并得到了相同的段错误。坐下来尝试了一堆不同的长度并找到了极限。 6035 个字符工作正常。 6036 段错误。
EDIT3:在 php.ini
中更改 pcre.backtrack_limit
和 pcre.recursion_limit
的值在一定程度上缓解了这个问题。 Apache 不再出现段错误,但我的正则表达式不再匹配字符串中的所有匹配项。显然这是 PHP/PCRE 中一个众所周知的(自 2007 年起)错误:
http://bugs.php.net/bug.php?id=40909
EDIT4:我在下面的答案中发布了我用来替换这个特定正则表达式的代码,因为变通方法对我的目的来说是 Not Acceptable (待售产品,不能保证 php.ini 的变化和正则表达式的部分变化处理我们需要的已删除功能)。我发布的代码已发布到公共(public)领域,不提供任何形式的保证或支持。我希望它可以帮助别人。 :)
谢谢大家的帮助!
亚当
最佳答案
我遇到了类似的 preg_match 相关问题,相同的 Apache 段错误。只有导致它的 preg_match 内置到我正在使用的 CMS (WordPress) 中。
提供的“解决方法”是更改 php.ini 中的这些设置:
[Pcre] ;PCRE 库回溯限制。 ;pcre.backtrack_limit=100000 pcre.recursion_limit=200000000 pcre.backtrack_limit=100000000
权衡是为了呈现更大的页面(在我的例子中,> 200 行;当其中一列限制为 1500 个字符的文本描述时),您将获得相当高的 CPU 利用率,而且我'我仍然看到段错误。只是没那么频繁。
我的网站快要报废了,所以我真的没有太多需要(或预算)来寻找真正的解决方案。但这也许可以缓解您遇到的问题。
关于PHP preg_match_all 导致 Apache 段错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1882266/