python - 将字符串位置映射到正则表达式输出中的行号

标签 python regex grep multiline

我正在使用 Python 开发一个“类似 grep”的实用程序,用于搜索 Oracle 源代码文件。编码标准随着时间的推移发生了变化,因此尝试查找诸如“表 a.foo 中的所有删除”之类的内容可能会跨越多行,也可能不会跨越多行,具体取决于那段代码的年代:

s = """-- multiline DDL statement
DELETE
    a.foo f
WHERE
    f.bar = 'XYZ';

DELETE a.foo f
WHERE f.bar = 'ABC';

DELETE a.foo WHERE bar = 'PDQ';
"""

import re

p = re.compile( r'\bDELETE\b.+?a\.foo', re.MULTILINE | re.DOTALL )

for m in re.finditer( p, s ):
    print s[ m.start() : m.end() ]

这个输出:

DELETE
    a.foo
DELETE a.foo
DELETE a.foo

我想要的:

[2] DELETE
[3]     a.foo
[7] DELETE a.foo
[10] DELETE a.foo

是否有快速/简单/内置的方法将字符串索引映射到行号?

最佳答案

lineno = s.count("\n",0,m.start())+1

关于python - 将字符串位置映射到正则表达式输出中的行号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1522510/

相关文章:

python - 替换 urllib2

python - 参数两边的方括号在官方文档中是什么意思?

python - 如何使用sklearn load_files方法忽略某些文件?

linux - 使用 awk 更改日期格式

python - Sympy - Lambdify - 虚拟变量的有效名称

javascript - 如何编写一个 javascript 正则表达式来用 html 超链接替换这种格式 [*](*) 的超链接?

javascript - PageDown:使用 javascript 向每个 <img> 标签添加一个 CSS 类

python - 在数据框的每一行中搜索时,如何从关键字列表中获取匹配的关键字?

python - 如何获取 grep 命令的输出(Python)

linux - 使用 Linux 命令从文本中删除一些行