python - 如何使用 re 替换和移动 python 中的字符串模式?

标签 python regex scala

我有一个像

这样的片段
re.sub(r"""\s*(\p{LD}+)\s+NEAR/(\d)\s+(\p{LD}+)\s*""",r""""$1 $3"~$2""",'foo NEAR/4 bar')

在Python中。

预期输出为
“foo bar”~4

但现在我得到

foo NEAR/4 bar 

我正在尝试将 scala 代码转换为 python。 scala 代码是

val near_rex = """\s*(\p{LD}+)\s+NEAR/(\d)\s+(\p{LD}+)\s*""".r;
val out = near_rex.replaceAllIn("foo NEAR/4 bar", """"$1 $3"~$2""");

scala 片段在这里工作正常 http://www.simplyscala.com/

最佳答案

我不懂 scala,所以我不知道 \p{LD}+ 应该匹配什么,但使用 \w 来匹配 [a-zA-Z0-9_] (foo/bar),正则表达式没问题:

>>> re.sub(r"""\s*(\w+)\s+NEAR/(\d)\s+(\w+)\s*""",r""""\1 \3"~\2""",'foo NEAR/4 bar')
'"foo bar"~4'

为了返回捕获的组,您必须使用 \1\2... 而不是 $1

<小时/>

正如 Avinash Raj 在评论中所建议的,您可以使用简单的引号来摆脱三重引号:

re.sub(r'\s*(\w+)\s+NEAR/(\d)\s+(\w+)\s*',r'"\1 \3"~\2','foo NEAR/4 bar')

此外,\p{L} 不是 Scala 特定的(归功于 Amal Murali),但用于匹配属于 "letter" category 的 unicode 字符。 .

关于python - 如何使用 re 替换和移动 python 中的字符串模式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26214375/

相关文章:

java - 为什么我必须包含一个 Thread.sleep(10) 来获取要通过套接字发送的数据

Javascript:类似于带有属性名称的 string.format

python - 如何检查字符串是否是 Python 中的有效正则表达式?

javascript - 从 scala.js 调用 jquery .each 方法

Python 使用 ElementTree 将新项目插入 XML 子子元素的更简单方法

python - 尝试更改 RTSP 视频流的分辨率

python - 两个函数,一个生成器

regex - 使用 Perl,如何使用每个数组元素内的数字值对数组进行排序?

json - 喷json解析和NullPointerException

spring - 使用 Scala 规范对 Spring 应用程序进行单元测试