c# - 使用正则表达式提取重复模式

标签 c# regex

我有一些文本,其中写有(id(以 Pnumber 的形式),破折号和名称)的列表。 比如:

P1 - code23
P2 - name asd, P3 -name3
P3 - 837/55 P5 - code/55

如您所见,一对 PX - 名称可以用\n、逗号或简单空格分隔。

使用正则表达式模式

(((?<id>P\d)(\s)?-(\s)?(?<name>(.)*)(,)?(\n)?))   

我可以提取在不同行重复的名称组匹配项,但不能提取由 , 或空格分隔的匹配项。 从上面的文本中提取的名称是

code23 (right)
name asd, P3 -name3 (wrong)
837/55 P5 - code/55 (wrong)

如何修改我的模式?

最佳答案

你可以试试

(?<id>P\d+)\s*-\s*(?<name>.*?)(?=$|,?\s*P\d)

参见 regex demo (演示中添加\r?只是因为打开了多行模式并且输入是多行,如果字符串单独处理,则不需要\r?和多行模式)。

解释:

  • (?<id>P\d+) -组 ID,P + 1+ 位数字
  • \s*-\s* - 0+ 空格,-又是 0+ 个空格
  • (?<name>.*?) - 捕获除换行符以外的 0+ 个字符的组名称,直到第一个
  • (?=$|,?\s*P\d) - 字符串结尾(是的,唯一的)或可选的逗号,0+ 空格,P和一个数字。

结果:

enter image description here

关于c# - 使用正则表达式提取重复模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38016115/

相关文章:

c# - 获取 List 中不同值的列表

c# - 将字符串 "7/16/2013 7:00:00 AM"转换为日期时间

c# - ASP.NET MVC3 用户登录

python - 仅删除连续的特殊字符,但保留连续的 [a-zA-Z0-9] 和单个字符

javascript - 如何扩展这个正则表达式以匹配这个掩码?

java - 正则表达式 - Java 不工作

c# - Modern UI Toolkit 中的图表未正确呈现

c# - 波浪号 (~) 解析为站点根目录而不是 asp.net 中的应用程序根目录

c# - 阅读 RapidShare API 响应的最佳方式?

python - 正则表达式匹配字符串内的 float ,中间有任何字符或空格