我有一些文本,其中写有(id(以 Pnumber 的形式),破折号和名称)的列表。 比如:
P1 - code23
P2 - name asd, P3 -name3
P3 - 837/55 P5 - code/55
如您所见,一对 PX - 名称可以用\n、逗号或简单空格分隔。
使用正则表达式模式
(((?<id>P\d)(\s)?-(\s)?(?<name>(.)*)(,)?(\n)?))
我可以提取在不同行重复的名称组匹配项,但不能提取由 , 或空格分隔的匹配项。 从上面的文本中提取的名称是
code23 (right)
name asd, P3 -name3 (wrong)
837/55 P5 - code/55 (wrong)
如何修改我的模式?
最佳答案
你可以试试
(?<id>P\d+)\s*-\s*(?<name>.*?)(?=$|,?\s*P\d)
参见 regex demo (演示中添加\r?
只是因为打开了多行模式并且输入是多行,如果字符串单独处理,则不需要\r?
和多行模式)。
解释:
-
(?<id>P\d+)
-组 ID,P
+ 1+ 位数字 -
\s*-\s*
- 0+ 空格,-
又是 0+ 个空格 -
(?<name>.*?)
- 捕获除换行符以外的 0+ 个字符的组名称,直到第一个 -
(?=$|,?\s*P\d)
- 字符串结尾(是的,唯一的)或可选的逗号,0+ 空格,P
和一个数字。
结果:
关于c# - 使用正则表达式提取重复模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38016115/