跟进我之前的问题 Hundreds of RegEx on one string 我最终得到了如下的正则表达式
(section1:|section2:|section3:|section[s]?4:|(special section:|it has:|synonyms:)).*?(?=section1:|section2:|section3:|section[s]?4:|(special section:|it has:|synonyms:)|$)
section section in regex search
我的产品系统中的正则表达式有超过 1000 个字符,并且有多行长。它所做的就是从大段文本中分块,然后再次对这些部分进行单独处理以提取信息。另外,我希望这些部分标题能够兼容自然语言,这就是为什么某些部分可以通过多种方式键入,从而导致正则表达式的大小增加。在性能和可管理性方面有更好的方法吗?
最佳答案
使用词法分析器而不是正则表达式。
关于java - 一个字符串上有数百个正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7412011/