我目前正在尝试实现一个正则表达式引擎。 (是的,为了好玩。去图吧。)
我在这个网站上工作以获取通用算法方法:http://swtch.com/~rsc/regexp/regexp1.html
我想问大家的问题是:您是否知道可以用作我的引擎综合测试平台的正则表达式和文本字符串的集合?我已经搜索和询问了几天,但找不到任何具体的东西;也许我的 google keyword-fu 缺少。
谢谢!
附注举个例子:
正则表达式:
- “一个”
- “abc”
- “^a$”
- [a-c]”
- “^[^a]$”
- “^[^a]?$”
- “一个+”
- >“。”
- ".*"
- .+"
- “da?[bd]”
字符串:
- ""
- “一个”
- “嗯”
- “dd”
- “abc”
- “爸爸”
- “dabcd”
- “aaaaab”
最佳答案
很久以前我写了一个简单的文件名模式匹配函数(文件模式是正则表达式的一个特殊子集)。在代码(C 语言)中,我提供了几十个测试用例。您可能可以调整它们以与正则表达式匹配器一起使用。
来源位于:
• http://david.tribble.com/src/fpattern.c
• http://david.tribble.com/src/fpattern.h
关于c - 正则表达式测试台,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9201842/