考虑如下一组字符串:
Memory size = 4,194,304 KB
Cache size= 32,768 K
Number of cores = 8
Note =4,000,000 KB is less than 4 GB
是否有通用且不太复杂的 Java 正则表达式完全匹配每个字符串并生成以下组?
"Memory size", "4,194,304", "KB"
"Cache size", "32,768", "K"
"Number of cores", "8"
"Note", "4,000,000 KB is less than 4 GB"
这些组是key
、value
和(可选)suffix
。
附加要求:
- 值(即“=”之后的部分)不一定是数字
- “:”两边的任何空格都应该一次删除,不要回溯
- “KB”和“K”字符串匹配不区分大小写
- 捕获的组应始终具有相同的索引(理想情况下,键/值/后缀为 3 个组,所有匹配项具有相同的组索引)
很明显,像这样的简单表达式
([^=]+) *: *([^=]+)
没有完全涵盖上述规范。
最佳答案
完全涵盖上述规范的正则表达式是:
^([^=]+?) *= *(.+?) *$
编辑
原来我错过了 K/KB 部分。这是修改后的版本:
^([^=]+?) *= *(.+?) *(KB?)? *$
关于带有后缀的简单键值对的 Java 正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14560829/