我正在编写一个 C++ 代码,它将一个字符串作为输入并检查该字符串是否具有有效的 Python 列表索引语法。例如:
a[0]
, a[:]
, a[::]
, a[0:]
, a[-1::]
, a[2:1:2]
a[:-1:]
, a[::- 1]
、a[1:10:2]
等等。
到目前为止,我得到了以下正则表达式:
^[a-zA-Z_][a-zA-Z0-9_]*\[([ ]*-?[ ]*[0-9]+[ ]*)*:?([ ]*-?[ ]*[0-9]+[ ]*)*:?([ ]*-?[ ]*[0-9]+[ ]*)*\]$
但是,它对我来说太长了,我想知道是否有更好的方法来做到这一点。此外,上面的正则表达式将匹配 a[]
,这是不可取的。我刚刚开始尝试正则表达式,我的知识有限。所以我的问题是:
- 构建用于验证 Python 列表索引的正则表达式是否是更好的方法?
- 我希望正则表达式在
a[]
上失败。我该怎么做?
我正在使用默认具有 ECMAScript 语法的 C++ 11 正则表达式库。
谢谢。
最佳答案
你可以使用
^[_a-zA-Z]\w*\[(?! *\]) *-? *\d*(?: *: *-? *\d*){0,2} *\]$
参见 regex demo .空格可以替换为 [[:blank:]]
或 [\t]
以匹配水平空格。
图案细节
^
- 字符串的开始[_a-zA-Z]
-_
或 ASCII 字母\w*
- ASCII 字母/数字/_
\[
- 一个[
(?! *\])
-] 后面不能有 0+ 个空格
*-? *
- 0+个空格,一个可选的-
,0+个空格\d*
(?: *: *-? *\d*){0,2}
- 出现零次、一次或两次:*: *-? *
- 0+个空格,一个可选的-
,0+个空格\d*
- 0+ 位
*]
- 0+ 个空格和]
$
- 字符串结尾。
参见 C++ demo (请注意,对于 regex_match
,^
和 $
变得多余,可以省略):
#include <iostream>
#include <regex>
using namespace std;
int main() {
std::vector<std::string> strings;
strings.push_back("a[0]");
strings.push_back("a[:]");
strings.push_back("a[::]");
strings.push_back("a[0:]");
strings.push_back("a[-1::]");
strings.push_back("a[ 2 : 1:2]");
strings.push_back("a[: -1:]");
strings.push_back("a[::- 1]");
strings.push_back("a[1:10:2]");
strings.push_back("a[]");
std::regex rex1(R"([_a-zA-Z]\w*\[(?! *\]) *-? *\d*(?: *: *-? *\d*){0,2} *\])");
for (auto s : strings)
{
std::cout << "Next string: " << s;
if (regex_match(s, rex1)) {
std::cout << "<= Matched" << std::endl;
} else {
std::cout << "<= Not Matched" << std::endl;
}
}
return 0;
}
输出:
Next string: a[0]<= Matched
Next string: a[:]<= Matched
Next string: a[::]<= Matched
Next string: a[0:]<= Matched
Next string: a[-1::]<= Matched
Next string: a[ 2 : 1:2]<= Matched
Next string: a[: -1:]<= Matched
Next string: a[::- 1]<= Matched
Next string: a[1:10:2]<= Matched
Next string: a[]<= Not Matched
关于python - 使用 ECMAScript 正则表达式验证 Python 列表索引语法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47428786/