algorithm - 大括号表达式公式中的模式匹配

我有一长串 n (~50000) 行，其公式如下所示:

A(1, 2) = 54353
A(1, 2, 3) = 89327
A(1, B(1, 2)) = 8372
A(7, B(1, 3, 5)) = 6311
A(7, B(C(1, 3, 7), 2, C(1, 3), 5)) = 28490
B(A(1, C(5, 3)), 3, 8, D(1, 2)) = 39783

等等

这些公式包含文字(即 1、2、3、5 等)和函数调用(即 A(x, y) 或 A(x, y, z) 或 B(x, y))，其中参数函数也可以是文字或其他(嵌套)函数调用。函数(即 A、B、C 等)是固定的，并且数量不会太多(可能大约有十几个)。

现在我已经使用完整公式或带有 * 的某些模式运行查询，它应该充当全局字符，即:

A(1, 2) => [54353]
A(1, *) => [54353, 89327, 8372]
A(*, 3) => [89327]
A(*, B(*)) => [8372, 6311, 28490]
A(*, B(*, 3, *)) => [6311]

基本上，我有两个问题:

怎么做完全:事实上，我不知道这里有什么好的基本模式匹配算法。我尝试将带有 * 的表达式转换为正则表达式，它适用于简单的示例，但遗憾的是，对于更复杂的示例则失败了，即:
```
Converting:
'A(*, B(*, 3, *))' => /^A$.*, B\(.*, 3, .*$\)$/

True positive:
'A(7, B(1, 3, 5))' =~ /^A$.*, B\(.*, 3, .*$\)$/

False positive:
'A(7, B(C(1, 3, 7), 2, C(1, 3), 5))' =~ /^A$.*, B\(.*, 3, .*$\)$/
```
我觉得将这些大括号表达式转换为反向波兰表示法，然后应用正常的正则表达式方法可能会有所帮助，但我不确定。
如何快速:任何关于如何比每个查询执行约 50000 次匹配更快的想法都非常受欢迎。是否可以在这里使用某种 FSM？

最佳答案

正则表达式是为 Regular Languages 设计的(最初)，当您描述 Context Free Language 时.

您的语言可以通过确定性 Push-Down Automata 进行解析.

这个想法类似于 FSM，但除此之外你还有一个 stack您可以使用 push() 和 pop() 元素。
更改 FSM 中的状态也取决于堆栈的头部。

关于algorithm - 大括号表达式公式中的模式匹配，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14629140/

algorithm - 大括号表达式公式中的模式匹配

上一篇：c# - 收集带有后向和前向链接的 DAG 的所有路径

下一篇：algorithm - 行动者批评家强化学习中的行动约束