我正在用 Python 编写一个日志收集/分析应用程序,我需要编写一个“规则引擎”来匹配和处理日志消息。
它需要具有:
- 消息本身的正则表达式匹配
- 消息严重性/优先级的算术比较
- bool 运算符
我设想一个示例规则可能是这样的:
(message ~ "program\\[\d+\\]: message" and severity >= high) or (severity >= critical)
我正在考虑使用 PyParsing或类似于实际解析规则并构造解析树。
我想到的当前(尚未实现)设计是为每种规则类型设置类,并根据解析树构造并将它们链接在一起。然后每个规则都会有一个“matches”方法,无论它是否匹配规则,它都可以返回一个消息对象。
很快,例如:
class RegexRule(Rule):
def __init__(self, regex):
self.regex = regex
def match(self, message):
return self.regex.match(message.contents)
class SeverityRule(Rule):
def __init__(self, operator, severity):
self.operator = operator
def match(self, message):
if operator == ">=":
return message.severity >= severity
# more conditions here...
class BooleanAndRule(Rule):
def __init__(self, rule1, rule2):
self.rule1 = rule1
self.rule2 = rule2
def match(self, message):
return self.rule1.match(message) and self.rule2.match(message)
然后这些规则类将根据消息的解析树链接在一起,并在顶部规则上调用 match() 方法,该方法将向下级联,直到所有规则都被评估。
我只是想知道这是否是一种合理的方法,或者我的设计和想法是否完全不合时宜?不幸的是,我从来没有机会在大学学习编译器设计类(class)或类似的类(class),所以我几乎是自己想出了这些东西。
能否请在这类事情上有一定经验的人加入并评估这个想法?
编辑: 到目前为止,一些很好的答案,这里有一点澄清。
该程序的目的是从网络上的服务器收集日志消息并将它们存储在数据库中。除了收集日志消息之外,收集器还将定义一组规则,这些规则将根据条件匹配或忽略消息,并在必要时标记警报。
我看不到规则的复杂性超过中等,它们将被应用在一个链(列表)中,直到匹配的警报或忽略规则被命中。但是,这部分与问题不太相关。
就语法接近 Python 语法而言,是的,这是真的,但是我认为很难将 Python 过滤到用户不会无意中用不符合规则的规则做一些疯狂的事情有意的。
最佳答案
不要再发明另一种规则语言。
要么使用 Python,要么使用其他一些现有的、已经调试过的工作语言,如 BPEL。
只需在 Python 中编写您的规则,导入它们并执行它们。生活更简单,更容易调试,而且您实际上已经解决了实际的日志读取问题,而不会产生另一个问题。
想象一下这个场景。你的程序中断了。现在是规则解析、规则执行或规则本身。您必须调试所有三个。如果你用 Python 编写规则,那就是规则,就是这样。
“我认为很难将 Python 过滤到用户不会无意中使用非预期规则做一些疯狂的事情的程度。”
这主要是“我想编写一个编译器”的论点。
1) 您是主要用户。您将编写、调试和维护规则。真的有一群疯狂的程序员会做疯狂的事情吗?真的吗?如果有任何潜在的疯狂用户,与他们交谈。教他们。不要通过发明一种新语言来对抗它们(然后你必须永远维护和调试它。)
2) 这只是日志处理。 疯狂并没有真正的成本。没有人会用错误的日志处理来颠覆世界经济体系。不要将几十行 Python 的小任务放到一个 1000 行的解释器上来解释一些规则语言的几十行。只需编写几十行 Python。
只需尽可能快速清晰地用 Python 编写它,然后继续下一个项目。
关于python - 在 Python 中实现 "rules engine",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/467738/