我正在尝试为 log4j 编写一个日志解析器。我有一个适用于普通消息的正则表达式,但是当它收到一条抛出异常的消息时,它只会在第一行显示内容,并且不会匹配堆栈跟踪。
如何编写可以处理跨多行的 Java 异常的正则表达式?
这是我在 java 中使用的当前正则表达式:
^(\\S+)\\s+(\\S+)\\s+(\\S+)\\s+(\\S+)\\s+(.+)$
这是一条正常的日志消息:
2012-01-25 20:10:03,480 INFO org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler: nodeUpdate: example.com:1 clusterResources: memory: 1
这是一个示例异常日志消息:
2012-01-25 00:03:59,565 ERROR org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode: Exception in doCheckpoint
java.io.IOException: Inconsistent checkpoint fields.
LV = -1 namespaceID = 1 cTime = 0 ; clusterId = CID-1 ; blockpoolId = BP-
Expecting respectively: -1; 1; 0; CID-1; BP-1
at org.apache.hadoop.hdfs.server.namenode.CheckpointSignature.validateStorageInfo(CheckpointSignature.java:111)
at org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode.doCheckpoint(SecondaryNameNode.java:510)
at org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode.doWork(SecondaryNameNode.java:381)
at org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode$2.run(SecondaryNameNode.java:344)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:337)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1149)
at org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode.run(SecondaryNameNode.java:341)
at java.lang.Thread.run(Thread.java:619)
最佳答案
应该这样做:
(.*\\bERROR\\b.*)\\r?\\n(.*\\r?\\n)*(.*\\bat\\b.*)*(\\d{1,4}\\)\\r?\\n)
我假设您正在将日志文件读入 CharSequence
并将其传递给 Java 中的模式匹配器,而不是逐行读取文件。
关于java - 可以处理java异常的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8996131/