hadoop - 使用Pig分析日志文件

我是Pig Latin的新手，我需要分析日志文件以检查错误日志和警告日志。
怎么做？查找错误和警告的脚本是什么？

最佳答案

您首先需要使用LOAD-将文件的每一行作为字符串，然后从每一行应用并提取正则表达式模式，然后是FILTER以获取错误和警告。
不过，Elasticsearch更常用于日志分析，而不是Hadoop工具。

关于hadoop - 使用Pig分析日志文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62741244/

相关文章：

apache-pig - 'group as' 在 Pig 中是如何工作的？