logging - Logstash遍历s3目录树的日志

标签 logging amazon-s3 elasticsearch logstash

我们大约有四年的日志存储在 Amazon S3 中,格式为

BUCKET/path/logs/blah/YEARMONTHDAYHOUR/server1.log
BUCKET/path/logs/blah/YEARMONTHDAYHOUR/server2.log
BUCKET/path/logs/blah/YEARMONTHDAYHOUR/server3.log

等等

我们的目标是使用Logstash使用此数据回填和索引日志,因此我想知道是否有一种方法可以告诉s3输入插件在指定前缀内的文件夹中搜索所有日志,类似于:
"path" => "/path/logs/blah/**/*.log

如果没有办法使用s3 plugin做到这一点,你们中的任何人都解决了类似的问题吗?
理想的情况是能够使该过程成为后台,并使其尽可能接近实时(这意味着我想避免某些事情,我必须手动将日志复制到外部位置并运行脚本以更新索引)

最佳答案

我有一个类似的问题。
我找到的解决方案如下。

  • 将S3存储桶安装为本地文件系统中的可移动驱动器。
  • 使用file输入插件为目标日志文件建立索引。

  • 使用这种方法,不需要手动复制或运行脚本。索引是在后台执行的。

    有几个S3客户端应用程序可帮助将S3存储桶安装为本地驱动器(例如TntDrive)。但是,它们都是商业软件。到目前为止,我没有找到任何免费的应用程序。

    我的操作系统是Windows 7,我使用TntDrive将S3存储桶安装到本地文件系统。

    关于logging - Logstash遍历s3目录树的日志,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26392799/

    相关文章:

    elasticsearch - 在 Elasticsearch 中查找连接词

    scala - SLF4J 初始化 - 替代记录器

    c# - TextWriterTraceListener 不起作用

    testing - 软件测试时使用日志分析工具?

    node.js - Amazon s3存储桶图像访问问题: Access Denied

    elasticsearch - Elasticsearch为非结构化数据(如pdf文件)建立索引的背后原理是什么?

    java - 在编译时禁用 Java 日志记录

    amazon-web-services - 如何使用 php aws sdk 复制整个 s3 文件夹?

    amazon-s3 - 警告 - AWS 凭证在 Google Play 控制台上公开

    elasticsearch - 如何在没有映射类型的情况下建立索引