我是 splunk 新手,需要一些有关预处理最佳方法的说明。我有一个以下 .csv 格式的文件
field1, field2, field3, field4, field5
dummy dummy date(YYYYMMMDD) dummy time
时间没有预设 0,因此例如 13
秒将被列为 .. '13'
,1 小时 50 分 22 秒将被列为15022
。
是否可以通过正则表达式通过默认输入加载器解决此问题?它说 0 并不重要,但时间输出错误,我有 Y%m%d%H%M%S 。
我一直在研究的第二种方法(如果有人可以给我指点快速指南)如何配置以便为每个匹配的 *file.csv 触发 python 规则? (我不希望它在数据被索引/导入到 spunk 时每隔一段时间运行)
谢谢。
最佳答案
时间字段是否包含当天的时间或耗时? Splunk 无法处理后者。
考虑创建模块化输入(Python 脚本)来读取文件并根据需要转换字段。脚本的输出将由 Splunk 索引。
关于python - 将自定义格式数据加载到 splunk 中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53415441/