python - 将自定义格式数据加载到 splunk 中

标签 python regex splunk

我是 splunk 新手,需要一些有关预处理最佳方法的说明。我有一个以下 .csv 格式的文件

field1, field2, field3,             field4, field5 
dummy    dummy   date(YYYYMMMDD)    dummy   time

时间没有预设 0,因此例如 13 秒将被列为 .. '13',1 小时 50 分 22 秒将被列为15022

是否可以通过正则表达式通过默认输入加载器解决此问题?它说 0 并不重要,但时间输出错误,我有 Y%m%d%H%M%S 。

我一直在研究的第二种方法(如果有人可以给我指点快速指南)如何配置以便为每个匹配的 *file.csv 触发 python 规则? (我不希望它在数据被索引/导入到 spunk 时每隔一段时间运行)

谢谢。

最佳答案

时间字段是否包含当天的时间或耗时? Splunk 无法处理后者。

考虑创建模块化输入(Python 脚本)来读取文件并根据需要转换字段。脚本的输出将由 Splunk 索引。

关于python - 将自定义格式数据加载到 splunk 中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53415441/

相关文章:

python - 对列表进行排序并在正确的位置添加 None 值

python - 在python 3中用子字符串替换单个字符

splunk - Filebeat 到 splunk

python - 将python日期时间插入mysql表

python - Pandas 识别的所有 dtypes 是什么?

regex - 在正则表达式中允许空格

python - 从模式中解析出元素

java - JSON 将数组与字符串数组组合以获得紧密的名称值对

apache-spark - Spark Container 中的 Fluent-bit

python - 用重复值展平字典