hadoop - Flume有没有Excel源

标签 hadoop flume

我只是想知道是否有人遇到过需要将数据从 excel 导入或读取到 Hadoop 的场景?有没有Flume Excel之类的源码?

顺便说一句,我知道我可以将 excel 文件转换为 csv 然后处理它。真的只是想在这里进一步探索水槽源。

最佳答案

Spooling Directory Source可以配置为从 Excel 文件(或任何其他格式)读取。如文档所述,此源可以配置为 EventDeserializer - 实现将文件解析为事件的逻辑的类。

我不认为有人已经实现了这样的反序列化器,但使用 Apache POI 库似乎很容易完成任务。

关于hadoop - Flume有没有Excel源,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18971877/

相关文章:

api - 如何使用水槽流式传输网站数据

Hadoop 流与 Python : splitting input files manually

java - 打包和部署 Hadoop MapReduce 作业的正确方法?

java - Maven - 未能执行目标

hadoop - 在Hadoop中预处理和提取数据

hadoop - 在 Ubuntu 上安装 Flume

hadoop - 如何将本地 Hadoop 配置精确模拟到 GCP Dataproc

hadoop - 如何在 Apache Pig 中对多个展平列进行分组

python - 使用 python 将 syslog 输出处理为 csv