hadoop - 嵌入式水槽代理是否需要Hadoop在集群上运行?

标签 hadoop flume agent

我试图在我的Web服务中编写嵌入式flume代理,以将日志传输到运行flume代理的另一个hadoop集群。要使用嵌入式flume代理,我们是否需要在运行Web服务的服务器中运行hadoop。

最佳答案

TLDR:我认为

较长的版本:我没有检查过,但是在开发人员指南(https://flume.apache.org/FlumeDeveloperGuide.html#embedded-agent)中说

Note: The embedded agent has a dependency on hadoop-core.jar.



(https://flume.apache.org/FlumeDeveloperGuide.html#embedded-agent)

在用户指南(https://flume.apache.org/FlumeUserGuide.html#hdfs-sink)中,您可以指定HDFS路径:

HDFS directory path (eg hdfs://namenode/flume/webdata/)



另一方面,您确定要与嵌入式代理一起工作,而不是在要放置数据并使用HTTP Source的地方运行Flume吗? (https://flume.apache.org/FlumeUserGuide.html#http-source)(...或您可以向其发送数据的任何其他来源)

关于hadoop - 嵌入式水槽代理是否需要Hadoop在集群上运行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39623823/

相关文章:

java - Flume的HttpSource : is the Jetty server multithread?

azure-devops - Azure Devops 管道环境资源代理安装问题

hadoop - 在 Hadoop 中链接多个 MapReduce 作业

hadoop - 槽将随机数添加到要推送的hdfs文件中(test.csv> test.csv.1591560702234)

hadoop - 我如何将reduce的输出用作其他作业的来源

hadoop - Flume ElasticSearchSink不会消耗所有消息

build - 在其他虚拟机 TFS 2010 上使用代理

concurrency - 使用代理来完成 STM 交易中的副作用

hadoop - Mapreduce 作业未运行

hadoop - Hbase Hadoop 集群.. java.io.IOException : java. lang.NoSuchMethodExceptio