hadoop - 如何使用flume将数据从本地机器加载到hdfs

标签 hadoop flume

我是flume的新手,所以请告诉我......如何使用flume将日志文件从我的本地机器存储到本地我的HDFS
我在设置类路径和 flume.conf 文件时遇到问题

谢谢,
杰伊

最佳答案

agent.sources = weblog
agent.channels = memoryChannel
agent.sinks = mycluster

## Sources #########################################################  
agent.sources.weblog.type = exec  
agent.sources.weblog.command = tail -F REPLACE-WITH-PATH2-your.log-FILE  
agent.sources.weblog.batchSize = 1  
agent.sources.weblog.channels =
REPLACE-WITH-
CHANNEL-NAME

## Channels ########################################################  
agent.channels.memoryChannel.type = memory  
agent.channels.memoryChannel.capacity = 100 agent.channels.memoryChannel.transactionCapacity = 100   

## Sinks ###########################################################   
agent.sinks.mycluster.type =REPLACE-WITH-CLUSTER-TYPE  
agent.sinks.mycluster.hdfs.path=/user/root/flumedata  
agent.sinks.mycluster.channel =REPLACE-WITH-CHANNEL-NAME

将此文件保存为 logagent.conf 并使用以下命令运行
# flume-ng agent –n agent –f logagent.conf &

关于hadoop - 如何使用flume将数据从本地机器加载到hdfs,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16623661/

相关文章:

windows - webHDFS curl-在Windows上协商

java - 可迭代到 ArrayList 元素更改

java - 如何编译运行Hadoop权威指南书中的代码?

hadoop - 将Facebook帖子提取到Hdfs中

java - 运行 giraph 作业时遇到问题(classnotfoundexception)

hadoop - 假设不赞成使用FALCON,则在Hadoop群集之间使用增量复制(使用Spark)

hadoop - 文件传输到HDFS

hadoop - Apache Flume 连接到 twitter API 401 :Authentication credentials

hadoop - 使用Flume将推文写入HDFS不起作用

Flume 自动可扩展性和故障转移