hadoop - 使用 Flume 获取推文时出现问题

标签 hadoop flume

我可以使用 flume 获取推文,但是,流式传输所使用的语言不是我想要的。下面是 flume.conf 文件

flume.conf

我收到的推文如下所示:

tweets

任何人都可以建议我需要进行的更改吗?

最佳答案

Apache Flume 中的TwitterSource 目前不支持语言过滤。这个先前的问题描述了一个过程(公认的复杂),您可以通过该过程部署您自己的具有语言支持的代码补丁版本:

Flume - TwitterSource language filter

我认为 Apache Flume 支持语言过滤将是一个有值(value)的增强。我鼓励您在 FLUME 中的 Apache JIRA 中提交请求项目。

如果您有兴趣,也请考虑贡献一个补丁。我认为这只是将“语言”设置从 configure 方法中的配置中拉出来,将其保存在一个成员变量中,然后将其传递到 Twitter4J API 中。

关于hadoop - 使用 Flume 获取推文时出现问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44973051/

相关文章:

performance - SQOOP导出命令VS DB2 LOAD CLIENT

regex - 删除标点符号,但不是全部

apache-zookeeper - Zookeeper 不断收到警告 : "caught end of stream exception"

hadoop - 如何降低Flume Sequence Generator

hadoop - Flume 假脱机目录源 : Cannot load files larger files

hadoop - 推特数据分析

csv - hadoop mapreduce如何从CSV文件中获取数据输入?

hadoop - 使用哪个 hadoop 版本?

来自 apache PIG 的 mongodb 批量插入

hadoop - 如何在ftp源flume代理中保留文件的原始基本名称