java - 我们应该使用什么技术来实时处理terra字节数据？

标签 java hadoop real-time

我们有一个网站，该网站生成需要挖掘的MB / TB数据。我们应该使用什么技术来实时处理terra字节数据？ Hadoop和Cassandra非常适合批处理；但不是实时的。
即时的;意味着对正在发生的数据进行处理并显示报告。
有什么想法或建议吗？

最佳答案

您调查过the Storm project吗？它由Twitter使用。就像实时Hadoop。

我们将其用于我们的流处理项目之一。这很棒。文档，开发，部署，可伸缩性都很棒。我们最近运行了20K消息/秒的处理(在Cassandra中存储，修改和广播，计算均值)，它运行可靠，就像魔术一样。绝对值得一试。邮件列表非常友好，我很少用它来提问。

关于java - 我们应该使用什么技术来实时处理terra字节数据？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11880758/

上一篇：hadoop - 适用于hadoop的起始项目

下一篇：hadoop - 在 map-reduce 输出中重复 "keys"？

相关文章：

类的 Java 转换接口(interface)

java - 使用充气城堡生成 RSA key 对。使代码可从 java 程序运行

Hadoop级联: CascadeException "no loops allowed in cascade" when cogroup pipes twice

hadoop - Hbase 中的日志结构化合并树

streaming - 是否可以让 nginx 流式传输当前正在写入的文件以供下载？

java - 如何在Java中从命令提示符访问带空格的文件路径

java - 优化 Tinder 类型的 mysql 查询

hadoop - 如何使用配置单元获取表a中不在表b中的所有元素？

java - Java 实时规范 RTSJ 到底是什么？

java - JFugue RealtimePlayer 无法同时演奏多种乐器