java - 我们应该使用什么技术来实时处理terra字节数据?

标签 java hadoop real-time

我们有一个网站,该网站生成需要挖掘的MB / TB数据。我们应该使用什么技术来实时处理terra字节数据? Hadoop和Cassandra非常适合批处理;但不是实时的。
即时的;意味着对正在发生的数据进行处理并显示报告。
有什么想法或建议吗?

最佳答案

您调查过the Storm project吗?它由Twitter使用。就像实时Hadoop。

我们将其用于我们的流处理项目之一。这很棒。文档,开发,部署,可伸缩性都很棒。我们最近运行了20K消息/秒的处理(在Cassandra中存储,修改和广播,计算均值),它运行可靠,就像魔术一样。绝对值得一试。邮件列表非常友好,我很少用它来提问。

关于java - 我们应该使用什么技术来实时处理terra字节数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11880758/

相关文章:

类的 Java 转换接口(interface)

java - 使用充气城堡生成 RSA key 对。使代码可从 java 程序运行

Hadoop级联: CascadeException "no loops allowed in cascade" when cogroup pipes twice

hadoop - Hbase 中的日志结构化合并树

streaming - 是否可以让 nginx 流式传输当前正在写入的文件以供下载?

java - 如何在Java中从命令提示符访问带空格的文件路径

java - 优化 Tinder 类型的 mysql 查询

hadoop - 如何使用配置单元获取表a中不在表b中的所有元素?

java - Java 实时规范 RTSJ 到底是什么?

java - JFugue RealtimePlayer 无法同时演奏多种乐器