java集群用于巨大的顺序计算

标签 java cluster-computing

我有数据项 1,2,3 ..... n 我需要对所有数据项运行顺序计算。 n的值很大,大约60万以上。数据取自大小通常超过 2GB 的文本文件

我有java程序来循环执行计算。处理时间通常需要超过24小时。我需要使用集群来最小化处理时间并将作业分发到不同的集群节点。

目前我正在本地计算机上使用 4 个 cpu 核心执行并行处理。工作被分割成碎片并交给 4 个核心。当一个核心完成一项工作时,就会加载下一部分。因此,将会有一个队列,并且 4 个核心并行处理该队列。

企业级java哪种集群应用好? 我需要更改我的程序代码吗? 集群程序是否可以在不修改java代码的情况下进行处理? 如何拆分作业并将作业分配到不同的集群? 我需要将数据文件上传到所有集群节点吗?

我将非常感谢您的帮助。

最佳答案

您可以使用 JMS 队列来代替本地队列。 ActiveMQ 是一个简单易用的 JMS 服务器。您可以有任意数量的监听器节点,并且只需将任务添加到此队列即可。

关于java集群用于巨大的顺序计算,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6289127/

相关文章:

java - Java中执行/usr/bin/env bash -c "command"

java - Jetty/Tomcat 加密的基于 cookie 的 session 存储?

session - 如何更改tomcat集群中的广播IP

scala - Spark exitCode : 12 mean? 是什么意思

java - 如何从 Glide onResourceReady 返回

java - 星火Java : Specify dependency jars in SparkLauncher

java - 使用 32 位 java 编译器生成的 .class 文件可以在具有 64 位 JVM 的 64 位系统上使用吗?

java - 如何完成三个Queue的实现以及三个Stack的实现?

hadoop - 部署HDP集群需要多少磁盘空间?

javascript - 在聚类向量和非聚类向量上使用样式