c++ - C COMPS 执行失败的所有作业

标签 c++ c distributed-computing hpc compss

我已经从http://www.bsc.es/computer-sciences/grid-computing/comp-superscalar/downloads-and-documentation 下载了COMPSs 1.4 和一些测试程序。我正在尝试测试它们。 Java 执行很顺利;但是,我在使用 C 时遇到了问题。

我目前正在尝试执行 Simple.自述文件指出我只需要两个命令:

buidapp simple

runcompss --lang=c master/simple 1

应用程序构建正常,但是当使用此命令执行时,出现以下错误:

[ERRMGR]  -  WARNING: Job 1 for running task 1 on worker localhost has failed; resubmitting task to the same worker.

[ERRMGR]  -  WARNING: Task 1 execution on worker localhost has failed; rescheduling task execution. (changing worker)

[ERRMGR]  -  WARNING: No task could be scheduled to any of the available resources.
                      This could end up blocking COMPSs. Will check it again in 20 seconds.
                      Possible causes: 
                          -Network problems: non-reachable nodes, sshd service not started, etc.
                          -There isn't any computing resource that fits the defined tasks constraints.
                      If this happens 2 more times, the runtime will shutdown.

3次检查后,执行结束,无结果。有什么我想念的吗?

最佳答案

当使用 C 绑定(bind)运行应用程序时,默认的 project.xml 无效,因为您必须定义一个 project.xml,其中包括工作程序二进制文件在每个主机中的部署位置。

<Project>
      <Worker Name="localhost">
        <InstallDir>/opt/COMPSs/Runtime/scripts/system/</InstallDir>
        <WorkingDir>[/path/to/dir/used_as_working_dir]</WorkingDir>
        <AppDir>[/path/to/installation]</AppDir>
        <LimitOfTasks>4</LimitOfTasks>
      </Worker>
</Project>

关于c++ - C COMPS 执行失败的所有作业,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38633978/

相关文章:

c++:这怎么是语义错误

c++ - Rcpp - 定义采用 R 函数和省略号参数的 C++ 函数

algorithm - 如何生成信号以停止分布式模型中其他进程的执行

neural-network - tensorflow 。 Cifar10 多 gpu 示例使用更多 gpu 时性能更差

java - 为什么这些线程返回错误的计算结果?

C++ Boost.Asio - tcp 套接字异步写入

c++ - 是否可以从给定的文件描述符(以编程方式使用 C++)获取 PID?

检查 fclose() 是否失败并返回特定错误

c++ - 有没有办法确定每个 GL_LINE 元素将写入多少像素?

c - 你如何在 C 中求幂?