c - C 上的 MPI,段错误 : 11

标签 c parallel-processing segmentation-fault mpi simultaneous

我有 Mac OS X Yosemite 10.10.1 (14B25)。

我在编译代码时遇到了一些问题。在这里:

#include <stdio.h>
#include <mpi.h>

#define n 3
#define repeats 1

double abs(double item)
{
    return (item > 0) ? item : -item;
}

int swap_raws (double **a, int p, int q)
{
    if (p >= 0 && p < n && q >= 0 && q < n)
    {
        if (p == q)
            return 0;    

        for (int i = 0; i < n; i++)
        {
            double temp = a[p][i];
            a[p][i] = a[q][i];
            a[q][i] = temp;
        }

        return 0;
    }
    else
        return -1;
}

double f_column (int rank, int size, double *least)
{
    double t1, t2, tbeg, tend, each_least = 1, least0;
    int map[n];
    double **a = malloc (sizeof (*a) * n);
    int i, j, k;    

    for (i = 0; i < n; i++)
        a[i] = malloc (sizeof (*a[i]) * n);    

    if (rank == 0)
        for (i = 0; i < n; i++)
            for (j = 0; j < n; j++)
                a[i][j] = 1.0 / (i + j + 1);

    MPI_Bcast (a, n * n, MPI_DOUBLE, 0, MPI_COMM_WORLD);

    for (i = 0; i < n; i++)
        map[i] = i % size;

    MPI_Barrier (MPI_COMM_WORLD);

    t1 = MPI_Wtime ();

    for (k = 0; k < n - 1; k++)
    {
        double max = abs (a[k][k]);
        int column = k;

        for (j = k + 1; j < n; j++)
        {
            double absv = abs (a[k][j]);

            if (absv > max)
            {
                max = absv;
                column = j;
            }
        }

        if (map[k] == rank && column != k && swap_raws (a, k, column))
        {
            printf("ERROR SWAPPING %d and %d columns\n", k, column);
            return -1;
        }

        MPI_Bcast (&a[k], n, MPI_DOUBLE, map[k], MPI_COMM_WORLD);
        MPI_Bcast (&a[column], n, MPI_DOUBLE, map[k], MPI_COMM_WORLD);

        if (map[k] == rank)
            for (i = k + 1; i < n; i++)
                a[k][i] /= a[k][k];

        MPI_Barrier (MPI_COMM_WORLD);
        MPI_Bcast (&a[k][k+1], n - k - 1, MPI_DOUBLE, map[k], MPI_COMM_WORLD);

        for (i = k + 1; i < n; i++)
            if (map[i] == rank)
                for (j = k + 1; j < n; j++)
                    a[j][i] -= a[j][k] * a[i][j];
    }

    t2 = MPI_Wtime ();

    for (i = 0; i < n; i++)
        if (map[i] == rank)
            for (j = 0; j < n; j++)
            {
                double absv = abs (a[i][j]);

                if (each_least > absv)
                    each_least = absv;

                //printf ("a[%d][%d] = %lg\n", j, i, a[i][j]);
            }

    MPI_Reduce (&each_least, &least0, 1, MPI_DOUBLE, MPI_MIN, 0, MPI_COMM_WORLD);
    MPI_Reduce (&t1, &tbeg, 1, MPI_DOUBLE, MPI_MIN, 0, MPI_COMM_WORLD);
    MPI_Reduce (&t2, &tend, 1, MPI_DOUBLE, MPI_MAX, 0, MPI_COMM_WORLD);

    for (i = 0; i < n; i++)
        free (a[i]);
    free (a);

    if (rank == 0)
    {
        *least = least0;
        return (tend - tbeg);
    }
}

int main (int argc, char *argv[])
{
    int rank, size;
    double min, max, aver, least;

    if (n == 0)
        return 0;

    MPI_Init (&argc, &argv);
    MPI_Comm_rank (MPI_COMM_WORLD, &rank);
    MPI_Comm_size (MPI_COMM_WORLD, &size);

    // It works!
    //double try = f_column_non_parallel (rank, size, &least);
    double try = f_column (rank, size, &least);
    aver = max = min = try;

    for (int i = 1; i < repeats; i++)
    {
        //double try = f_column_non_parallel (rank, size, &least);
        double try = f_column (rank, size, &least);

        if (try < min)
            min = try;
        else if (try > max)
            max = try;

        aver += try;
    }
    aver /= repeats;

    MPI_Finalize ();

    if (rank == 0)
        printf("N: %d\nMIN: %f\nMAX: %f\nAVER: %f\nLEAST: %lg\n", size, min, max, aver, least);

    return 0;
}

我有吉尔伯特矩阵。 a(i)(j) = 1/(i + j + 1) 对于 i,j 从 0 到 n

此代码应使用 MPI 查找 LU 分解,以便以并行方式进行。

第一个进程初始化数组,然后将其广播给其他进程。

然后我在原始数据中找到最大值并交换该列。然后我想将该数据广播到每个进程,即使用 MPI_Barrier (MPI_COMM_WORLD); 但它说:

The error below 所以,我不知道发生了什么,也不知道如何解决这个问题。该程序的相同变体在不使用进程和非并行版本的情况下运行,但在此处不起作用。

如果你找到了解决方案,这个例子应该是这样的(我是自己计算的,你也可以检查一下,但我承认这是真的)。矩阵(这里 j 和 i 分别是垂直和水平的,它的工作方式对人们来说不是很方便,但你应该接受它):

1   1/2 1/3    1   1/2  1/3     1   1/2  1/3      |1   1/2  1/3  |
1/2 1/3 1/4 -> 1/2 1/12 1/12 -> 1/2 1/12 1     -> |1/2 1/12 1/12 | <- answer
1/3 1/4 1/5    1/3 1/12 4/45    1/3 1/12 1/180    |1/3 1    1/180|

源矩阵so:

    |1   0 0|   |1 1/2  1/3  |   |1   1/2 1/3|
A = |1/2 1 0| * |0 1/12 1/12 | = |1/2 1/3 1/4|
    |1/3 1 1|   |0 0    1/180|   |1/3 1/4 1/5|

你能帮我找出错误吗?提前谢谢你:)

最佳答案

您的程序在以下代码部分存在错误:

double **a = malloc (sizeof (*a) * n);
[...snip...]
MPI_Bcast (a, n * n, MPI_DOUBLE, 0, MPI_COMM_WORLD);

您正在“a”中分配“n”个指针,而不是“n * n”数组。因此,当您执行“a”的“n * n”大小的 MPI_Bcast 时,您要求 MPI 从未分配的垃圾内存位置进行传输。这会导致 MPI 出现段错误。

您可以将“a”更改为简单的“double *”而不是“double **”,并在其中分配 'n * n' 个 double 值来解决此问题。

关于c - C 上的 MPI,段错误 : 11,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27181753/

相关文章:

c++ - 如何在 Code::Blocks 中查看运行时调用的函数列表

C 编程、堆栈、打印堆栈错误

c - 以 0x8 和 0xC 开头的 HRESULT 错误代码有什么区别?

我可以使用 SIMD 进行存储桶排序/分类吗?

javascript - 异步并行请求按顺序运行

parallel-processing - 在 Julia 的函数中使用 addprocs() 和 pmap()

python - 在 python 2.7 中并行运行函数以在其他函数末尾使用函数的输出

c++ - 为什么这个段错误没有

c - c中分配错误中的不兼容类型

c - 将双指针传递给另一个函数