c++ - 沿非连续维度对图像进行装箱的最快方法

我有一张 700x2000 uint8 的图像。现在我要进行分箱，也就是对内存中不连续的每4行求和。

现在我正在为这条线的总和分配一个新数组并将每一行添加到它。

float* binnedLine = new float[lineSize];
char* binnedLineInt = new char[lineSize];

for (int j = 0; j < nlines; j++) 
{
    if (j % binsize == 0) 
    {
        for (int i = 0; i < lineSize; i++) 
        {
            binnedLine[i] = (static_cast<float> (static_cast<char>(data[j*lineSize + i]))) / binsize;
            binnedLineInt[i] = static_cast<char>(binnedLine[i]);
        };
    }
    else 
    {
        for (int i = 0; i < lineSize; i++) 
        {
            binnedLine[i] += (static_cast<float> (static_cast<char>(data[j*lineSize + i]))) / binsize;
            binnedLineInt[i] = static_cast<char>(binnedLine[i]);
        };
    }

    ...
}

但是性能并不足以满足我的目的(每帧需要 3 毫秒)。有没有更有效的方法？

最佳答案

您将 float 值转换为 char 4 次，但只保留最后一次转换。同时，我们将删除 if 和 %，并避免多余的除法。试试这个:

float* binnedLine = new float[lineSize];
char* binnedLineInt = new char[lineSize];

for (int j = 0; j < nlines; j += binsize) 
{
    for (int i = 0; i < lineSize; ++i) 
    {
        binnedLine[i] = static_cast<float>(data[j*lineSize + i]);
    };
    for (int k = 1; k < binsize; ++k)
    {
        for (int i = 0; i < lineSize; ++i) 
        {
            binnedLine[i] += static_cast<float>(data[(j+k)*lineSize + i]);
        };
    }
    for (int i = 0; i < lineSize; ++i) 
    {
        binnedLineInt[i] = static_cast<char>(binnedLine[i] / binsize);
    }
    ...
}

但是作为@MSalters said in a comment ，您最好一次访问四行，因为这样可以避免保留和写入额外的浮点缓冲区:

char* binnedLineInt = new char[lineSize];

for (int j = 0; j < nlines; j += binsize) 
{
    for (int i = 0; i < lineSize; ++i) 
    {
        float sum = static_cast<float>(data[j*lineSize + i]);
        for (int k = 1; k < binsize; ++k)
        {
            sum += static_cast<float>(data[(j+k)*lineSize + i]);
        }
        binnedLineInt[i] = static_cast<char>(sum / binsize);
    }
    ...
}

此外，较短的代码更容易正确和维护。

关于c++ - 沿非连续维度对图像进行装箱的最快方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54571960/

c++ - 沿非连续维度对图像进行装箱的最快方法

上一篇：c++ - 如何在 C++ 中将尾数和指数转换为 Double

下一篇：c++ - 比较 qsort 中的字符串