我有一张 700x2000 uint8 的图像。现在我要进行分箱,也就是对内存中不连续的每4行求和。
现在我正在为这条线的总和分配一个新数组并将每一行添加到它。
float* binnedLine = new float[lineSize];
char* binnedLineInt = new char[lineSize];
for (int j = 0; j < nlines; j++)
{
if (j % binsize == 0)
{
for (int i = 0; i < lineSize; i++)
{
binnedLine[i] = (static_cast<float> (static_cast<char>(data[j*lineSize + i]))) / binsize;
binnedLineInt[i] = static_cast<char>(binnedLine[i]);
};
}
else
{
for (int i = 0; i < lineSize; i++)
{
binnedLine[i] += (static_cast<float> (static_cast<char>(data[j*lineSize + i]))) / binsize;
binnedLineInt[i] = static_cast<char>(binnedLine[i]);
};
}
...
}
但是性能并不足以满足我的目的(每帧需要 3 毫秒)。有没有更有效的方法?
最佳答案
您将 float 值转换为 char 4 次,但只保留最后一次转换。同时,我们将删除 if
和 %
,并避免多余的除法。试试这个:
float* binnedLine = new float[lineSize];
char* binnedLineInt = new char[lineSize];
for (int j = 0; j < nlines; j += binsize)
{
for (int i = 0; i < lineSize; ++i)
{
binnedLine[i] = static_cast<float>(data[j*lineSize + i]);
};
for (int k = 1; k < binsize; ++k)
{
for (int i = 0; i < lineSize; ++i)
{
binnedLine[i] += static_cast<float>(data[(j+k)*lineSize + i]);
};
}
for (int i = 0; i < lineSize; ++i)
{
binnedLineInt[i] = static_cast<char>(binnedLine[i] / binsize);
}
...
}
但是作为@MSalters said in a comment ,您最好一次访问四行,因为这样可以避免保留和写入额外的浮点缓冲区:
char* binnedLineInt = new char[lineSize];
for (int j = 0; j < nlines; j += binsize)
{
for (int i = 0; i < lineSize; ++i)
{
float sum = static_cast<float>(data[j*lineSize + i]);
for (int k = 1; k < binsize; ++k)
{
sum += static_cast<float>(data[(j+k)*lineSize + i]);
}
binnedLineInt[i] = static_cast<char>(sum / binsize);
}
...
}
此外,较短的代码更容易正确和维护。
关于c++ - 沿非连续维度对图像进行装箱的最快方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54571960/