我得到了一个 200x200 的图像,作为像素的字节数组(每个像素 3 个字节,代表 RGB 值)。我想选择所有边界点,定义为非白色的点,并且位于图像的边界上或具有不同颜色的相邻像素。
为此编写了简单的 C 代码:
int i = 0, row = 0, column = 0, width3 = width*3;
char r,g,b;
while (i < length) {
r = pixels[i], g = pixels[i+1], b = pixels[i+2];
if (r != -1 || g != -1 || b != -1) { // Not white
// Check for border point
if (column == 0 || column == width-1 || row == 0 || row == height-1
|| r != pixels[i-3] || r != pixels[i+3] || r != pixels[i-width3] || r != pixels[i+width3]
|| g != pixels[i-2] || g != pixels[i+4] || g != pixels[i-width3+1] || g != pixels[i+width3+1]
|| b != pixels[i-1] || b != pixels[i+5] || b != pixels[i-width3+2] || b != pixels[i+width3+2]) {
// Border point
}
}
i += 3;
if (++column == width) {
column = 0;
row++;
// printf("new row");
}
}
现在我想知道如何尽可能加快速度。 要么我可以使用 GPU,但是从 GPU 传输内存和向 GPU 传输内存非常昂贵。
由于我对任何类型的优化技术(例如 openCV 中使用的优化技术)都是全新的,所以我想知道是否有任何方法可以使我的代码段更快。
(有关更多上下文;我想将图像上每个非白色对象的边界点解释为可见对象的“轮廓”,然后使用 Douglas-Peucker 将轮廓近似为多边形)
最佳答案
一些微优化:
重新组织行上的循环以仅访问完全位于图像内部的像素对,这样您就无需测试列索引和行索引;
不测试左右:如果两个像素不同,一次比较就足够了;
如果您检测到边界点(它们只是图像区域的一小部分),则仅测试白色;
您的 12 次比较测试(将减少到 6 次)可能是有效的,因为它使用快捷逻辑(以便所有测试仅在统一区域执行)。您可以尝试将其换成无分支表达式,它总是会完整执行,但会避免代价高昂的条件分支:使用 r0 - r1 | g0 - g1 | b0 - b1
,对于相同的颜色仅为零。
或者更好的是,一次加载整个像素作为整数值,计算适当的偏移量,对它们进行异或并屏蔽掉额外的字节:(*(unsigned int*)pixels ^ *(unsigned int*) (像素 + 3)) >> 8
.
如果这还不够,你可以考虑使用 vector 指令集(SSE/AVX),但这是另一个故事。
关于c - 优化循环遍历像素的代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47562303/