// 700 ms
cv::Mat in(height,width,CV_8UC1);
in /= 4;
替换为
//40 ms
cv::Mat in(height,width,CV_8UC1);
for (int y=0; y < in.rows; ++y)
{
unsigned char* ptr = in.data + y*in.step1();
for (int x=0; x < in.cols; ++x)
{
ptr[x] /= 4;
}
}
什么会导致这种行为?是由于 opencv 将具有标量乘法的 Mat“提升”为具有 Mat 乘法的 Mat,还是针对 arm 的特定失败优化? ( NEON 已启用)。
最佳答案
这是一个非常老的问题(我几年前就报告过),许多基本操作都需要额外的时间。不仅仅是除法,还有加法、abs 等等……我不知道这种行为的真正原因。更奇怪的是,本应花费更多时间的操作,如 addWeighted,实际上非常高效。试试这个:
addWeighted(in, 1.0/4, in, 0, 0, in);
它对每个像素执行多个操作,但它的运行速度比添加函数和循环实现快几倍。
这是我的 report在错误跟踪器上。
关于c++ - (opencv rc1) 是什么导致 Mat 乘法比每像素乘法慢 20 倍?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30167044/