c++ - (opencv rc1) 是什么导致 Mat 乘法比每像素乘法慢 20 倍?

标签 c++ opencv java-native-interface arm neon

// 700 ms
cv::Mat in(height,width,CV_8UC1);
in /= 4;

替换为

//40 ms
cv::Mat in(height,width,CV_8UC1);
for (int y=0; y < in.rows; ++y)
{
    unsigned char* ptr = in.data + y*in.step1();
    for (int x=0; x < in.cols; ++x)
    {
        ptr[x] /= 4;
    }
}

什么会导致这种行为?是由于 opencv 将具有标量乘法的 Mat“提升”为具有 Mat 乘法的 Mat,还是针对 arm 的特定失败优化? ( NEON 已启用)。

最佳答案

这是一个非常老的问题(我几年前就报告过),许多基本操作都需要额外的时间。不仅仅是除法,还有加法、abs 等等……我不知道这种行为的真正原因。更奇怪的是,本应花费更多时间的操作,如 addWeighted,实际上非常高效。试试这个:

addWeighted(in, 1.0/4, in, 0, 0, in);

它对每个像素执行多个操作,但它的运行速度比添加函数和循环实现快几倍。

这是我的 report在错误跟踪器上。

关于c++ - (opencv rc1) 是什么导致 Mat 乘法比每像素乘法慢 20 倍?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30167044/

相关文章:

c++ - 如何使用 libpd 从纯数据补丁接收命名信号?

java - 想要将视频快照保存在特定目录中

c++ - SVM 分类器(响应数组必须包含与样本总数一样多的元素)

java - jni 使用 NewDirectByteBuffer 在 java 中看到随机的东西

未找到 Android native 库

java - 通过JNI有效地传递大型C结构

c++ - 成员没有默认构造函数

c++ - 外部变量未声明

c++ - 检测空白字符、\t、\n 等

c++ - 将 Qimage 转换为 Mat opencv 时出错