我看过很多关于 Viola-Jones 算法如何真正工作的文章和问题的答案。我不断找到答案,说某个区域中的“像素总和”减去相邻区域中的“像素总和”。我对“像素总和”的含义感到困惑。其值(value)依据是什么?是该区域的像素数吗?颜色的强度?
提前致谢。
最佳答案
这些定义基于 Viola-Jones 论文 'Robust Real-time Object Detection '
积分图像:位置 x, y = ii(x,y) 处的积分图像(ii)
ii(x,y) = > Sum of the pixels above and to the left of x, y inclusive
此处的“像素总和”表示像素 (x, y) 并包括行/列 x 和 y,考虑表示中的灰度图像。
积分图像的意义在于它加速了任何矩形像素 block 内像素强度总和的计算。例如四个数组引用。
由 ii(x,y) 给出的每个点的积分图像值本身可以在原始图像 i(x,y) 上一次计算出来
在传递过程中的每个点上使用以下方程,如引用论文中所述:
s(x,y) = s(x,y-1) + i(x,y);
ii(x,y) = ii(x-1,y) + s(x,y);
哪里
s(x,y) = the cumulative row sum;
s(x,-1) = 0;
ii(-1,y) = 0;
这些积分图像值随后用于生成特征以学习并随后检测对象。
关于algorithm - 维奥拉-琼斯算法 - "Sum of Pixels"?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23171232/