我正在用 C 实现统一的 LBP。但我对这个概念感到困惑。我已经实现了 LBP。假设我有一个 512*512 尺寸的图像。 LBP 之后它将是 510*510。现在如何从这个 LBP 图像中获取 256 个 bins/pixels。
for(i=1; i < image_src->width - 1; i++)
{
for(j=1; j < image_src->height - 1; j++)
{
const unsigned char center = image_get_pixel_value(image_src, i, j , 0);
unsigned char code = 0;
if(center <= image_get_pixel_value(image_src, i-1, j-1 , 0))
code += 128;
if(center <= image_get_pixel_value(image_src, i-1, j , 0))
code += 64;
if(center <= image_get_pixel_value(image_src, i-1, j+1 , 0))
code += 32;
if(center <= image_get_pixel_value(image_src, i, j+1 , 0))
code += 16;
if(center <= image_get_pixel_value(image_src, i+1, j+1 , 0))
code += 8;
if(center <= image_get_pixel_value(image_src, i+1, j , 0))
code += 4;
if(center <= image_get_pixel_value(image_src, i+1, j-1 , 0))
code += 2;
if(center <= image_get_pixel_value(image_src, i, j-1 , 0))
code += 1;
image_set_pixel_value(image_tar, i-1, j-1, 0, code);
}
}
这是查找表:
int UniformPattern59[16][16] = {
1, 2, 3, 4, 5, 0, 6, 7, 8, 0, 0, 0, 9, 0, 10, 11,
12, 0, 0, 0, 0, 0, 0, 0, 13, 0, 0, 0, 14, 0, 15, 16,
17, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
18, 0, 0, 0, 0, 0, 0, 0, 19, 0, 0, 0, 20, 0, 21, 22,
23, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
24, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
25, 0, 0, 0, 0, 0, 0, 0, 26, 0, 0, 0, 27, 0, 28, 29,
30, 31, 0, 32, 0, 0, 0, 33, 0, 0, 0, 0, 0, 0, 0, 34,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 35,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 36,
37, 38, 0, 39, 0, 0, 0, 40, 0, 0, 0, 0, 0, 0, 0, 41,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 42,
43, 44, 0, 45, 0, 0, 0, 46, 0, 0, 0, 0, 0, 0, 0, 47,
48, 49, 0, 50, 0, 0, 0, 51, 52, 53, 0, 54, 55, 56, 57, 58
};
最佳答案
我猜你可能误解了 LBP 的概念。 LBP有几个变体:基本LBP、均匀LBP和旋转不变均匀LBP。
在basic LBP中,我们比较中心像素与其相邻像素之一(插值像素以获得更准确结果)之间的灰度值以获得二进制编码(0 或 1)对于位。通常,我们将这种编码方案的半径设置为 1,将邻居数设置为 8 作为默认配置。因此,我们可以在比较所有8个邻居之后得到中心像素的局部二进制模式(LBP),这是一个8位二进制数,例如01011110或11110000。在这里,我们可以看到这种如果我们将二进制数转换为十进制数,LBP 是从 0 到 255。我们通常将每个像素的LBP代码分类为256种模式中的一种,以形成直方图以进行进一步的分类或识别任务,即您问题中的256bins/pixels。
但是,均匀和旋转不变均匀 LBP 有一些不同。也就是说,模式的数量不是256,其中旋转不变均匀LBP只有10种模式。旋转均匀 LBP 有 9 个旋转均匀 LBP 和其他 1 个,其中 9 个旋转均匀 LBP 通常覆盖图像上 90% 的图案。
因此,在旋转不变的均匀 LBP 中,您只需生成 10-bins 直方图即可进行进一步处理,例如分类或识别。首先,您将每个像素编码为旋转不变的均匀 LBP,这可能会产生一个 image.rows*image.cols 矩阵。然后,将每个模式(矩阵元素)分类为10个模式之一,形成一个数组来表示直方图。
供您引用的一些论文:
- Scholarpedia 上的 LBP,http://www.scholarpedia.org/article/Local_Binary_Patterns
- LBP 作者的 C++ 代码,http://www.cse.oulu.fi/CMV/Downloads/LBPSoftware
- 具有局部二进制模式的多分辨率灰度和旋转不变纹理分类,http://www.rafbis.it/biplab15/images/stories/docenti/Danielriccio/Articoliriferimento/LBP.pdf
关于c - 如何从 LBP 图像中获取 256 个 bins/pixels?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12071800/