machine-learning - 计算机视觉和机器学习中特征描述符的解释

我已经开始大量使用计算机视觉技术，主要是深度学习，但我想尝试很好地理解更传统的技术，并打下良好的基础。我一直在尝试一些手动特征工程技术，用于使用 RF 和 SVM 分类器进行分类。我研究了 HOG 和 LBP 描述符等纹理表示以及边缘滤波器、gabor 滤波器和傅里叶描述符等空间特征。我缺乏的是不同功能如何分组以及它们各自属于什么类别的好主意。我知道有些被定义为全局和本地，但这到底意味着什么以及哪些？我还应该考虑其他类别，例如纹理和几何吗？任何解释都会有用并且非常感谢(我在网上查了很多，但看起来都有点支离 splinter )

谢谢!

最佳答案

特征是从图像中以人类难以理解和关联的数值形式提取的信息。假设我们将图像视为数据，从数据中提取的信息称为特征。一般来说，从图像中提取的特征的维度比原始图像低得多。维度的减少减少了处理大量图像的开销。

根据应用程序，基本上有两种类型的特征是从图像中提取的。它们是本地和全局的特征。特征有时被称为描述符。全局描述符通常用于图像检索、对象检测和分类，而局部描述符用于对象识别/识别。检测和识别之间存在很大差异。检测是寻找某物/物体的存在(寻找图像/视频中是否存在物体)，而识别是寻找物体的身份(识别人/物体)。

全局特征描述图像作为一个整体来概括整个对象，而局部特征描述对象的图像 block (图像中的关键点)。全局特征包括轮廓表示、形状描述符和纹理特征，局部特征表示图像 block 中的纹理。形状矩阵、不变矩(Hu、Zerinke)、直方图定向梯度(HOG)和 Co-HOG 是全局描述符的一些示例。 SIFT、SURF、LBP、BRISK、MSER 和 FREAK 是局部描述符的一些示例。

通常，对于诸如对象检测和分类之类的低级应用，使用全局特征，而对于诸如对象识别之类的高级应用，则使用局部特征。全局和局部特征的结合提高了识别的准确性，但带来了计算开销的副作用。

关于machine-learning - 计算机视觉和机器学习中特征描述符的解释，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59684368/

machine-learning - 计算机视觉和机器学习中特征描述符的解释

上一篇：machine-learning - 谷歌云架构: Can a data lake be used for OLTP?

下一篇：python - 使用用户的个人数据计算相似度？