machine-learning - 计算机视觉和机器学习中特征描述符的解释

标签 machine-learning image-processing computer-vision feature-extraction feature-descriptor

我已经开始大量使用计算机视觉技术,主要是深度学习,但我想尝试很好地理解更传统的技术,并打下良好的基础。我一直在尝试一些手动特征工程技术,用于使用 RF 和 SVM 分类器进行分类。我研究了 HOG 和 LBP 描述符等纹理表示以及边缘滤波器、gabor 滤波器和傅里叶描述符等空间特征。我缺乏的是不同功能如何分组以及它们各自属于什么类别的好主意。我知道有些被定义为全局和本地,但这到底意味着什么以及哪些?我还应该考虑其他类别,例如纹理和几何吗?任何解释都会有用并且非常感谢(我在网上查了很多,但看起来都有点支离 splinter )

谢谢!

最佳答案

特征是从图像中以人类难以理解和关联的数值形式提取的信息。假设我们将图像视为数据,从数据中提取的信息称为特征。一般来说,从图像中提取的特征的维度比原始图像低得多。维度的减少减少了处理大量图像的开销。

根据应用程序,基本上有两种类型的特征是从图像中提取的。它们是本地和全局的特征。特征有时被称为描述符。全局描述符通常用于图像检索、对象检测和分类,而局部描述符用于对象识别/识别。检测和识别之间存在很大差异。检测是寻找某物/物体的存在(寻找图像/视频中是否存在物体),而识别是寻找物体的身份(识别人/物体)。

全局特征描述图像作为一个整体来概括整个对象,而局部特征描述对象的图像 block (图像中的关键点)。全局特征包括轮廓表示、形状描述符和纹理特征,局部特征表示图像 block 中的纹理。形状矩阵、不变矩(Hu、Zerinke)、直方图定向梯度(HOG)和 Co-HOG 是全局描述符的一些示例。 SIFT、SURF、LBP、BRISK、MSER 和 FREAK 是局部描述符的一些示例。

通常,对于诸如对象检测和分类之类的低级应用,使用全局特征,而对于诸如对象识别之类的高级应用,则使用局部特征。全局和局部特征的结合提高了识别的准确性,但带来了计算开销的副作用。

关于machine-learning - 计算机视觉和机器学习中特征描述符的解释,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59684368/

相关文章:

c++ - 我如何才能知道是否在最大水平上使用我的所有核心

c++ - 谁能提供 "Skeleton Pruning by Contour Partitioning with Discrete Curve Evolution"算法的简单步骤

python - Tensorflow 在多数投票上表现缓慢

numpy - BallTree现在支持不规则数据的自定义指标吗?

function - 神经激活函数 - Logistic/Tanh/等之间的差异

python - 霍夫线变换以在图像中查找多边形

java - 什么是最好的开源纯java计算机视觉库?

java - 如何使用 WordNet 或与 wordnet 相关的实现基于类别的文本标记?

java - 使用 JasperReports 在每个页面上创建折叠机的 OMR 图像

c++ - 使用 Nvidia NPP 调整图像大小时出现未记录的调整大小错误