python - AdaBoost 和维奥拉·琼斯 : What training set to use?

标签 python machine-learning computer-vision image-recognition viola-jones

我已经实现了我自己版本的 Viola Jones 人脸识别算法,该算法使用 AdaBoost 作为构建分类委员会的元。我的目标是建立一个可以识别图像中是否有人脸的分类器。我正在努力寻找足够的训练数据集来尝试该算法。特别是我不知道在哪里可以找到一组负片图像(即不包含脸部的图像)。对于正数据集,我将尝试“Labeled Faces in the Wild”数据集 link .

什么是好的负数据集?

最佳答案

可能适用于您的问题的一些解决方案是:

  • 环顾四周后,this资源似乎有一个非面孔数据集。

  • 您可以考虑的另一个数据集是 Google“things”数据集,发现 here ,(description)。

  • 您可能会考虑构建自己的数据集。如果您打算使用带有严重约束(裁剪)图像的 LFW 数据集,您可以获取一个包含人物和没有人的缩小照片的数据库,在其上运行标准人脸检测算法以确定人脸的位置,然后裁剪面部大小的部分,无论是在裁剪区域中有面部还是没有面部的情况。一些数据集,例如VGG face ,具有面部图像,并给出了它们的边界框。您可以考虑使用类似的东西。

  • 您还可以使用您知道其中没有面孔的任何数据集,只要它描述了您的算法可能遇到的场景。例如,CIFAR 10 和 CIFAR 100 集有很棒的户外场景,包括一些动物脸部的特写,这可能对您的算法来说是很好的负面影响。可以找到here 。另一个是Image Net设置。

选择此数据集时应小心,因为如果不小心,很容易引入偏差。

关于python - AdaBoost 和维奥拉·琼斯 : What training set to use?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47952249/

相关文章:

r - R 中的多标签分类

algorithm - 有没有数据挖掘的在线判断

计算机视觉的统计帮助

python - 如何从芝麻数据库的特定上下文中导出rdf?

python - 为什么即使 DataFrame 没有实现/继承 __iter__() , `list(<DataFrame>)` 仍然可以工作?

python - 在 gitpython 中获取特定文件的所有修订

python - 图像比较算法

python - 如何在 python 中验证 SSL 证书?

python - 使用进化算法实现对抗性示例生成器表现不佳

python - Pixels_per_cell 的默认值 skimage.feature.hog