computer-vision - 如何读取Adience benchmark数据(性别年龄分类数据集)?

标签 computer-vision deep-learning conv-neural-network dlib

我正在尝试使用 adience 中的数据通过 cnn 训练性别和年龄分类我有两个问题。

1 : 根据网站,人脸的边界框记录在字段“x,y,dx,dy”中。例如,来自 fold_frontal_0_data.txt,第一个数据是

image name  : 10424815813_e94629b1ec_o.jpg  
(x,y,dx,dy) : 301 105 640 641   

然而,边界框的数据很奇怪,因为图像的大小只有 600x601,无论我将 (x,y,dx,dy) 视为 (left, top, width, height) 还是 (left 、上、右、下),我无法按预期裁剪脸部。我怎样才能正确裁剪脸部?

2:训练数据需要做人脸对齐吗?或者我只需要在测试时进行人脸对齐?或者两者都做?谢谢

这是图片--10424815813_e94629b1ec_o.jpg 10424815813_e94629b1ec_o.jpg

最佳答案

我是另一个处理 Adience 数据集的人。

您上传的图片文件名是

coarse_tilt_aligned_face.2.10424815813_e94629b1ec_o.jpg

不是

image name : 10424815813_e94629b1ec_o.jpg

如果你准确地看到README.txt,你可以找到

original_image - the filename. Unfortunately we are unable to provide a URL, as we only have the file name and there is no way to reproduce it from the API. A link to the account is provided for accrediting.

(x,y,dx,dy) 信息应该从 original_image 中获取。

关于computer-vision - 如何读取Adience benchmark数据(性别年龄分类数据集)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40570530/

相关文章:

python - 如何训练 tensorflow 模型准确区分睁眼和闭眼?

python - 如何在 Pytorch 中实现上限 JSD 损失?

deep-learning - Caffe 深度学习库示例

python - 具有可变输入大小的 tensorflow Conv 网络的 Keras

tensorflow - 如何将中间卷积层的结果存储在 tensorflow 中以供以后处理?

python - 训练 uNet 模型预测只有黑色

opencv - 用于语义分割的单热标签

opencv - HOG 特征描述符训练如何工作?

deep-learning - Keras:扩大层输出 blob 空间维度的方法

computer-vision - 俄语手写字符数据集