python - 图像识别能否处理质量不直接可见的类别?

标签 python keras image-recognition

我遇到以下问题,不太确定是否可以通过图像识别(和卷积神经网络)来解决。

我有一个包含 400k 张图片的数据集,分为 5 个类别。这些图片是应用程序的屏幕截图,根据它们收到的年龄评级分为 5 个类别。

例如:我有200k标记为0级,这意味着它们适合所有年龄段(根据年龄分级);我有 50k 张图片标记为 1 类(适合 6 岁以上 child )等等。

利用这些数据,我想训练一个神经网络,它可以告诉我屏幕截图(以及相应的游戏)可能有哪个年龄分级。

这是一个问题吗?可以通过图像识别来解决吗?

我研究了图像识别的示例(主要是 Keras 教程),它们都处理明显可见的问题(例如“图像显示的是猫还是狗”)。浏览我的数据集,我意识到,有些图片非常相似,尽管属于不同的类别。

卷积神经网络(或任何其他类型的图像识别算法)可以处理决定因素不直接可见的类别吗?这只是网络深度的问题吗?

如果有人能给我指出在哪里寻找更多信息的大致方向,我将非常感激。

最佳答案

可以,也不能。为了让 CNN 在没有上下文输入的情况下提供良好的结果,这意味着输入和输出之间必须存在某种相关性。因此,假设某些应用程序的设计与年龄评级相关,那么是的,这是可能的,否则就不可能,除非您为网络提供更多可用的东西。

这实际上可以让你进行一个很酷的实验来检查自己,通过一些普通的 CNN 运行它,如果它评估良好(通过交叉验证),那么你可能已经表明存在相关性

(注意:如果模型测试得不好,这并不能证明相关性不存在,可能不太可能,但不能保证)

关于python - 图像识别能否处理质量不直接可见的类别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54871092/

相关文章:

python - 如何复制 tf.keras.models.Model 子类?

python - 输入 'ref' 在构建 NodeDef 时传递了 int32 预期的引用类型

image-processing - 查找两个图像之间的差异,但*不是*像素到像素

python - 跳过 -with- block 的执行

python - 检测文本之间的空格(OpenCV、Python)

java - 如何为 map 中的区域/边界做自动图像映射

ios - iOS 中的图像识别

python - Pytest 没有在终端中提供正确的输出

python - 具有矢量输出和 2D 图像图输入的 CNN(输入是数组)

c++ - 使用 KNN 分类器进行数字识别前的预处理