我遇到以下问题,不太确定是否可以通过图像识别(和卷积神经网络)来解决。
我有一个包含 400k 张图片的数据集,分为 5 个类别。这些图片是应用程序的屏幕截图,根据它们收到的年龄评级分为 5 个类别。
例如:我有200k标记为0级,这意味着它们适合所有年龄段(根据年龄分级);我有 50k 张图片标记为 1 类(适合 6 岁以上 child )等等。
利用这些数据,我想训练一个神经网络,它可以告诉我屏幕截图(以及相应的游戏)可能有哪个年龄分级。
这是一个问题吗?可以通过图像识别来解决吗?
我研究了图像识别的示例(主要是 Keras 教程),它们都处理明显可见的问题(例如“图像显示的是猫还是狗”)。浏览我的数据集,我意识到,有些图片非常相似,尽管属于不同的类别。
卷积神经网络(或任何其他类型的图像识别算法)可以处理决定因素不直接可见的类别吗?这只是网络深度的问题吗?
如果有人能给我指出在哪里寻找更多信息的大致方向,我将非常感激。
最佳答案
可以,也不能。为了让 CNN 在没有上下文输入的情况下提供良好的结果,这意味着输入和输出之间必须存在某种相关性。因此,假设某些应用程序的设计与年龄评级相关,那么是的,这是可能的,否则就不可能,除非您为网络提供更多可用的东西。
这实际上可以让你进行一个很酷的实验来检查自己,通过一些普通的 CNN 运行它,如果它评估良好(通过交叉验证),那么你可能已经表明存在相关性
(注意:如果模型测试得不好,这并不能证明相关性不存在,可能不太可能,但不能保证)
关于python - 图像识别能否处理质量不直接可见的类别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54871092/