我是神经网络的新手,并且确实了解它们如何工作的要点。我打算创建一个神经网络来识别 3D 场景中的基本对象及其在图像中的位置。
根据我到目前为止所读到的内容,典型的方法是创建一个神经网络,其输入神经元数量为 image_width * image_height * 3 (对于每种颜色),然后反向传播(图像识别的基本示例 can be found here .我还阅读了有关更智能方法的文章。问题是,因为我仍在学习,所以我打算保留一种基本方法来同步信息(这对于初学者状态可能可行,也可能不可行)。
我怎样才能以直接的方法做到这一点?真正的项目是在场景中移动并检测某些基本(或将来不会)的物体,例如球。
这是纯粹的学术研究,因此任务的实际范围是学习,因此也考虑了不完美的解决方案。
What i would like would be to detect the ball in the image and actually have the ball position
最佳答案
这里有一个很好的 URL,您可以阅读有关解决类似任务的信息(使用 DNN 在图像中定位面部关键点):http://danielnouri.org/notes/2014/12/17/using-convolutional-neural-nets-to-detect-facial-keypoints-tutorial/
长话短说: 1)这是一个回归任务。您需要创建并训练 ANN,它将输出您感兴趣的对象的 x,y 坐标 2)您需要使用卷积神经网络来实现它 - 它们极大地提高了图像处理的效率
关于image-processing - 使用神经网络搜索其他图像中的图案/图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31182776/