image-processing - 使用神经网络搜索其他图像中的图案/图像

标签 image-processing machine-learning neural-network image-recognition backpropagation

我是神经网络的新手,并且确实了解它们如何工作的要点。我打算创建一个神经网络来识别 3D 场景中的基本对象及其在图像中的位置。

根据我到目前为止所读到的内容,典型的方法是创建一个神经网络,其输入神经元数量为 image_width * image_height * 3 (对于每种颜色),然后反向传播(图像识别的基本示例 can be found here .我还阅读了有关更智能方法的文章。问题是,因为我仍在学习,所以我打算保留一种基本方法来同步信息(这对于初学者状态可能可行,也可能不可行)。

我怎样才能以直接的方法做到这一点?真正的项目是在场景中移动并检测某些基本(或将来不会)的物体,例如球。

这是纯粹的学术研究,因此任务的实际范围是学习,因此也考虑了不完美的解决方案。

ball in view


What i would like would be to detect the ball in the image and actually have the ball position


最佳答案

这里有一个很好的 URL,您可以阅读有关解决类似任务的信息(使用 DNN 在图像中定位面部关键点):http://danielnouri.org/notes/2014/12/17/using-convolutional-neural-nets-to-detect-facial-keypoints-tutorial/

长话短说: 1)这是一个回归任务。您需要创建并训练 ANN,它将输出您感兴趣的对象的 x,y 坐标 2)您需要使用卷积神经网络来实现它 - 它们极大地提高了图像处理的效率

关于image-processing - 使用神经网络搜索其他图像中的图案/图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31182776/

相关文章:

algorithm - 如何自动检测和裁剪 Sprite 表中的单个 Sprite 边界?

c# - 我可以使用 PLINQ 并行处理图像吗?

ios - 调整图像选定区域的大小

Python 神经网络权重

python - 如何在功能性 Keras 模型中将前一层的权重作为输入传递给自定义层的调用函数?

python - 类型错误 : 'numpy.float64' object is not iterable Keras

php - 使用 PHP 从 URL 保存图像(保存为 0KB 文件大小)

machine-learning - OCR:扫描图像的特定部分

python - 恢复训练好的 tensorflow 模型,编辑与节点关联的值,然后保存

python - 检测图片中表格的模型