image-processing - 使用神经网络搜索其他图像中的图案/图像

标签 image-processing machine-learning neural-network image-recognition backpropagation

我是神经网络的新手，并且确实了解它们如何工作的要点。我打算创建一个神经网络来识别 3D 场景中的基本对象及其在图像中的位置。

根据我到目前为止所读到的内容，典型的方法是创建一个神经网络，其输入神经元数量为 image_width * image_height * 3 (对于每种颜色)，然后反向传播(图像识别的基本示例 can be found here .我还阅读了有关更智能方法的文章。问题是，因为我仍在学习，所以我打算保留一种基本方法来同步信息(这对于初学者状态可能可行，也可能不可行)。

我怎样才能以直接的方法做到这一点？真正的项目是在场景中移动并检测某些基本(或将来不会)的物体，例如球。

这是纯粹的学术研究，因此任务的实际范围是学习，因此也考虑了不完美的解决方案。

ball in view

What i would like would be to detect the ball in the image and actually have the ball position

最佳答案

这里有一个很好的 URL，您可以阅读有关解决类似任务的信息(使用 DNN 在图像中定位面部关键点):http://danielnouri.org/notes/2014/12/17/using-convolutional-neural-nets-to-detect-facial-keypoints-tutorial/

长话短说: 1)这是一个回归任务。您需要创建并训练 ANN，它将输出您感兴趣的对象的 x,y 坐标 2)您需要使用卷积神经网络来实现它 - 它们极大地提高了图像处理的效率

关于image-processing - 使用神经网络搜索其他图像中的图案/图像，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31182776/

上一篇：machine-learning - 嵌套交叉验证真的有必要吗？

下一篇：machine-learning - 到底什么时候使用逻辑回归而不是线性回归？

c# - 我可以使用 PLINQ 并行处理图像吗？

ios - 调整图像选定区域的大小

Python 神经网络权重

python - 如何在功能性 Keras 模型中将前一层的权重作为输入传递给自定义层的调用函数？

python - 类型错误 : 'numpy.float64' object is not iterable Keras

php - 使用 PHP 从 URL 保存图像(保存为 0KB 文件大小)

machine-learning - OCR:扫描图像的特定部分

python - 恢复训练好的 tensorflow 模型，编辑与节点关联的值，然后保存

python - 检测图片中表格的模型