python-3.x - 如何通过在 36x60 大小的数据上训练的神经网络预测不同的数据？

标签 python-3.x opencv keras neural-network data-science

我正在使用形状为 36x60 的眼睛图像训练神经网络。所以我只能使用 36x60 图像预测结果？但是在我的应用程序中，我有一个视频流，这个流被分成帧，每帧预测 68 个地标点。在眼睛范围内，我可以选择视点，使用 OpenCV 的“boundingrect”函数，很容易得到裁剪图像。但是这张图片没有 36x60 的形式。获取可用于预测的 36x60 数据的正确方法是什么？或者如何将神经网络用于另一种形式的数据？

最佳答案

神经网络(就我所遇到的而言)具有固定的输入形状，只允许批量大小自由。这(可能)适用于你见过的每一个惊人的神经网络。不要害怕使用现成的采样将图像 reshape 为网络的预期输入大小。强大的计算机视觉网络通常在增强数据上进行训练；随机缩放、倾斜和以其他方式进行转换，以便(除其他外)扩大网络处理这种不可避免的缩放情况的能力。

当然有一些注意事项。用于预测的输入应尽可能与其训练的数据集相似，也就是说，模型应应用于为其设计的数据。例如，考虑为卫星应用制作的目标检测网络。如果将相同的网络应用于无人机图像，则对象的相对大小可能比设计网络(特别是其 anchor 框大小)的对象大得多。

Tl;dr:假设您使用正确的网络来完成工作，不要害怕缩放图像/帧以适应网络的输入。

关于python-3.x - 如何通过在 36x60 大小的数据上训练的神经网络预测不同的数据？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56181395/

上一篇：python - 在 Python OpenCV 中查找 connectedComponents 的颜色

下一篇：c# - 使用OpenCV解决非平面物体点和图像点之间的变换

image - 使用开源图形库去除灰尘和划痕

python - 如果输入宽度和高度与调整输入和宽度的大小相同， cv2.resize() 会做什么？

python - Keras/Tensorflow 预测 : error in array shape

optimization - 神经网络优化

python - 为什么这个 Python ascii 字符串不等于常规字符串？

使用带有脚本的 setuptools 的 Python 相对导入

python - 如何使用 C 库刷新 Python 程序中的内存？

python - 在 Tensorflow 中，为什么只有在准备导出模型时才为其添加激活函数？

python - 尝试压缩一个句子然后将其上传到文件