python - 神经网络不接受灰度图像

标签 python opencv machine-learning neural-network deep-learning

我遵循了本教程:https://www.pyimagesearch.com/2017/09/11/object-detection-with-deep-learning-and-opencv/ 我更改了这部分,在将图像输入插入神经网络之前将其转换为灰度

frame = vs.read()
frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
frame = imutils.resize(frame, width=400)

(h, w) = frame.shape[:2]
blob = cv2.dnn.blobFromImage(cv2.resize(frame, (300, 300)),
    0.007843, (300, 300), 127.5)
net.setInput(blob)
detections = net.forward()

但是出现此错误:

OpenCV(3.4.1) Error: Assertion failed (ngroups > 0 && inpCn % ngroups == 0 && outCn % ngroups == 0) in cv::dnn::ConvolutionLayerImpl::getMemoryShapes, file D:\Build\OpenCV\opencv-3.4.1\modules\dnn\src\layers\convolution_layer.cpp, line 234
    Traceback (most recent call last):
      File "C:/Users/Toshiba/PycharmProjects/real-time-object-detection/study7ver2.py", line 75, in <module>
        detections = net.forward()
    cv2.error: OpenCV(3.4.1) D:\Build\OpenCV\opencv-3.4.1\modules\dnn\src\layers\convolution_layer.cpp:234: error: (-215) ngroups > 0 && inpCn % ngroups == 0 && outCn % ngroups == 0 in function cv::dnn::ConvolutionLayerImpl::getMemoryShapes

第 75 行是:detections = net.forward()

为什么我要将其转换为灰度?因为我需要在将图像输入神经网络之前进行直方图均衡,以便夜间输入的图像会更清晰。

最佳答案

这些模型中的绝大多数都需要彩色,即3 channel 图像;通过转换为灰度,您最终会得到单 channel 图像,并且代码会崩溃。

让我们快速浏览一下以确认这一点;链接博客文章中的脚本运行为

python deep_learning_object_detection.py \
    --prototxt MobileNetSSD_deploy.prototxt.txt \
    --model MobileNetSSD_deploy.caffemodel --image images/example_01.jpg 

深入研究MobileNetSSD_deploy.prototxt.txt MobileNet-SSD Github repo的文件(即这里使用的实现),我们看到输入层定义为

name: "MobileNet-SSD"
input: "data"
input_shape {
  dim: 1
  dim: 3
  dim: 300
  dim: 300
}

此处的第二个 dim 参数正是图像中预期的 channel 数 (3)。而且它会拒绝处理单 channel 图像,例如灰度图像。

类似情况下的一个黑客,只是为了让你继续玩(尽管我已经看到它经常用于医疗和卫星成像,其中图像通常不是彩色的),只是为了您的单 channel 复制为 3 个相同的 channel ,并将它们组合起来形成“3 channel ”图像...

关于python - 神经网络不接受灰度图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52187913/

相关文章:

Python 关闭其他用户可能打开的文件

python - Python 中列表的 Zip/Map 列表

python - 使用 NCO 或 Python 测量多个 netCDF 文件的每周平均值

python - 将 TF2.0 中的 feed_dict 替换为函数中张量的张量输入

python - 迭代从 .txt 文件转换的列表时遇到问题

python - 如何在python中找到每个SLIC超像素的质心?

objective-c - Apple Mach-O 链接器和使用 OpenCV 的多个 "undefined symbols"错误

python - 将 Opencv 安装到 Anaconda 的问题

machine-learning - 如何为火灾探测系统创建机器学习模型?

machine-learning - 能够切换数据集的随机森林算法