image-processing - 图像每像素场景标签输出问题(使用 FCN-32s 语义分割)

标签 image-processing neural-network deep-learning caffe labeling

我正在寻找一种方法,在给定输入图像和神经网络的情况下,它将为图像中的每个像素(天空、草地、山脉、人、汽车等)输出一个带标签的类别。

我已经设置了 Caffe( future 分支)并成功运行了 FCN-32s Fully Convolutional Semantic Segmentation on PASCAL-Context模型。但是,我无法用它生成清晰的标记图像。

可视化我的问题的图像:
输入图片

基本事实

我的结果:

这可能是一些分辨率问题。知道我哪里出错了吗?

最佳答案

似乎 32s 模型取得了很大的进步,因此在粗糙的分辨率下工作。你能试试8s model吗这似乎执行较少的分辨率降低。
看着J Long, E Shelhamer, T Darrell Fully Convolutional Networks for Semantic Segmentation, CVPR 2015 (特别是在图 4 中)似乎 32s 模型不是为捕获分割的精细细节而设计的。

关于image-processing - 图像每像素场景标签输出问题(使用 FCN-32s 语义分割),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32451934/

相关文章:

c++ - 如何在图像处理中有效地使用线程?

c - 如何设置相机的fps?

python - 如何在 TensorFlow 2.0 中控制冗长

python - 使用 fit_generator 不匹配的形状时出错(Keras)

python - 如何更好地预处理图像以获得更好的深度学习结果?

neural-network - 神经网络如何知道它从行动中获得了哪些奖励?

image-processing - 在 2D 点云中查找简单形状

image - MATLAB 中的直方图均衡帮助

python - 在 tensorflow 中,可训练梯度和停止梯度有什么区别

python - Keras 在激活函数之前检索节点的值