image-processing - 图像每像素场景标签输出问题(使用 FCN-32s 语义分割)

我正在寻找一种方法，在给定输入图像和神经网络的情况下，它将为图像中的每个像素(天空、草地、山脉、人、汽车等)输出一个带标签的类别。

我已经设置了 Caffe( future 分支)并成功运行了 FCN-32s Fully Convolutional Semantic Segmentation on PASCAL-Context模型。但是，我无法用它生成清晰的标记图像。

可视化我的问题的图像:
输入图片

基本事实

我的结果:

这可能是一些分辨率问题。知道我哪里出错了吗？

最佳答案

似乎 32s 模型取得了很大的进步，因此在粗糙的分辨率下工作。你能试试8s model吗这似乎执行较少的分辨率降低。
看着J Long, E Shelhamer, T Darrell Fully Convolutional Networks for Semantic Segmentation, CVPR 2015 (特别是在图 4 中)似乎 32s 模型不是为捕获分割的精细细节而设计的。

关于image-processing - 图像每像素场景标签输出问题(使用 FCN-32s 语义分割)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32451934/

相关文章：

c++ - 如何在图像处理中有效地使用线程？