python - YUV420p转其他格式,色偏问题

标签 python opencv image-processing ffmpeg yuv

所以我正在使用 AR 无人机编写颜色检测应用程序。无人机向我的 python/opencv 套接字服务器发送来自其相机的 YUV420p 格式的图像。

我将图像作为 opencv IPLImage 访问的方法如下(是的,这效率很低,但我没有/不想自己编写新的转换工具):

  1. 将 yuv 图像保存到文件 (some_image.yuv)
  2. subprocess.call(在此处插入 ffmpeg 调用)
  3. 使用 cv.LoadImage 重新读取生成的文件(bmp、png,没关系)

我现在的问题是非常明显的颜色变化。在这些照片中我正在挥舞着一张红色毡布。第一个显示出浓重的黄色。第二种情况没那么糟糕,但非常罕见——大多数情况下当我有红色床单时,它的颜色很深。

我想知道这两件事:

  1. 是否有更好的方法来做到这一点
  2. 是否可以解决调色问题

我的 ffmpeg 转换线看起来像这样

ffmpeg -s 640x480 -vcodec rawvideo -f rawvideo -pix_fmt yuv420p -i image.yuv -vcodec bmp -f image2 output.bmp

我也尝试过:

ffmpeg -f rawvideo -s 640x480 -pix_fmt yuv420p -vf colormatrix=bt709:bt601 -i image.yuv -f image -vcodec png output.png

不幸的是,颜色偏移始终存在!

颜色偏移是我现在的大问题,因为我后来将图像转换为 HSV 并使用阈值来选择适合我的颜色范围。

最佳答案

这种方法似乎对我有用:

$ ffmpeg -s 352x288 -i foreman_cif_frame_0.yuv f.png
ffmpeg version N-46810-g7750c48 Copyright (c) 2000-2012 the FFmpeg developers
  built on Apr 21 2013 11:12:24 with gcc 4.6 (Ubuntu/Linaro 4.6.3-1ubuntu5)
  configuration: --enable-gpl --enable-libx264 --enable-libmp3lame
  libavutil      52.  7.100 / 52.  7.100
  libavcodec     54. 71.100 / 54. 71.100
  libavformat    54. 36.100 / 54. 36.100
  libavdevice    54.  3.100 / 54.  3.100
  libavfilter     3. 23.100 /  3. 23.100
  libswscale      2.  1.102 /  2.  1.102
  libswresample   0. 16.100 /  0. 16.100
  libpostproc    52.  1.100 / 52.  1.100
[rawvideo @ 0x18a1320] Estimating duration from bitrate, this may be inaccurate
Input #0, rawvideo, from 'foreman_cif_frame_0.yuv':
  Duration: N/A, start: 0.000000, bitrate: N/A
    Stream #0:0: Video: rawvideo (I420 / 0x30323449), yuv420p, 352x288, 25 tbr, 25 tbn, 25 tbc
Output #0, image2, to 'f.png':
  Metadata:
    encoder         : Lavf54.36.100
    Stream #0:0: Video: png, rgb24, 352x288, q=2-31, 200 kb/s, 90k tbn, 25 tbc
Stream mapping:
  Stream #0:0 -> #0:0 (rawvideo -> png)
Press [q] to stop, [?] for help
frame=    1 fps=0.0 q=0.0 Lsize=       0kB time=00:00:00.04 bitrate=   0.0kbits/s    
video:201kB audio:0kB subtitle:0 global headers:0kB muxing overhead -100.000000%

输出:

Famous forman as png

另一种方法是使用强大的 Imagemagick

$ convert -size 352x288 -depth 8 foreman_cif_frame_0.yuv f2.png 

有趣的是,ffmpeg 和 imagemagick 不会返回相同的结果:

$ compare -compose src f.png f2.png diff.png

结果:

enter image description here

更新 太糟糕了。那么唯一合理的解释是 PIL 很无聊(它在 YCbCr 处理方面有一些特殊性;这里有很多关于这一点的问题)。从我的帖子中可以看到,如果输入正确的YCbCr,则输出是OK的!

如果我正确地阅读了您的问题,您已经收到 YV12 中的数据。格式。 输入为 VGA,因此以下代码将单独的平面(Y、Cb、Cr)分割为自己的变量:

# Here I'm assuming you get the data from the drone into parameter raw
# 1 frame contains 640*480*3/2 = 460800 bytes
import numpy as np

# turn raw into a numpy array
raw = np.array(raw)

# calculate where each plane starts and stops
wh = 640 * 480
p = (0, wh, wh, wh/4*5, wh/4*5, wh/2*3)

# Now use slizing to extract the different planes
yy = np.empty(640*480, dtype=np.uint8)
cb = np.empty(640*480/4, dtype=np.uint8)
cb = np.empty(640*480/4, dtype=np.uint8)

yy = raw[p[0]:p[1]]
cb = raw[p[2]:p[3]]
cr = raw[p[4]:p[5]]

现在你有了漂亮的 numpy 数组中的数据!要转换为矩阵,请执行以下操作:

yy.reshape([480, 640])
cb.reshape([480 / 2, 640 / 2])
cr.reshape([480 / 2, 640 / 2])

希望对您有帮助!如果没有,请给我评论...

关于python - YUV420p转其他格式,色偏问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16871109/

相关文章:

python - 根据纬度/经度计算密度

c++ - 卡片边缘检测 OpenCV

python 中的curl --interface 等价物

python - 使用lxml和xpath读取GPX

python - 如何在Python OpenCV中缩小图像的物理尺寸

android - Android Studio 中的 OpenCV 人脸检测器示例

image-processing - 使用 Swift 4 在 Metal Compute Kernel 中传递参数

image-processing - 是否有任何高质量的程序化解决方案可以将具有不透明背景的 jpeg 转换为具有透明背景的 png?

ios - 为什么我的 iPhone 上的一些照片在电脑上显示时会旋转?

python - Python绘制网格,颜色对应不同的值