我一直在使用 FFmpeg 查找 h264 视频文件的中间帧,并提取 jpg 缩略图以在流媒体门户上使用。这是为每个上传的视频自动完成的。
有时帧恰好是黑帧或只是语义错误,即与视频内容关系不佳的背景或模糊镜头。
我想知道我是否可以使用 openCV 或其他一些方法/库通过面部识别或帧分析以编程方式找到更好的缩略图。
最佳答案
我自己也遇到过这个问题,想出了一个非常粗糙但简单的算法来确保我的缩略图更“有趣”。怎么办?
- 创建 x 个不同点的缩略图。例如。 5 张缩略图
- 使用最大(以字节为单位)的文件并丢弃其余的
为什么会这样?因为单调“无聊”图像的 jpeg 文件(如全黑屏幕)压缩成的文件比包含许多对象和颜色的图像小得多。
它并不完美,但却是可行的 80/20 解决方案。 (用 20% 的工作解决 80% 的问题。)编写一些实际分析图像本身的代码将需要更多的工作。
关于video - 改进了从视频中提取缩略图,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5388356/