video - 音频/视频内容提示

标签 video audio semantic-analysis

可以从这样的媒体中提取什么样的语义信息?任何东西都可以,无论是区分音乐和语音文本、检测不同的声音(如枪声、鸟声或汽车)、检测室内/室外拍摄或相机运动的强度。

我知道有many , many , many , manymanymany这个类别的研究主题,但我没有找到任何这些的任何应用程序。是否有人有关于这些主题的即将推出的产品的应用程序/库/工作原型(prototype)/新闻的链接?

最佳答案

看看MP4REG ,它是“MP4 Family”文件中代码点的注册机构。

简短入门:在 MPEG4 和 QuickTime 世界中,媒体的基本物理构建 block 称为“Atom”。原子不仅可以包含实际的音频和视频,还可以包含技术和非技术元数据。最后一个听起来很有趣。

例如:

  • albm:专辑名称和轨道编号(用户数据)
  • jp2i: 知识产权信息

关于元数据,我只仔细研究过一次,我的印象是它是一个快速而松散的世界。您可能想要查看一些低级 MP4 解析工具,这些工具可以让您检查真实世界媒体文件的各个原子。我认为甚至有非官方的(未注册的)自定义原子用于特定系统。

关于video - 音频/视频内容提示,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/950915/

相关文章:

c++ - OpenCV/FFMpeg图像捕捉问题

video - 如何将文本流(字幕)添加到 .mp4 或 .m4v

c++ - 如何以编程方式更改非默认声音设备的音量?

对基于 ANTLR 的树的语义分析访问者进行单元测试

java - 优化搜索两个字符串中的关键字

swift - HomeKit – 将流媒体视频从相机录制到 iPad

video - 在 ffmpeg 中重复单帧填充视频中间

java - JSyn,警报器声音使用振荡器馈送/控制/输入/菊花链到另一个振荡器和一个常数......并产生多个声音

android - 使用 MediaCodec 和 MediaExtractor 播放视频和音频

compiler-construction - 语法定向翻译