webrtc - 如何将使用 WebRTC 录制的音频流传递到 Google Speech api 以进行实时转录?

标签 webrtc google-speech-api matroska

我想要做的是使用 webRTC 对浏览器中录制的视频进行实时转录。用例基本上是实时字幕,就像谷歌环聊一样。

所以我在浏览器中运行了一个 WebRTC 程序。它将 webm 对象发送回服务器。它们是线性 32 音频编码。 Google 语音转文本仅接受 linear16 或 Flac 文件。

有没有办法实时将linear32转换为linear16?

否则有没有人能够将 webRTC 与 Google 语音连接起来以进行实时转录?

关于在哪里寻找解决这个问题的任何建议都会很棒

最佳答案

查看这个存储库它可能对你有帮助 - https://github.com/muaz-khan/Translator

Translator.js 是一个基于 Google Speech-Recognition & Translation API 构建的 JavaScript 库,用于转录和翻译语音和文本。它支持多种语言环境并在 WebRTC 中带来全局化!

关于webrtc - 如何将使用 WebRTC 录制的音频流传递到 Google Speech api 以进行实时转录?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60808901/

相关文章:

ffmpeg - 使用 ffmpeg 设置 matroska 附件的名称

javascript - 语音识别如何识别 5 和 5 之间的差异?

python - Google Speech API 无法在 Google 存储 : error 404 上找到文件

video-encoding - 如何在 MKV 文件上设置隔行扫描标志,以便 VLC 可以自动播放去隔行扫描?

ios - 如何为通用 ios 设备构建 Webrtc ios?

audio-recording - Google Speech API - 识别 base64 编码的音频

video - 如何将不同帧分辨率的VP8轨道转换为h264

webrtc - ICE失败的原因是什么?

reactjs - 如何减少 Web RTC 噪音、通话过程中的点击声

javascript - WebRTC冰状态= "failed"黑色视频