我想要做的是使用 webRTC 对浏览器中录制的视频进行实时转录。用例基本上是实时字幕,就像谷歌环聊一样。
所以我在浏览器中运行了一个 WebRTC 程序。它将 webm 对象发送回服务器。它们是线性 32 音频编码。 Google 语音转文本仅接受 linear16 或 Flac 文件。
有没有办法实时将linear32转换为linear16?
否则有没有人能够将 webRTC 与 Google 语音连接起来以进行实时转录?
关于在哪里寻找解决这个问题的任何建议都会很棒
最佳答案
查看这个存储库它可能对你有帮助 - https://github.com/muaz-khan/Translator
Translator.js 是一个基于 Google Speech-Recognition & Translation API 构建的 JavaScript 库,用于转录和翻译语音和文本。它支持多种语言环境并在 WebRTC 中带来全局化!
关于webrtc - 如何将使用 WebRTC 录制的音频流传递到 Google Speech api 以进行实时转录?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60808901/