我想制作一个通过实时转录进行视频通话的网络应用程序——使用一些第三方语音到文本服务(例如谷歌或亚马逊)。所以点对点的媒体流将被播放给用户,并被发送到 API 进行转录。
我目前正在使用 https://peerjs.com/创建点对点调用。
这可行吗?我可以使用任何代码示例或库吗?
谢谢你,丹尼尔
最佳答案
我认为它可以很容易地完成
Azure speach to text service ,也许可以使用其他解决方案,但是对于 Azure,我能够快速找到所有部分。
有浏览器用例示例Here
This line负责从麦克风获取音频源,但在您的情况下更有趣的是使用:fromStreamInput函数,它接受 MediaStream。
我还想知道执行这个过程的更好的地方是什么:
然而,这很容易被测试。
关于javascript - 如何在 js Web 应用程序中获取音频或视频通话的记录? IE。如何将 MediaStream 路由到语音到文本 API,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66546510/