azure - 如何在Azure中进行语音识别并立即完成

标签 azure speech-recognition azure-cognitive-services voice-recognition

我使用this example from Azure - 持续识别。但是,我需要等待很长时间才能识别完成,例如1小时的语音文件。

是否可以让Azure立即完成识别?目前识别率约为1:1,即识别1小时的文件需要1小时。我希望能在 1 分钟(1 分 60 秒)内完成。

最佳答案

您好,我是 Microsoft 语音 SDK 团队的 Darren。如果您正在从 WAV 文件进行识别,我们会尝试以两倍的“实时”速率上传音频。因此,在网络连接良好的情况下,如果您使用的语音服务的 Azure 区域在地理位置上靠近您,则您转录一小时语音的最快时间为半小时。

您使用什么编程语言?你的链接指向Python。请查看我们的 Python 示例代码,用于从 WAV 文件中进行连续识别:https://github.com/Azure-Samples/cognitive-services-speech-sdk/blob/master/samples/python/console/speech_sample.py#L257

请注意,如果您需要对长时间语音文件进行离线处理,更好的解决方案是使用“批处理”和 REST API。 SpeechSDK更针对实时转录。在此处阅读有关批量转录的信息: https://learn.microsoft.com/azure/cognitive-services/speech-service/batch-transcription 批量转录的样本可以在这里找到: https://github.com/Azure-Samples/cognitive-services-speech-sdk/tree/master/samples/batch/

达伦

关于azure - 如何在Azure中进行语音识别并立即完成,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69845073/

相关文章:

android - 连续语音识别 Android

java - android语音api

azure - 发布到 Microsoft 翻译 API 未得到任何响应

azure - BringOwnFeatureNotEnabled 错误代码在 Azure 中意味着什么

Azure Pipelines 矩阵变量

javascript - Azure:Web 应用程序 - 列出已部署的 Nodejs 应用程序中的应用程序设置

c# - 我的 C# 程序如何根据存在的程序集表现出不同的行为?

azure - Azure 移动服务中的增量加载

asynchronous - 语音识别引擎未关闭 - 无效操作异常

azure - 您还没有该区域的 key