azure - 如何在Azure中进行语音识别并立即完成

我使用this example from Azure - 持续识别。但是，我需要等待很长时间才能识别完成，例如1小时的语音文件。

是否可以让Azure立即完成识别？目前识别率约为1:1，即识别1小时的文件需要1小时。我希望能在 1 分钟(1 分 60 秒)内完成。

最佳答案

您好，我是 Microsoft 语音 SDK 团队的 Darren。如果您正在从 WAV 文件进行识别，我们会尝试以两倍的“实时”速率上传音频。因此，在网络连接良好的情况下，如果您使用的语音服务的 Azure 区域在地理位置上靠近您，则您转录一小时语音的最快时间为半小时。

您使用什么编程语言？你的链接指向Python。请查看我们的 Python 示例代码，用于从 WAV 文件中进行连续识别:https://github.com/Azure-Samples/cognitive-services-speech-sdk/blob/master/samples/python/console/speech_sample.py#L257

请注意，如果您需要对长时间语音文件进行离线处理，更好的解决方案是使用“批处理”和 REST API。 SpeechSDK更针对实时转录。在此处阅读有关批量转录的信息: https://learn.microsoft.com/azure/cognitive-services/speech-service/batch-transcription 批量转录的样本可以在这里找到: https://github.com/Azure-Samples/cognitive-services-speech-sdk/tree/master/samples/batch/

达伦

关于azure - 如何在Azure中进行语音识别并立即完成，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/69845073/

相关文章：

android - 连续语音识别 Android