我使用this example from Azure - 持续识别。但是,我需要等待很长时间才能识别完成,例如1小时的语音文件。
是否可以让Azure立即完成识别?目前识别率约为1:1,即识别1小时的文件需要1小时。我希望能在 1 分钟(1 分 60 秒)内完成。
最佳答案
您好,我是 Microsoft 语音 SDK 团队的 Darren。如果您正在从 WAV 文件进行识别,我们会尝试以两倍的“实时”速率上传音频。因此,在网络连接良好的情况下,如果您使用的语音服务的 Azure 区域在地理位置上靠近您,则您转录一小时语音的最快时间为半小时。
您使用什么编程语言?你的链接指向Python。请查看我们的 Python 示例代码,用于从 WAV 文件中进行连续识别:https://github.com/Azure-Samples/cognitive-services-speech-sdk/blob/master/samples/python/console/speech_sample.py#L257
请注意,如果您需要对长时间语音文件进行离线处理,更好的解决方案是使用“批处理”和 REST API。 SpeechSDK更针对实时转录。在此处阅读有关批量转录的信息: https://learn.microsoft.com/azure/cognitive-services/speech-service/batch-transcription 批量转录的样本可以在这里找到: https://github.com/Azure-Samples/cognitive-services-speech-sdk/tree/master/samples/batch/
达伦
关于azure - 如何在Azure中进行语音识别并立即完成,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69845073/