我正在使用 Assistant SDK 中的 python 库通过 gRPC 进行语音识别。我从 \googlesamples\assistant\__main__.py
中识别出语音并以调用方法 resp.result.spoken_request_text
的字符串的形式返回,我得到的答案是音频流从助手 API 使用方法 resp.audio_out.audio_data
也来自 \googlesamples\assistant\__main__.py
我想知道是否也可以从服务中获得作为字符串的答案(希望它在服务定义中可用或可以包含在内),以及我如何访问/请求答案作为字符串。
提前致谢。
最佳答案
目前(Assistant SDK Developer Preview 1),没有直接的方法可以做到这一点。您或许可以将音频流输入语音到文本系统,但这真的开始变得愚蠢了。
在 Google I/O 上与工程师就此主题进行交谈时,他们表示这样做在技术上存在一些复杂性,但他们了解用例。他们需要看到这样的问题才能知道人们想要该功能。
希望它将成为即将推出的开发者预览版。
关于python - 如何从 Google Assistant 接收字符串形式的回答,而不是音频流,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44123641/