python - 如何从 Google Assistant 接收字符串形式的回答,而不是音频流

标签 python google-assistant-sdk google-assist-api

我正在使用 Assistant SDK 中的 python 库通过 gRPC 进行语音识别。我从 \googlesamples\assistant\__main__.py 中识别出语音并以调用方法 resp.result.spoken_request_text 的字符串的形式返回,我得到的答案是音频流从助手 API 使用方法 resp.audio_out.audio_data 也来自 \googlesamples\assistant\__main__.py

我想知道是否也可以从服务中获得作为字符串的答案(希望它在服务定义中可用或可以包含在内),以及我如何访问/请求答案作为字符串。

提前致谢。

最佳答案

目前(Assistant SDK Developer Preview 1),没有直接的方法可以做到这一点。您或许可以将音频流输入语音到文本系统,但这真的开始变得愚蠢了。

在 Google I/O 上与工程师就此主题进行交谈时,他们表示这样做在技术上存在一些复杂性,但他们了解用例。他们需要看到这样的问题才能知道人们想要该功能。

希望它将成为即将推出的开发者预览版。

关于python - 如何从 Google Assistant 接收字符串形式的回答,而不是音频流,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44123641/

相关文章:

Python OpenCV立体相机校准阵列错误: TypeError: imagePoints1 data type = 17 is not supported

python - 在 64 位 Windows 上从哪里获取和安装 crypto.dll

python - 我如何获得 ON_RECOGNIZING_SPEECH_FINISHED : {'text' : 'what you doing Google' } Google Assistant SDK Ubilinux UP2 Board 的值

python - 如何在 Raspberry Pi 上为 Google Assistant SDK 设置唤醒词

android - ApI AI 应用程序在网络模拟器上运行良好,但在 Android 手机上运行不佳

python - 安装 Google Assistant 时,我报错 "...googlesamples.assistant' 是一个包,无法直接执行...”

python - 如何使用python将来自传感器的数据插入数组中的特定位置

Python项目部署设计