android - Android 语音识别将什么格式的语音发送到云端?

标签 android speech-recognition speech

我正在构建一个包含语音识别功能的应用 - 我打算使用 Android 语音识别服务或语音输入功能。

据我所知,演讲大部分是在云端处理的。我的问题是是否有人知道音频以什么格式发送到云端?例如,是 WAV 或 MP3 或 PCM 之类的东西,还是可能完全是其他东西?

我承认这主要是出于纯粹的好奇心,想了解更多幕后发生的事情。 (但部分也与对前后处理对识别的影响的兴趣有关。)

最佳答案

嗯,我也一直在寻找这些信息,而我能找到的最接近的信息是 Google 的 speech recognition API for chrome其中使用了 FLAC音频编解码器。我不确定 android 是否也使用它,但这是我得到的最接近的东西。

关于android - Android 语音识别将什么格式的语音发送到云端?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12931545/

相关文章:

speech-recognition - 如何在帧上分割语音数据并计算 MFCC

java - 在ListAdapter(ListView)中重新填充数据的最佳方法

python - 我的 Azure 语音识别不会在识别文件后停止

c++ - 使用c++调用和使用Windows语音识别

c# - 更改语音识别引擎库的语言

ios - 我们如何在 swift 4 和 IOS 11 中更改语音识别语言?

android - Jetpack 撰写 : How to keep UI state across pages/composable?

android - 在 Jenkins 上构建项目时任务 ':app:mergeDebugResources' 执行失败

java - 避免按后退按钮退出应用程序

unity3d - 统一: SpeechLib works fine in editor but not in runtime