android - Android TextToSpeech 中 synthesizeToFile 产生的标准音频格式是什么?

标签 android text-to-speech audioformat synthesizetofile

使用 Android TextToSpeech 的 synthesizeToFile 方法,我们如何知道生成的文件是什么文件格式(WAV、MP3、OGG)和/或属性(采样率、位深度等)?
我在文档中找不到明确的标准……它甚至不 promise 任何特定的文件格式,例如 WAV。
这是否完全取决于语音引擎来实现他们的选择?
如果我们想对结果做点什么,比如计算文件的持续时间?我们必须提前知道有关文件格式的详细信息。由于无法知道最终用户设备上安装/运行的引擎是什么,这一事实变得更加不可预测。
这真的没有标准吗?

最佳答案

在关于 synthesizeToFile 的 android 文档中.您可以在 filename 中查看建议格式参数为 .wav音频的属性取决于您的输入源,或者您可以使用 Voice 设置它.保存成功后即可获取音频文件的信息。示例:您可以使用 MediaPlayer获取格式、持续时间、比特率...
您还可以使用 AudioTrack 通过读取音频缓冲区来播放原始数据。 AudioTrack 是播放原始音频字节的标准

关于android - Android TextToSpeech 中 synthesizeToFile 产生的标准音频格式是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71417399/

相关文章:

java - 如何去除 map 上标记上的阴影?

java - 设置plane_mode_on已从android.provider.Settings.System移至android.provider.Settings.Global,返回只读值

java - Android试图替换字符并改变单词的颜色

javascript - 中文 SpeechSynthesis API -- Firefox

python - 使用 Mutagen 处理所有接受的文件类型

c++ - WASAPI 环回 : Save wave file

android - 如何在小部件中使用 ListView ?

ios - iOS 上的语音合成在加载时出现奇怪的错误,并且没有并发

java - (声乐代码)需要一些帮助来寻找文本到语音的插件

iphone - 录制 mp3 而不是 caf 文件