我正在尝试找到一种简单的方法将音频文件转录为文本(CMU Sphinx、Julius 等对于不了解语音识别、配置语言模型、声学模型等的人来说很难)。
我想知道是否有办法将我的音频文件传输到 Mac OS 10.9 Mavericks 的“增强听写”功能中,该功能允许本地离线语音听写。
当我将一根跳线从耳机插孔插入我的线路时,我以为我很聪明,但不幸的是,当你开始听写时,它会将所有其他音频播放静音(任何有关如何禁用此静音的建议都将得到正确的解决方案)我的回答)。
最佳答案
我还没有找到直接的方法来做到这一点。但是,您可以使用 Soundflower 作为解决方法。
例如,您可以在 VLC 中选择音频 -> 音频设备 -> Soundflower (2ch) 作为输出。然后在系统偏好设置->听写和语音->听写->Soundflower (2ch) [在麦克风图标下下拉]。然后您可以在 VLC 中开始播放,并开始听写(例如在 TextEdit 中),您应该会看到转录出现。这种方法的缺点是速度慢(仅限于音频的实时播放),并且不太有利于自动化工作流程。
注意:在切换到 TextEdit 并启动 ED 之前,您必须开始音频播放。
关于macos - 是否有 API(或任何 hack)可以访问 Mac OS X Mavericks 中的增强听写功能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19579566/