macos - 是否有 API(或任何 hack)可以访问 Mac OS X Mavericks 中的增强听写功能?

标签 macos speech-recognition voice-recognition speech-to-text osx-mavericks

我正在尝试找到一种简单的方法将音频文件转录为文本(CMU Sphinx、Julius 等对于不了解语音识别、配置语言模型、声学模型等的人来说很难)。

我想知道是否有办法将我的音频文件传输到 Mac OS 10.9 Mavericks 的“增强听写”功能中,该功能允许本地离线语音听写。

当我将一根跳线从耳机插孔插入我的线路时,我以为我很聪明,但不幸的是,当你开始听写时,它会将所有其他音频播放静音(任何有关如何禁用此静音的建议都将得到正确的解决方案)我的回答)。

最佳答案

我还没有找到直接的方法来做到这一点。但是,您可以使用 Soundflower 作为解决方法。

例如,您可以在 VLC 中选择音频 -> 音频设备 -> Soundflower (2ch) 作为输出。然后在系统偏好设置->听写和语音->听写->Soundflower (2ch) [在麦克风图标下下拉]。然后您可以在 VLC 中开始播放,并开始听写(例如在 TextEdit 中),您应该会看到转录出现。这种方法的缺点是速度慢(仅限于音频的实时播放),并且不太有利于自动化工作流程。

注意:在切换到 TextEdit 并启动 ED 之前,您必须开始音频播放。

关于macos - 是否有 API(或任何 hack)可以访问 Mac OS X Mavericks 中的增强听写功能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19579566/

相关文章:

macos - 错误 : functions that differ only in their return type cannot be overloaded

python - 导入安装工具失败

ios - 在Swift3中停止识别而无需停止词

python - “which conda”命令返回不期望的内容

iphone - Libcurl错误: curl/curl. h:没有这样的文件或目录

ios - iPhone 模拟器 10.0 - 语音识别不可用

Android Wear 自定义语音操作

python - python中的语音识别api "bing"非常慢

android - 录制的声音文件(ala google now,google keep)- RecognizerIntent/Listener

android - Pocketsphinx Android演示错误: "Failed to init recognizer java.io.IOException: Failed to initialize recorder. Microphone might already be in use."