c# - Twilio 语音转录替换

标签 c# sms voice-recognition twilio

<分区>

我正在寻找使用 Twilio

  1. 接听电话
  2. 转录语音
  3. 用转录的录音给用户发短信

我的设置很好,但 Twilio 上的转录质量低得离谱。可能是它听不懂我的约克郡口音(毕竟这是一家加州公司),但有 complaints from others用大概更清晰的声音说这真的很糟糕。

我有一个想法,我可以换掉他们自己的转录服务并使用第三方。我想我可以获取生成的 mp3 文件。所以我需要的是

  1. 可通过网络服务或类似服务调用的第三方转录服务
  2. 服务在完成时生成回调
  3. 该服务使用 mp3 文件
  4. 该服务实际上转录合理。它不需要完美,因为文本会返回给用户进行更正,但它确实需要相当好。

有没有人有过这样的经历?我不致力于 Twilio - 我仍处于概念验证阶段,所以完整的替代方案也会很有趣。

这看起来合理吗?我是不是疯了?感谢所有回复。

只是为了完整起见 - 我正在使用带有 Razor 引擎的 MVC 3 架构,但我认为这没有太大关系。

非常感谢

最佳答案

这是提供转录的两个(我所知道的唯一一个)API。两者都提供机器和人工转录,具体取决于您的需要:

VoiceCloud :您发布音频文件 (mp3/wav) 的链接,他们会在处理后将文本发送到回调 URL。机器转录为 0.10 美元/分钟,人工辅助转录为 0.009 美元/秒。我认为每月最低 250.00 美元仅适用于人工转录。

QuickTate :您通过 XML-RPC 提交音频文件或链接,QuickTate 将通过回调 URL 发送完成的转录。您还可以检查工作状态以获得部分转录。价格取决于预付款,他们也提供医疗质量。每个单词的价格从 0.01 美元到 0.025 美元不等。

我都用过,如果您需要高质量的转录,我的建议是 QuickTate(尽管 VoiceCloud 的质量仍然优于 Twilio 的本地转录)。如果您有很多短文件,Quicktate 的费用可能会更低,因为 VoiceCloud(当我使用它时)的最低收费为 30 秒。

关于c# - Twilio 语音转录替换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11473217/

相关文章:

c# - LINQ 实体数据模型生成的代码错误 - 类型 'DBContexts.Category' 已包含 'ID' 的定义

sms - nagios 通过 twilio 发送短信通知

android - SMS Retriever API android系统无法向广播接收器发送消息

javascript - Electron 通知在 macOS 上不起作用(奖励 mdn 语音 api)

android - 基于语音(噪音)强度级别的语音识别?

c# - 使用 JavaScript 更新 div 标签而不刷新整个页面

c# - 在 C# 中快速解析 PHP

android - 触发心率检查的语音命令列表

c# - SigningCredentials jwt asp.net core 中的 key 长度应该是多少

php - 用 PHP 发送和接收短信