c# - 使用自定义模型 Microsoft azure 的 Azure 语音到文本单词准确度(以 % 为单位)

标签 c# azure winforms speech-to-text

我正在 C# 窗口形式 Microsoft Azure 中制作语音到文本应用程序,它工作正常并在 Visual Studio 中运行我想制作一个自定义模型,因为就像 90% 的单词可以正确识别,但有些单词没有被正确识别,例如(肺超显微硅火山沉着病)。任何文档中都没有提及如何处理此过程或如何准备测试数据,也没有提及实现此目的所需的数据量。如何使用 Azure 认知服务语音工作室指定识别的单词?

最佳答案

如果你想提高识别率,那么你可以指定你自己的模型,或者你可以指定一个短语列表。

如果您需要命令的特定关键字或用户/员工姓名列表,那么它们非常适合简单的短语列表

  • 医疗疾病或诊断以及其他一些高技术术语通常不适合作为短语列表的候选者,因为它们通常含有拉丁语或其他非英语 起源,因此基本的英语模型根本不可能接受该内容的训练。

Improve recognition accuracy with phrase list
A phrase list is a list of words or phrases provided ahead of time to help improve their recognition. Adding a phrase to a phrase list increases its importance, thus making it more likely to be recognized.

Implement phrase list
With the Speech SDK you can add phrases individually and then run speech recognition. Then you can optionally clear or update the phrase list to take effect before the next recognition.

  var phraseList = PhraseListGrammar.FromRecognizer(recognizer);
  phraseList.AddPhrase("Pneumoultramicroscopicsilicovolcanoconiosis");
  • 注意:这个特定单词仍然不太可能被检测为短语,部分问题在于它是由其他单词组成的复合词,而这些单词在标准中的代表性非常低英语语音模型。您必须以恒定的节奏说出它才能被识别为单个单词而不是其组成部分,这实际上很难掌握

如果您想要对特定的兴趣领域或业务领域词汇进行建模,则自定义语音非常有用。然而,要做到这一点,您需要上传自己的数据、测试和训练自定义模型。

What is Custom Speech?
With Custom Speech, you can evaluate and improve the Microsoft speech-to-text accuracy for your applications and products.

Out of the box, speech to text utilizes a Universal Language Model as a base model that is trained with Microsoft-owned data and reflects commonly used spoken language. The base model is pre-trained with dialects and phonetics representing a variety of common domains. When you make a speech recognition request, the most recent base model for each supported language is used by default. The base model works very well in most speech recognition scenarios.

A custom model can be used to augment the base model to improve recognition of domain-specific vocabulary specific to the application by providing text data to train the model. It can also be used to improve recognition based for the specific audio conditions of the application by providing audio data with reference transcriptions.

即使是简单的自定义语音实现,这里也有太多内容无法涵盖,但是您可以看到围绕此主题的文档非常详细,这是所有 Microsoft Azure 服务的标准配置。 p>

关于c# - 使用自定义模型 Microsoft azure 的 Azure 语音到文本单词准确度(以 % 为单位),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73500958/

相关文章:

c# - IDE 用于 Linux 上的 C# 开发?

c# - OpenFileDialog 中的多个文件扩展名

c# - 子窗体关闭后更新 DataGridView

c# - 禁用 Outlook 安全消息框

c# - 在列表集合中查找对象

c# - 对于二维数组,Array.Copy() 是否比 for 循环更快?

azure - 表单识别器

c# - 即使在注销后,ADAL for .NET for iOS 应用程序也可以对以前的用户进行身份验证

azure - 在 Kusto 中搜索/替换

c# - 一个好的 html 功能 richedit 替代 winforms?