cmusphinx - 如果 sphinx 完全不准确怎么办?

标签 cmusphinx sphinx4

为清楚起见进行编辑:我从 sphinx 获得的输出与我的声音文件中的实际单词并不接近。我需要做什么才能使其更准确?

Here's the file我正在尝试从中获取成绩单。它应该以 8K 的采样率。

文件中的演讲是“如果您的 iPod 遇到问题,您应该怎么做”,但是 作为输出,我得到:

<s> <sil> well how how [um] [cough] [um] old [cough] [noise] [cough] <sil> [noise]
[um] <sil> [um] <sil> [uh] [cough] [noise] [cough] [um]

这是我的代码:

package com.test.sphinxtest;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;

import edu.cmu.sphinx.api.Configuration;
import edu.cmu.sphinx.api.LiveSpeechRecognizer;
import edu.cmu.sphinx.api.SpeechResult;
import edu.cmu.sphinx.api.StreamSpeechRecognizer;

public class App 
{
    public static void main( String[] args )
    {
        Configuration configuration = new Configuration();

        configuration.setAcousticModelPath("models/acousticmodel/en-us-8khz");
        configuration.setDictionaryPath("dictionary/cmudict-0.6d");
        configuration.setLanguageModelPath("models/languagemodel/en-us.lm");
        configuration.setSampleRate(8000);
        try {
            StreamSpeechRecognizer recognizer = new StreamSpeechRecognizer(configuration);
            recognizer.startRecognition(new FileInputStream("speech/speech8k.wav"));
            System.out.println("Starting recognition");
            SpeechResult result = recognizer.getResult();
            System.out.println("Stopping recognition");
            recognizer.stopRecognition();
            System.out.println("number of words " + result.getWords().size());
            for(int i=0;i<result.getWords().size();i++){
                System.out.println(result.getWords().get(i).getWord());
            }       
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
    }
}

最佳答案

我看了这个页面: http://cmusphinx.sourceforge.net/wiki/faq#qwhy_my_accuracy_is_poor

我看到我必须将我的音频文件设置为单声道。

在我这样做之后,我得到了一个合理的输出。

关于cmusphinx - 如果 sphinx 完全不准确怎么办?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27557841/

相关文章:

java - CMU Sphinx 是否可以通过 Maven 获得?

voice-recognition - 如何在语音识别中使用arpa文件

macos - Sphinx-4的WAV音频录制失败

java - 使用 webservice 调用某些使用资源文件的 java 应用程序方法时出现问题

audio - 音频语言识别

javascript - 使用java访问任何网页的Textfield和Button

java - 使用 LIUM 进行语音 Activity 检测 (VAD/SAR)

java - 如何在Sphinx4中评估样本

c - 找到 c 中值之间的欧氏距离

Java 狮身人面像 "Answers Itself"