我正在开发一个程序,该程序将记录可识别的音频,以便以后可以轻松地与其他音频文件进行比较。 音频文件将包含诸如语音之类的内容,所以我想知道什么会更容易做到:
- 实现语音识别算法并保存/比较输出,
- 或者实现/创建一种算法,该算法可以创建类似音频指纹的东西,例如快速傅里叶变换并比较它们?
有人在这方面有经验吗?我想知道第二种解决方案是否可以在相对较短的时间内实现。也许有一个更容易编码的解决方案,但我只是没有找到它?
最佳答案
看看声学指纹识别,大部分代码你可以在github上找到!它应该可以帮助您解决您的问题,更具体地说 https://github.com/lalinsky/chromaprint/tree/master/tools
有关更多信息,请查看此线程,该主题已被广泛讨论,Open source audio pattern recognition (finger printing)和Creating custom voice commands (GNU/Linux)
关于java - 音频识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15497784/