我正在开发一个语音识别器项目,作为它的一部分,我想要从一个 wav 文件中查找是否存在静音或检测单词是否存在。如果找到单词,则将该单词从头到尾复制到一个新的 wav 文件中,这样原始 wav 文件有 10 个单词,然后输出是 10 个文件。问题在于检测静音或单词 想要关于如何在 java 中实现这一点的建议.. 请建议..
最佳答案
嗯,wav 只是 PCM 数据。我首先阅读以下内容: http://en.wikipedia.org/wiki/Pulse-code_modulation
我以前做过这个... 您开始从 PCM 数据中提取样本。然后,您检查每个值,看看它是否大于您设置的阈值。例如,假设 16 位样本...例如,从 0 到 15000 的任何值都是静音,任何大于 15001 的值都是声音。请记住处理无符号整数,否则 PCM 中将出现负数。另外,当您使用阈值时,请记住对数与线性。
关于java - 如何使用java检测wav文件中是否存在单词/音频静音?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48899682/