我想开发一个 iPhone 应用程序,它应该能够计算用户用麦克风唱歌时收到的乐句数量。
该应用程序还应该能够破译用户的短语是否符合预设节拍的节奏。当用户用麦克风唱歌时,会播放纯乐器音乐。
所以我必须将用户录制的声音与器乐合并——这是一个音频文件。我已经有了原始歌曲文件。我必须对两者进行比较并给用户评分。
注意...原始歌曲文件中的器乐不包含人声。
有人可以帮我吗?谢谢,瓦迪维鲁
最佳答案
首先,您需要一个用于音频分段和起始检测的解决方案。有几种不同的方法可以做到这一点,其中一些已经在堆栈溢出上进行了讨论。 Aubio是一个可以帮助您解决此问题的库。
第二部分,合并两个声音文件应该是传入麦克风声音的样本缓冲区与原始音频源的样本缓冲区之间的简单求和操作。
关于iphone - 在 iPhone 中比较两个音频文件的节拍/节奏和评级,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4511885/