iphone - 用于乐器调音器的 AurioTouch 和 FFT

标签 iphone audio fft

我正在尝试编写一个简单的调谐器(不,不是为了制作另一个调谐器应用程序),并且正在查看 AurioTouch 示例源代码(有人尝试评论此代码吗??)。

我担心的是,在查看频域图时,aurioTouch 似乎实际上工作得不太好。我在乐器上演奏单个音符,但没有看到一组有序的、小的频率,其中一个弦峰值位于音符的适当频率处。

有人使用过aurioTouch足以了解底层代码是否有效或者它是否只是一个粗略的示例?

我的其他选择是使用 FFTW 或 KISS FFT。有人有这方面的经验吗?

谢谢。

最佳答案

你期待的是错误的事情!!

不是图书馆的错

无论库是否正确生成它,您都在寻找现实生活中的声音中很少存在的模式。只有电子生成的完美正弦波才会在频率中引起均匀的中途离散出现“尖峰”。图形。如果您不相信它,请尝试在 winamp 或媒体播放器中启动“频谱分析仪”可视化。这并不是电脑的错。

真正的声波是复杂的动物

在你的脑海中想象一个锯齿波或方波。那些急剧的转变——波上的角点或点,对于 FFT 甚至是真正的傅里叶来说,看起来就像大量的高次谐波。如果您曾经在示波器上见过真正的“方波/锯齿波”,甚至是由应该产生正弦波的仪器产生的“正弦波”,请看一下所有尖锐的角落和缝隙一个音符(如果你没有瞄准镜,就大胆地放大波浪 - 放大得越多,你看到的音符就越高)。是的,这些偏差都算作频率。

有时在频谱分析中很难区分一个音符和整个管弦乐队。

但我听到单个音符!

那么耳朵是如何做到这一点的呢?它考虑整个波形。然后你的下脑向你的上脑谎报输入内容:一个音符,而不是一堆泛音。

您无法完全做到这一点,但您可以通过“训练”来近似。

近似:构建一些智能

在乐器上演奏音符并“保存”频率图。对多个频率范围内的音符执行此操作,或者更好的是对所有音符执行此操作。

然后通过将该乐器保存的图表乘以 2^(1/12)(或 1/24 表示 1/4 步长等)来插入音符以填补空白(按 1/2 或 1/4 步长) )。

弄清楚如何将它们存储在可快速搜索的数据结构(例如 BST 或 trie)中。只是它必须返回“这个分数有多接近”。它还必须通过频率比例来识别匹配,以防它的数量不同。

运用智慧

下次您要查找该乐器的音符时,只需获取“听到的”频率图并在该数据结构中找到它即可。您可以录制多种产生不同波形的乐器并搜索它们。如果有背景声音或多个音符,请选择最接近的匹配。然后,如果您想识别其他音符,请从采样的音符中“减去”找到的频率模式,然后冲洗,重复起泡。

仅靠你的声音是行不通的...

如果您曾经尝试通过对着吉他调音器唱歌来给自己调音,您就会知道调音器并不那么聪明。当然,有些乐器(尤其是声音)确实在音高周围 float 并产生不断变化的波形(即使没有人唱歌)。

您想要实现什么目标?

您不必完全喜欢“简单”的调音器应用程序,但如果您不只是制作另一个调音器应用程序,我猜您实际上想识别音符(例如,也许您想自动生成 radio 中歌曲的 midi 文件;-)

祝你好运。我希望你找到一个可以完成所有这些垃圾的库,而不必自己动手。

编辑 2017 年

请注意此网页:http://www.feilding.net/sfuad/musi3012-01/html/lectures/015_instruments_II.htm 页面下方有各种风琴管的频谱分析。有很多很多的暗示。如果您首先用它们“训练”您的应用程序,那么通过足够的工作,这些是可以检测到的(就像告诉 child ,“这就是单簧管的声音......”)

关于iphone - 用于乐器调音器的 AurioTouch 和 FFT,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1447059/

相关文章:

Linux:如何设置一个应用程序使用不同的声卡?

matlab - 如何获得定义频段中的所有fft箱数量?

python - Matplotlib 频谱图与 STFT

iphone - 如何检查是否设置了自定义委托(delegate)?

ios - 为特定 ASBD 缓冲区获取正确的数字数据类型转换

ios - 如何处理 iOS 中的不同方向

audio - 使用openAL禁用环绕声

python - FFTW 产生与 numpy.fft 不同的结果

iphone - 是否可以通过互联网在两个移动设备(iPhone)之间连接一个套接字?

iphone - 适用于 iPhone 的开源 CoverFlow 库