algorithm - 我应该使用哪种算法进行信号(声音)一类分类?

标签 algorithm audio pattern-matching signal-processing pattern-recognition

更新 我总结了问题及其答案here

  1. 我的目标是检测嘈杂信号中是否存在给定模式。我想检测一种昆虫的存在,用麦克风记录声音。我以前用数字格式记录过昆虫的声音。
  2. 我不是要进行语音识别。
  3. 我已经在输入信号和模式之间使用卷积来确定它们的相似度。但我认为这种技术更适合离散时间(即数字通信,其中信号以固定间隔出现)并且区分 2 种给定模式(我只有一种模式)之间的输入信号。
  4. 我害怕使用神经网络,因为我从未使用过它们,而且我不知道我是否可以嵌入该代码。

能否请您指出一些其他方法,或者尝试说服我我目前的方法仍然是一个好主意,或者神经网络可能是一种可行的方法?

更新 我已经有 2 个很好的答案,但欢迎另一个,甚至奖励。

最佳答案

卷积的进一步提升是 dynamic time warping它可以被认为是一种卷积运算符,可以拉伸(stretch)和收缩一个信号以最佳地匹配另一个信号。

也许更简单的方法是对样本进行 FFT,并确定您的昆虫是否有任何特定频率可以过滤。

在更复杂的方面,但不完全是神经网络,是 SVM 工具包,如 libsvmsvmlight你可以把你的数据扔进去。

无论您尝试哪种方法,我都会花时间使用 FFT 等工具探索您的昆虫发出的声音的本质。毕竟,如果您能自己动手,教计算机对声音进行分类会更容易。

关于algorithm - 我应该使用哪种算法进行信号(声音)一类分类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/441438/

相关文章:

java - 理解大端、小端(再次)

arrays - 需要更有效的方法来读取子数组

php - 在循环中获取数组的增量

audio - 无限循环以1秒回送记录方式读取数据包数据

javascript - 为什么在播放音频文件之前不加载HTML链接

JavaScript RegExp [^...] 表达式未给出预期结果

Scala 递归函数返回 Either

linux - Tar 模式匹配层次结构中任何位置的文件/文件夹

python - 不理解图遍历中基于DFS的返回顺序

algorithm - 位操作 AdHoc 变体