android - 互相关以查找声纳回波

标签 android signal-processing fft convolution cross-correlation

我正在尝试在 Android 上的录音中检测我的chirp回声,似乎互相关是查找 FFT 的最合适方法。两个信号相似,从那里我可以识别互相关阵列中与距离相对应的峰值。

根据我的理解,我提出了以下互相关函数。它是否正确?我不确定是否要在开头添加零并重新开始一些元素?

public double[] xcorr1(double[] recording, double[] chirp) {        
    double[] recordingZeroPadded = new double[recording.length + chirp.length];

    for (int i = recording.length; i < recording.length + chirp.length; ++i)
            recordingZeroPadded[i] = 0;

    for (int i = 0; i < recording.length; ++i)
            recordingZeroPadded[i] = recording[i];

    double[] result = new double[recording.length + chirp.length - 1];

    for (int offset = 0; offset < recordingZeroPadded.length - chirp.length; ++offset)
        for (int i = 0; i < chirp.length; ++i)
            result[offset] += chirp[i] * recordingZeroPadded[offset + i];
    return result;
}

第二个问题:

根据this答:也可以这样计算

corr(a, b) = ifft(fft(a_and_zeros) * fft(b_and_zeros[reversed]))

我根本不明白,但似乎很容易实现。这就是说我失败了(假设我的 xcorr1 是正确的)。我觉得我完全误解了这一点?

public double[] xcorr2(double[] recording, double[] chirp) {
    // assume same length arguments for now
    DoubleFFT_1D fft = new DoubleFFT_1D(recording.length);
    fft.realForward(recording);
    reverse(chirp);
    fft.realForward(chirp);
    double[] result = new double[recording.length];

    for (int i = 0; i < result.length; ++i)
        result [i] = recording[i] * chirp[i];

    fft.realInverse(result, true);
    return result;
}

假设我两个都工作,考虑到数组将包含几千个元素,哪个函数最合适?

编辑:顺便说一句,我尝试在 FFT 版本的两个数组的两端添加零。


在 SleuthEye 回复后进行编辑:

您能否验证一下,因为我正在处理“实际”数据,所以我只需要通过进行真正的转换来完成一半的计算(真实部分)?

从您的代码来看,REAL 转换返回的数组中的奇数元素似乎是虚构的。这是怎么回事?

如何将实数数组转换为复数数组?或者这就是变换的目的吗?将实数移入复数域? (但是实数只是复数的子集,所以它们不是已经在这个域中了吗?)

如果 realForward 实际上返回虚数/复数,它与complexForward 有什么不同?我该如何解释结果?复数的大小?

对于我对变换缺乏了解,我深表歉意,到目前为止我只研究了傅里叶级数。

感谢您的代码。这是“我的”工作实现:

public double[] xcorr2(double[] recording, double[] chirp) {
    // pad to power of 2 for optimisation
    int y = 1;
    while (Math.pow(2,y) < recording.length + chirp.length)
        ++y;
    int paddedLength = (int)Math.pow(2,y);

    double[] paddedRecording = new double[paddedLength];
    double[] paddedChirp = new double[paddedLength];

    for (int i = 0; i < recording.length; ++i)
            paddedRecording[i] = recording[i];

    for (int i = recording.length; i < paddedLength; ++i)
            paddedRecording[i] = 0;

    for (int i = 0; i < chirp.length; ++i)
            paddedChirp[i] = chirp[i];

    for (int i = chirp.length; i < paddedLength; ++i)
            paddedChirp[i] = 0;

    reverse(chirp);
    DoubleFFT_1D fft = new DoubleFFT_1D(paddedLength);
    fft.realForward(paddedRecording);
    fft.realForward(paddedChirp);
    double[] result = new double[paddedLength];

    result[0] = paddedRecording[0] * paddedChirp[0]; // value at f=0Hz is real-valued
    result[1] = paddedRecording[1] * paddedChirp[1]; // value at f=fs/2 is real-valued and packed at index 1
    for (int i = 1; i < result.length / 2; ++i) {
        double a = paddedRecording[2*i];
        double b = paddedRecording[2*i + 1];
        double c = paddedChirp[2*i];
        double d = paddedChirp[2*i + 1];

        // (a+b*j)*(c-d*j) = (a*c+b*d) + (b*c-a*d)*j
        result[2*i]     = a*c + b*d;
        result[2*i + 1] = b*c - a*d;
    }

    fft.realInverse(result, true);

    // discard trailing zeros
    double[] result2 = new double[recording.length + chirp.length - 1];
    for (int i = 0; i < result2.length; ++i)
        result2[i] = result[i];

    return result2;
}

但是,在每个元素大约 5000 个之前,xcorr1 似乎更快。我是否在做一些特别慢的事情(也许是不断“更新”内存——也许我应该转换为 ArrayList)?或者我生成数组来测试它们的任意方式?或者我应该进行共轭而不是反转它?也就是说,性能并不是真正的问题,因此除非有明显的问题,否则您不必费心指出优化。

最佳答案

您的xcorr1的实现确实符合互相关的标准信号处理定义。

相对于您在开头添加零的询问:添加 chirp.length-1零将使结果的索引 0 对应于传输的开始。但请注意,相关输出的峰值出现 chirp.length-1回声开始后的样本(线性调频脉冲必须与完整接收到的回声对齐)。使用峰值索引来获取回波延迟,然后您必须通过减去延迟或丢弃第一个 chirp.length-1 来调整相关器延迟。输出结果。请注意,额外的零对应于开头的许多额外输出,您最好不要首先在开头添加这些零。

对于xcorr2然而,有一些事情需要解决。首先,如果recordingchirp输入尚未被零填充到您需要的至少 chirp+recording 数据长度(出于性能原因,最好是 2 的幂长度)。如您所知,它们都需要填充到相同的长度。

其次,您没有考虑posted reference answer中指示的乘法。 ,实际上对应于复数乘法(而 DoubleFFT_1D.realForward API 使用 double )。现在,如果您要使用线性调频脉冲的 FFT 来实现诸如复数乘法之类的功能,那么您也可以实际使用线性调频脉冲的 FFT 的复共轭来实现乘法( reference answer 中指示的替代实现),从而无需反转时域值。

还占DoubleFFT_1D.realForward偶数长度变换的打包顺序,你会得到:

// [...]
fft.realForward(paddedRecording);
fft.realForward(paddedChirp);

result[0] = paddedRecording[0]*paddedChirp[0]; // value at f=0Hz is real-valued
result[1] = paddedRecording[1]*paddedChirp[1]; // value at f=fs/2 is real-valued and packed at index 1
for (int i = 1; i < result.length/2; ++i) {
    double a = paddedRecording[2*i];
    double b = paddedRecording[2*i+1];
    double c = paddedChirp[2*i];
    double d = paddedChirp[2*i+1];

    // (a+b*j)*(c-d*j) = (a*c+b*d) + (b*c-a*d)*j
    result[2*i]   = a*c + b*d;
    result[2*i+1] = b*c - a*d;
}
fft.realInverse(result, true);
// [...]

请注意 result数组的大小与 paddedRecording 相同和paddedChirp ,但只有第一个 recording.length+chirp.length-1应该保留。

最后,相对于哪个函数最适合几千个元素的数组,FFT 版本 xcorr2可能会快得多(假设您将数组长度限制为 2 的幂)。

关于android - 互相关以查找声纳回波,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25022430/

相关文章:

iphone - 确定 aurioTouch 示例应用程序中哪些频率对应于 x 轴

matlab - 点数如何改变 MATLAB 中的 FFT

android - android中的地理标记

android - 无法使用 gradle 将 Android Kotlin 项目上传到 Fabric Beta

java - Android信号分析+一些过滤器

logging - 如何从信号的 FFT 中获取 MFCC?

android - 在Android中将WAV文件转换为矢量

python - FFT 与傅立叶分量的最小二乘拟合?

android - 模拟器上的 RecognizerIntent

android - 在整个应用程序中保留一组值