matlab - 使用 MATLAB 求大向量的交集

标签 matlab signals vectorization intersection

如何在 MATLAB 中比较两个信号以找到它们的交集?我的信号是大向量,可以包含重复值。

我一直在使用 intersect 尝试以下方法,这对于随机生成的信号效果很好。

% Example case
sig1 = rand(100,1);
sig2 = [sig1(end-10:end); rand(90,1)]; % a signal with imposed intersection.
[c, ia, ib] = intersect(sig1, sig2);
plot(sig2)
hold on
scatter(ib, sig2(ib), 'filled')
hold off

我正在对真实数据使用这种方法,但它不会产生正确的交集,这是由于信号中的重复值造成的。所以,我想向两个信号添加一个非常小的随机噪声,然后应用 intersect ,但是,无法为 intersect 添加阈值.

有人可以给我一些关于如何稳健有效地找到两个大信号测量的交集的提示吗?还有其他方法吗?预先感谢您。

背景:

我实际上有几个大型录音,sig1 , sig2 , sig3 , .... 每两个连续记录,例如 sig1sig2可能有重叠,这意味着sig1的录音结束可以与 sig2 的开头完全相同。因此,我的目标是检查是否存在任何重叠,检测它们,然后删除它们以便能够连接所有测量值:sig1 , sig2 , sig3 ,...

我也知道这些录音的顺序,所以交集可以认为是sig1(end-N:end) = sig2(1:N+1) .

最佳答案

典型的方法是互相关 ( the signal processing toolbox has the function xcorr )。互相关的峰值表示两个信号最相似的延迟。这就是您需要找出两个信号重叠程度所需的全部内容。

由于您想要将一个信号的尾部与另一个信号的头部进行比较,因此我们将仅将互相关应用于信号的这些部分。这确实需要知道重叠可以有多大(某个上限),这并不理想。如果我们计算互相关的裁剪部分太短(即不包含完全重叠),则计算出的移位将不正确。如果它太长,互相关可能无法识别正确的移位(峰值可能隐藏在噪声中)。也许其他人可以接受这个想法并从中构建出更强大的东西......

(我没有安装信号处理工具箱,所以我使用 fftifft 来实现)

% Two example signals
sig1 = rand(100,1);
sig2 = [sig1(end-10:end); rand(90,1)];

% Take the end of sig1 and the start of sig2
N = 15; % should be larger than the overlap
end1 = sig1(end-N+1:end);
start2 = sig2(1:N);

% Compute cross-correlation
xc = ifft(fft(end1).*conj(fft(start2)));

% Find peak
[~,shift] = max(xc);

% Crop signal #2
Nrep = N-shift+1
sig2_cropped = sig2(Nrep+1:end);

% Plot
clf
subplot(2,1,1)
plot(sig1)
hold on
plot(numel(sig1)-Nrep+1:numel(sig1),sig1(end-Nrep+1:end),'r.')
subplot(2,1,2)
plot(sig2)
hold on
plot(1:Nrep,sig2(1:Nrep),'r.')

一个快速而肮脏的替代方案可能更强大,但比上面的慢,是在循环中实现比较:

Nrep = 0;
for N = 1:min(numel(sig2),numel(sig1))
   % Take the end of sig1 and the start of sig2
   end1 = sig1(end-N+1:end);
   start2 = sig2(1:N);
   % Compare
   if all(end1==start2) % possibly do this with a tolerance
      Nrep = N;
      break
   end
end

在这里,我们开始与 1 个样本的重叠进行比较,并逐个增加该样本,直到找到匹配项。如果未找到匹配项,Nrep==0,则不重复样本。

关于matlab - 使用 MATLAB 求大向量的交集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51604786/

相关文章:

Java - 将信号从Thread发送到Swing组件

linux - signalfd 和 sigaction 之间可以竞争吗?

python - 向量化 numpy 数组扩展

performance - Matlab - 是否存在一种更快的方法来为大矩阵赋值?

matlab - 如果图像使用 matlab,则区域周围的最小矩形边界框

.net - Windows 文件资源管理器有 COM 或 .NET 接口(interface)吗?

matlab - 向量化Matlab - 如何在没有循环的情况下向量化高斯函数(代码)

MATLAB "SIGMA must be symmetric and positive definite"错误有时没有意义

Java信号处理然后返回主程序

c++ - (如何)我可以使用 openmp 对 `std::complex<double>` 进行矢量化吗?