c++ - 自动比较两个系列-相异性测试

标签 c++ c algorithm statistics

我有两个系列,series1 和 series2。我的目标是自动/定量地找出 Series2 与 Series1 的不同之处,在 bin 到 bin 的基础上(每个 bin 代表一个特定的特征)。 alt text clicking here. 可以看到此图像的原始大小

Series1 是预期的结果。 Series2 是测试/传入系列。

我提供了一个直方图,其中 Series2 以深棕色表示。您还可以注意到 221 和 353 之间的 x 轴存在显着差异。即 Series2 小于 Series1。我正在使用 C++ 进行编码。

我认为,互相关会有所帮助,但会产生基于相似性而不是相异性的值。我看到人们谈论 Kolmogorov-Smirnov 测试。这是我应该执行的测试吗?

更新 1: 我正在尝试执行模板匹配。我已将我的模板图像以及传入的测试图像分成 8x8 block 。我正在尝试将模板图像中的一个 block 与测试图像中的相同 block (基于空间像素位置)进行比较。我计算每个 block 内的强度总和。我获得模板图像的系列 1 和测试图像的系列 2。

最佳答案

这是一个算法的 C 实现,用于计算实际数据与预测数据的差异。该算法来自 Osborne/McGraw-Hill 1980 年版权所有的名为Practical BASIC Programs 的书。

这是 .h 文件:

/*
 * divergence.h
 *
 *  Created on: Jan 13, 2011
 *      Author: Erik Oosterwal
 */

#ifndef DIVERGENCE_H_
#define DIVERGENCE_H_

typedef struct
{
    int DataSize;
    float TotalError;
    float AbsError;       //< Total Absolute Error
    float SqError;        //< Total Squared Error
    float MeanError;
    float MeanAbsError;
    float MeanSqError;
    float RMSError;     //< Root Mean Square Error
}DIVERGENCE_ERROR_TYPE;

void Divergence__Error(int size, float expected[], float actual[], DIVERGENCE_ERROR_TYPE *error);


// Prefer to use abs() from "stdlib.h"
#ifndef ABS
    #define ABS(x) ((x)>0) ? (x) : (0-(x))     //< Not safe!!! - Do not increment parameter inside ABS()!
#endif


#endif /* DIVERGENCE_H_ */

....c 文件:

/*
 * divergence.c
 *
 *  Created on: Jan 13, 2011
 *      Author: Erik Oosterwal
 */

#include "math.h"
#include "divergence.h"

/**
 *      @brief  Compute divergence from expected values.
 *
 *      @details    Compute the raw errors, absolute errors, root mean square errors,
 *                  etc. for a series of values.
 *
 *      @param  size - integer value defines the number of values to compare.
 */
void Divergence__Error(int size, float expected[], float actual[], DIVERGENCE_ERROR_TYPE *error)
{
    double total_err = 0.0;
    double abs_err = 0.0;
    double abs_sqr_err = 0.0;
    double temp = 0.0;
    int index = 0;

    for(index=0; index<size; index++)
    {
        temp = (double)(actual[index])-(double)(expected[index]);
        total_err+=temp;
        abs_err+=ABS(temp);
        abs_sqr_err+=pow(ABS(temp),2);
    }

    temp = (double)size;
    error->DataSize = (int)size;
    error->TotalError = (float)total_err;
    error->AbsError = (float)abs_err;
    error->SqError = (float)abs_sqr_err;
    error->MeanError = (float)(total_err/temp);
    error->MeanAbsError = (float)(abs_err/temp);
    error->MeanSqError = (float)(abs_sqr_err/temp);
    error->RMSError = (float)(sqrt(abs_sqr_err/temp));
}

...以及用于测试函数的示例 main():

/*
 * main.c
 *
 *  Created on: Jan 13, 2011
 *      Author: Erik Oosterwal
 */

#include <stdio.h>
#include "divergence.h"

float vote[]={40.3, 22.5, 16.3, 10.5, 7.2, 3.2};
float poll[]={42.7, 21.4, 18.2, 6.0, 7.4, 4.3};
float actual[] ={74, 70, 58, 60, 65, 73, 70};
float predict[]={49, 62, 75, 82, 37, 58, 92};

int main(int argc, char *argv[])
{
    DIVERGENCE_ERROR_TYPE stats;

    Divergence__Error(6, poll, vote, &stats);
    printf("%i\n%f\n%f\n%f\n%f\n%f\n%f\n%f\n\n\n",stats.DataSize,stats.TotalError,stats.AbsError,stats.SqError,stats.MeanError,stats.MeanAbsError,stats.MeanSqError,stats.RMSError);

    Divergence__Error(7, predict, actual, &stats);
    printf("%i\n%f\n%f\n%f\n%f\n%f\n%f\n%f\n\n\n",stats.DataSize,stats.TotalError,stats.AbsError,stats.SqError,stats.MeanError,stats.MeanAbsError,stats.MeanSqError,stats.RMSError);

    return(0);
}

我不能保证这是最快的方法,并且该函数可以进行一些调整以使其对不同的数据类型更加友好,但它确实有效并且结果已根据书中提供的示例进行了验证。

关于c++ - 自动比较两个系列-相异性测试,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3986536/

相关文章:

c++ - 你为什么不能移动 uint16_t

C++ 这行代码是什么意思?

解决这个难题的最佳 Action 算法

c - 将指针内存分配从 main() 移动到函数并在其他函数中使用指针

arrays - 使用递归分离整数数组中的偶数和奇数

c# - XML 比较器 C#

c++ - GLib 正则表达式匹配给出特定匹配和模式的段错误

C++ Xcode编译?

计算 CAN 总线速度

转换可变位大小的有符号整数