java - C++(OpenCV) 中 k-NN 示例的问题

我在 OpenCV 文档中找到了以下使用 k-NN 的示例。现在我的任务是将以下代码转换为 Java 并对其进行一些更改，因为我的数据不是图像。我很难理解示例中发生的事情。

首先看一下代码:

#include "ml.h"
#include "highgui.h"

int main( int argc, char** argv )
{
    const int K = 10;
    int i, j, k, accuracy;
    float response;
    int train_sample_count = 100;
    CvRNG rng_state = cvRNG(-1);
    CvMat* trainData = cvCreateMat( train_sample_count, 2, CV_32FC1 );
    CvMat* trainClasses = cvCreateMat( train_sample_count, 1, CV_32FC1 );
    IplImage* img = cvCreateImage( cvSize( 500, 500 ), 8, 3 );
    float _sample[2];
    CvMat sample = cvMat( 1, 2, CV_32FC1, _sample );
    cvZero( img );

    CvMat trainData1, trainData2, trainClasses1, trainClasses2;

    // form the training samples
    cvGetRows( trainData, &trainData1, 0, train_sample_count/2 );
    cvRandArr( &rng_state, &trainData1, CV_RAND_NORMAL, cvScalar(200,200), cvScalar(50,50) );

    cvGetRows( trainData, &trainData2, train_sample_count/2, train_sample_count );
    cvRandArr( &rng_state, &trainData2, CV_RAND_NORMAL, cvScalar(300,300), cvScalar(50,50) );

    cvGetRows( trainClasses, &trainClasses1, 0, train_sample_count/2 );
    cvSet( &trainClasses1, cvScalar(1) );

    cvGetRows( trainClasses, &trainClasses2, train_sample_count/2, train_sample_count );
    cvSet( &trainClasses2, cvScalar(2) );

    // learn classifier
    CvKNearest knn( trainData, trainClasses, 0, false, K );
    CvMat* nearests = cvCreateMat( 1, K, CV_32FC1);

    for( i = 0; i < img->height; i++ )
    {
        for( j = 0; j < img->width; j++ )
        {
            sample.data.fl[0] = (float)j;
            sample.data.fl[1] = (float)i;

            // estimate the response and get the neighbors' labels
            response = knn.find_nearest(&sample,K,0,0,nearests,0);

            // compute the number of neighbors representing the majority
            for( k = 0, accuracy = 0; k < K; k++ )
            {
                if( nearests->data.fl[k] == response)
                    accuracy++;
            }
            // highlight the pixel depending on the accuracy (or confidence)
            cvSet2D( img, i, j, response == 1 ?
                (accuracy > 5 ? CV_RGB(180,0,0) : CV_RGB(180,120,0)) :
                (accuracy > 5 ? CV_RGB(0,180,0) : CV_RGB(120,120,0)) );
        }
    }

    // display the original training samples
    for( i = 0; i < train_sample_count/2; i++ )
    {
        CvPoint pt;
        pt.x = cvRound(trainData1.data.fl[i*2]);
        pt.y = cvRound(trainData1.data.fl[i*2+1]);
        cvCircle( img, pt, 2, CV_RGB(255,0,0), CV_FILLED );
        pt.x = cvRound(trainData2.data.fl[i*2]);
        pt.y = cvRound(trainData2.data.fl[i*2+1]);
        cvCircle( img, pt, 2, CV_RGB(0,255,0), CV_FILLED );
    }

    cvNamedWindow( "classifier result", 1 );
    cvShowImage( "classifier result", img );
    cvWaitKey(0);

    cvReleaseMat( &trainClasses );
    cvReleaseMat( &trainData );
    return 0;
}

Link to the source

现在是问题。
1. cvRNG 的类型是什么。在 Java 版本的 OpenCV 中找不到它
2. CvMat sample = cvMat( 1, 2, CV_32FC1, _sample ); - 需要一个四字段构造函数，这在 java 中不可用。
3.为什么我需要形成训练样本？我该怎么做？ Here提到“仅支持 CV_ROW_SAMPLE 数据布局”。什么意思？

除答案外，欢迎提供各种额外的工作示例。=)

最佳答案

该示例首先生成随机训练数据。它构建一个 Nx2 训练样本矩阵(N=100 二维点)，以及相应的类标签(Nx1 矩阵)。因此样本具有“行布局”，每一行都是一个样本。

生成的数据一分为二；上半部分 (N/2)x2 样本是从均值 = 200 和方差 = 50(X 和 Y 坐标)的正态分布生成的，属于第一类 类=1。同样，后半部分是从 X~N(300,50) 生成的，并标记为具有 class=2。

因此，您可以想象数据看起来像 2D 空间中截然相反的两个点。

接下来我们创建 K 最近邻分类器(示例中的 K=10)，并将其提供给我们的训练集。

然后代码在 500x500 范围内的点网格上循环(即我们遍历二维点 [0,0], [0,1], ..., [1,0], [ 1,1], ... [499,499]).对于每个点，我们使用分类器找到 K 近邻(基于欧氏距离)及其对应的类标签，以及预测网格点的标签(基于最近邻的多数投票)。它计算“置信度”度量(通过计算 K=10 最近的邻居中有多少与预测的邻居具有相同的类别)。

我们将预测存储在与网格 (500x500) 大小相同的图像中，用颜色编码表示类别(1 或 2)，其中代表预测置信度的颜色强度。

最后，它将原始数据样本绘制在图像之上，并使用其真实类别标签对点进行着色，并显示生成的图像。

现在我没有运行完全相同的代码，但我想它会给出如下内容:

我在 matlab 中写了这个.如果您有兴趣，这是我的代码(我使用的是 mexopencv，OpenCV 的 MATLAB 包装器工具箱):

% random training set generated from two normal distributions
N = 100;  % number of training samples
trainData = [randn(N/2,2)*50+200; randn(N/2,2)*50+300];
trainClass = int32([ones(N/2,1)*1; ones(N/2,1)*2]);

% kNN classifier
K = 10;
knn = cv.KNearest();
knn.train(trainData, trainClass);

% build grid of 2D points, predict and find K nearest neigbords
sz = [500 500];
[X,Y] = ndgrid(1:sz(1), 1:sz(2));
[pred,IDX] = knn.findNearest([X(:) Y(:)], K);

% compute prediction confidence
conf = sum(bsxfun(@eq, IDX, pred),2) ./ K;

% evaluate classifier on training set
acc = nnz(knn.predict(trainData) == trainClass) * 100 / N;

% plot (color-coded by class, transparency indicates confidence)
clr1 = lines(2);
clr2 = brighten(clr1, -0.6);
imagesc(ind2rgb(reshape(pred,sz), clr1), 'AlphaData',reshape(conf,sz))
hold on
scatter(trainData(:,1), trainData(:,2), [], clr2(trainClass,:), 'filled')
hold off; xlabel X; ylabel Y;
title(sprintf('kNN Classification Accuracy = %.1f%%',acc))

关于java - C++(OpenCV) 中 k-NN 示例的问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32712859/

java - C++(OpenCV) 中 k-NN 示例的问题

上一篇：c++ - 具有同一类参数的纯虚函数

下一篇：c++ - 找不到opencv相关的头文件stitcher.hpp