c++ - 使用 FLANN 匹配从 OpenCV SIFT 列表中识别图像

标签 c++ opencv image-recognition sift flann

应用程序的重点是从已设置的图像列表中识别图像。图像列表已将其 SIFT 描述符提取并保存在文件中。这里没有什么有趣的:

std::vector<cv::KeyPoint> detectedKeypoints;
cv::Mat objectDescriptors;

// Extract data
cv::SIFT sift;
sift.detect(image, detectedKeypoints);
sift.compute(image, detectedKeypoints, objectDescriptors);

// Save the file
cv::FileStorage fs(file, cv::FileStorage::WRITE);
fs << "descriptors" << objectDescriptors;
fs << "keypoints" << detectedKeypoints;
fs.release();

然后设备会拍照。 SIFT 描述符以相同的方式提取。现在的想法是将描述符与文件中的描述符进行比较。我正在使用 OpenCV 的 FLANN 匹配器来做到这一点。我正在尝试逐个图像地量化相似性。在浏览了整个列表后,我应该找到最好的匹配项。

const cv::Ptr<cv::flann::IndexParams>& indexParams = new cv::flann::KDTreeIndexParams(1);
const cv::Ptr<cv::flann::SearchParams>& searchParams = new cv::flann::SearchParams(64);

// Match using Flann
cv::Mat indexMat;
cv::FlannBasedMatcher matcher(indexParams, searchParams);
std::vector< cv::DMatch > matches;
matcher.match(objectDescriptors, readDescriptors, matches);

匹配后,我了解到我得到了特征向量之间最近发现距离的列表。我找到了最小距离,使用它我可以算出“良好匹配”,甚至可以得到相应点的列表:

// Count the number of mathes where the distance is less than 2 * min_dist
int goodCount = 0;
for (int i = 0; i < objectDescriptors.rows; i++)
{
    if (matches[i].distance <  2 * min_dist)
    {
        ++goodCount;
        // Save the points for the homography calculation
        obj.push_back(detectedKeypoints[matches[i].queryIdx].pt);
        scene.push_back(readKeypoints[matches[i].trainIdx].pt);
    }
}

我展示了代码的简单部分只是为了让这更容易理解,我知道其中一些不需要在这里。

继续,我希望简单地计算像这样的良好匹配的数量就足够了,但事实证明它主要只是将我指向具有最多描述符的图像。在此之后我尝试的是计算单应性。目的是计算它并查看它是否是有效的同形异义词。希望是一个好的匹配,并且只有一个好的匹配,会有一个很好的单应性变换。在 objscene 上使用 cv::findHomography 即可创建单应性,它们是 std::vector< cv::Point2f>。我使用在网上找到的一些代码检查了单应性的有效性:

bool niceHomography(cv::Mat H)
{
    std::cout << H << std::endl;

    const double det = H.at<double>(0, 0) * H.at<double>(1, 1) - H.at<double>(1, 0) * H.at<double>(0, 1);
    if (det < 0)
    {
        std::cout << "Homography: bad determinant" << std::endl;
        return false;
    }

    const double N1 = sqrt(H.at<double>(0, 0) * H.at<double>(0, 0) + H.at<double>(1, 0) * H.at<double>(1, 0));
    if (N1 > 4 || N1 < 0.1)
    {
        std::cout << "Homography: bad first column" << std::endl;
        return false;
    }

    const double N2 = sqrt(H.at<double>(0, 1) * H.at<double>(0, 1) + H.at<double>(1, 1) * H.at<double>(1, 1));
    if (N2 > 4 || N2 < 0.1)
    {
        std::cout << "Homography: bad second column" << std::endl;
        return false;
    }

    const double N3 = sqrt(H.at<double>(2, 0) * H.at<double>(2, 0) + H.at<double>(2, 1) * H.at<double>(2, 1));
    if (N3 > 0.002)
    {
        std::cout << "Homography: bad third row" << std::endl;
        return false;
    }

    return true;
}

我不明白这背后的数学原理,所以在测试时,我有时会用简单的检查单应性的行列式是否为正来代替这个函数。问题是我一直在这里遇到问题。单应性要么都不好,要么在不应该的时候很好(当我只检查行列式时)。

我想我实际上应该使用单应性,对于一些点,只需使用它们在源图像中的位置来计算它们在目标图像中的位置。然后我会比较这些平均距离,理想情况下,在正确图像的情况下,我会得到一个非常明显的更小的平均距离。这根本行不通。所有的距离都是巨大的。我想我可能已经使用单应性的另一种方式来计算正确的位置,但是将 objscene 相互切换会得到类似的结果。

我尝试的其他事情是 SURF 描述符而不是 SIFT,BFMatcher(蛮力)而不是 FLANN,为每个图像获取 n 最小距离而不是根据最小距离获取数字,或者获取距离取决于全局最大距离。这些方法都没有给我明确的好结果,我现在感到卡住了。

我唯一的下一个策略是使用一些局部阈值或一些用于分割的算法来锐化图像,甚至将它们变成二值图像。我正在寻找任何人可以在我的工作中看到的任何建议或错误。

我不知道这是否相关,但我添加了一些我正在测试的图像。很多时候,在测试图像中,大多数 SIFT vector 来自帧(对比度更高)而不是绘画。这就是为什么我认为锐化图像可能会起作用,但我不想更深入以防万一我之前做的事情是错误的。

图片库是 here与标题中的描述。这些图像具有相当高的分辨率,请查看以防它可能提供一些提示。

最佳答案

您可以尝试测试匹配时,源图像和目标图像之间的线条是否相对平行。如果匹配不正确,就会有很多噪音,并且线条不会平行。

请参阅显示正确匹配(使用 SURF 和 BF)的附加图像 - 所有线大部分都是平行的(尽管我应该指出这是一个简单的示例)。

enter image description here

关于c++ - 使用 FLANN 匹配从 OpenCV SIFT 列表中识别图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23655067/

相关文章:

c++ - 自动检测不正确的 find_first_of() 和 family 情况的方法

c++ - 如何在 Windows 上使用 GetSaveFileName 检测 "Save as type:"组合框何时更改?

c# - 如何在 Emgu 上为视频或相机捕捉进行白色 Blob 跟踪?

c# - 在屏幕上检索凝视坐标

OpenCV Mat图像在通过引用调用函数后改变大小

python ,OpenCV : unable to make custom LBP cascade using opencv_traincascade

c++ - 为什么 C++11 标准中没有常量 pi 的定义?

c# - TCP延迟确认的解决方法是什么?

opencv - 图像特征检测

image-processing - 使用决策树