我遇到了以下简单代码的段错误:
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include <iostream>
#include <thread>
#include <unistd.h>
void run() {
sleep(1); // see below
cv::Mat source(10, 10, CV_32FC1, -1);
cv::Mat result(10, 10, CV_32FC1);
cv::Mat trX(result.rows, result.cols, CV_32FC1, 5);
cv::Mat trY(result.rows, result.cols, CV_32FC1, 5);
cv::remap(source, result, trX, trY, cv::INTER_LINEAR, cv::BORDER_TRANSPARENT);
std::cout << "done" << std::endl;
}
int main(int argc, char* argv[]) {
std::thread t1(run);
t1.join();
std::thread t2(run);
t2.join();
return 0;
}
如果我直接从 main()
中调用 run()
两次,根本不使用线程,它运行良好。如果我交换 t1.join();
和 std::thread t2(run);
(也就是说,在第一个线程完成之前启动第二个线程;这是 sleep
变得很重要),它也运行良好。
此外,如果我将 main
更改为
int main(int argc, char* argv[]) {
std::thread t1(run);
std::thread t2(run);
t1.join();
t2.join();
std::thread t3(run);
t3.join();
return 0;
}
它在第三个线程中出现段错误,但(奇怪的是)并非总是如此:大约有 2-3 次运行成功通过。但是,我无法成功运行带有上述两个线程的程序。
似乎source
、trX
和trY
中的特定值并不重要。
我在做的大程序在12月份运行正常,之后就没时间做了,但是更新了几次系统。现在大程序因完全相同的段错误而失败,所以我认为它应该与更新版本的 opencv 和/或 g++ 和/或 libstdc++ 相关。
是我的系统或我的代码有问题吗?或者这是一些已知的问题?或者我应该在哪里更好地报告?
我正在运行最新的 Ubuntu 16.10,g++ 6.2.0(我也尝试过 4.9,结果相同)。可能感兴趣的包的特定版本是:
$ dpkg-query -W -f='${binary:Package}\t${Version}\n' | grep -E '(g\+\+|c\+\+|opencv)'
g++ 4:6.1.1-1ubuntu2
g++-4.9 4.9.4-2ubuntu1
g++-5 5.4.1-2ubuntu2
g++-6 6.2.0-5ubuntu12
lib32stdc++6 6.2.0-5ubuntu12
libflac++6v5:amd64 1.3.1-4
libopencv-calib3d2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-contrib2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-core-dev:amd64 2.4.9.1+dfsg-2.1
libopencv-core2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-features2d2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-flann2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-highgui-dev:amd64 2.4.9.1+dfsg-2.1
libopencv-highgui2.4-deb0:amd64 2.4.9.1+dfsg-2.1
libopencv-imgproc-dev:amd64 2.4.9.1+dfsg-2.1
libopencv-imgproc2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-legacy2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-ml2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-objdetect2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-video2.4v5:amd64 2.4.9.1+dfsg-2.1
libsigc++-2.0-0v5:amd64 2.8.0-2
libstdc++-4.9-dev:amd64 4.9.4-2ubuntu1
libstdc++-5-dev:amd64 5.4.1-2ubuntu2
libstdc++-6-dev:amd64 6.2.0-5ubuntu12
libstdc++6:amd64 6.2.0-5ubuntu12
libstdc++6:i386 6.2.0-5ubuntu12
我使用以下命令来构建代码:
g++ --std=c++14 test.cpp -lpthread -lopencv_highgui -lopencv_core -lopencv_imgproc -o test
Valgrind 输出:
==18499== Thread 2:
==18499== Invalid read of size 8
==18499== at 0x690F0BA: ??? (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499== by 0x690F18A: ??? (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499== by 0x6910CE7: ??? (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499== by 0x690F691: ??? (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499== by 0x690A01F: ??? (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499== by 0x6908164: tbb::internal::allocate_root_with_context_proxy::allocate(unsigned long) const (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499== by 0x51D9E21: cv::parallel_for_(cv::Range const&, cv::ParallelLoopBody const&, double) (in /usr/lib/x86_64-linux-gnu/libopencv_core.so.2.4.9)
==18499== by 0x55AE8A1: cv::remap(cv::_InputArray const&, cv::_OutputArray const&, cv::_InputArray const&, cv::_InputArray const&, int, int, cv::Scalar_<double> const&) (in /usr/lib/x86_64-linux-gnu/libopencv_imgproc.so.2.4.9)
==18499== by 0x1094AC: run() (in /home/petr/osm/draw/test/test)
==18499== by 0x10A360: void std::_Bind_simple<void (*())()>::_M_invoke<>(std::_Index_tuple<>) (in /home/petr/osm/draw/test/test)
==18499== by 0x10A2ED: std::_Bind_simple<void (*())()>::operator()() (in /home/petr/osm/draw/test/test)
==18499== by 0x10A2BD: std::thread::_State_impl<std::_Bind_simple<void (*())()> >::_M_run() (in /home/petr/osm/draw/test/test)
==18499== Address 0xfffffffffffffff7 is not stack'd, malloc'd or (recently) free'd
最佳答案
OpenCV 提供了一个 parallel_for_
允许使用计算机上可用的并行框架(Intel TBB、Pthreads 等)轻松并行部分代码的函数。
在您的情况下,您拥有的 OpenCV 版本似乎是 2.4.9
TBB 用作默认值 parallel_for_
后端。
Here从多个线程调用的 TBB 的另一个问题。 解决方案可能是在从源代码构建 OpenCV 时禁用 TBB 并改用 Pthread(在 CMake 中禁用 TBB 并启用 Pthread)。
您的解决方案也应该没问题。用 setNumThreads(0)
,文档说:
If threads == 0, OpenCV will disable threading optimizations and run all it’s functions sequentially.
我猜 setNumThreads(1)
应该也可以吧?
很遗憾,我无法确定问题的确切根源:
-
cv::remap
总体上不是线程安全的还是仅使用 TBB? - TBB 版本有问题? (不确定 this 是否相关)
- 使用的 OpenCV 版本有问题吗?
我做了两个测试:
- 构建
OpenCV 3.2
来自 Ubuntu 16.04 上的源代码,Pthreads 用作parallel_for_
后端 - 构建
OpenCV 3.2
来自 Ubuntu 16.04 上的源代码并改用 TBB
在这两种情况下,我都没有遇到任何问题。所以我希望它已经在较新的 OpenCV 版本或较新的 TBB 版本中得到解决。
注意:你可以使用
std::cout << "getBuildInformation:\n" << cv::getBuildInformation() << std::endl;
打印 OpenCV 信息。在我的第二次测试中,我得到:
Parallel framework: TBB (ver 4.4 interface 9003)
关于c++ - cv::remap segfaults with std::thread,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42842661/