c++ - MATLAB代码和C(C++)用IPP代码计算结果的区别

标签 c++ c arrays matlab precision

我需要提高 MATLAB 代码的计算速度。为此,我用 C 语言重写了我的程序,使用英特尔 IPP 库进行 vector 运算。在这里我遇到了一个问题: 经过一些步骤后,MATLAB 中的主要计算循环程序和我的 C 程序转到了不同的算法路径。发生这种情况是因为计算并不绝对相等,并且我的程序与 MATLAB 计算结果相比会累积错误。出于这个原因,我的程序没有计算正确的梯度,整个优化算法也算不上好。所以我提高了计算速度,但失去了计算效率 - 在第 100 步时,MATLAB 计算优化错误为 0.004,C 程序计算为 0.05,这对我的任务很重要。

我检查了哪个函数给我错误,以及我发现了什么:常见操作(如 ippsAdd_64f_A53、ippsSub_64f_A53、ippsMul_f64_A53、ippsDiv_64f_A53 和通常的 C 操作、-、*、/)等于 MATLAB 结果并且总和误差为零,但是math.h 双曲函数给出了关于 -3..-5e-13 的 75699 个元素的数组的总和误差。 Intel 函数 ippsCosh_64f_A53 和其他函数给出了关于 -1..-5e-14 的总和错误。

您知道计算高精度双曲函数和指数函数的库吗?或者 Visual Studio 2012 中有一些编译器设置可以帮助我?

在安装了 Intel Parallel Studio XE 2013 的 VS 2012 中以 Ipp64f 数据类型( double )进行的所有计算。

P.S.:总误差是在 MATLAB 中计算的。我将数组从我的 C 程序保存到 4 级 mat 文件,然后导入到 MATLAB 中,在那里我总结了 MATLAB 数组和导入数组之间的差异,如 sum(M_cosh - C_cosh);

最佳答案

不是答案,更多的是扩展评论:

你写

I need to increase computation speed of MATLAB code

然后问

Do you know a library to compute high precision trigonometric and exponent functions?

是的,我知道有几个这样的库,但它们实现的 float 比当前 CPU(主要是 32 位和 64 位)上通常提供的位数更多,并且在软件中实现了对这些数字的算术运算.为了提高计算速度,这样的库是无用的,它们提高的精度是以增加执行时间为代价的。对于许多其他用户来说,这是一个合理的权衡。

我不知道有任何广泛使用或备受推崇的库在机器数上实现精度保持算法。此处没有篇幅来详细介绍,但为了介绍问题,您可能比开始阅读 Kahan's summation algorithm 做得更糟。 .

Mathworks 对于揭示 Matlab 实现的算法有些含糊其辞。然而,Matlab 的大部分计算内核都是用 C(或 C++,我相信)编写并编译成库的。他们中的许多人现在也是多线程的。如果您试图编写性能优于 Matlab 的代码,则必须编写多线程、高性能的数值代码。

得知 Matlab 实现的算法确实具有精度保持功能,我一点也不感到惊讶。毕竟,Mathworks 试图为市场提供一种工具,该工具可以解决范围广泛的问题,而用户不必考虑低级问题,例如机器精度是否足以解决特定问题的组合以及数据集。

最后。尽管在速度上击败 Matlab 令人印象深刻,但您的第一次尝试并不成功,这并不让我感到惊讶。我怀疑地期待着当您报告成功时感到惊喜,您自己的代码及时优于 Matlab 并产生令人满意的结果。

关于c++ - MATLAB代码和C(C++)用IPP代码计算结果的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19887862/

相关文章:

c++ - 如何在 for 循环中声明第二个迭代器?

c - 文件编号升序排列

c - 链接到 bsd/stdlib.h

javascript - 查找一个数字的所有排列而不重复(为清楚起见进行了编辑)

javascript - 将 JS 数组转换为单个对象

c++ - 如何使用 OpenSSL C 库将 RSA key 从二进制数据加载到 RSA 结构?

c++ - 使用 C++ 在 Windows 下获取 Harddrrive 性能

c++ - 尝试将 streambuf 响应作为字符串获取时 boost::asio 问题

c++ - 我们如何使用强制转换来允许将字符屏蔽为字符串?

javascript - Jquery:元素数组的事件监听器