c - 矩阵的逆不准确

标签 c math matrix floating-point sse

我正在尝试编写测试来验证矩阵的逆,但当我使用 FLT_EPSILON 比较结果时测试失败。

比较函数如下所示:  test_assert_mat4_eq

我想做的是:

A = random matrix (4x4 float matrix)
B = inv(A)
C = inv(B)

assert(A == C) <---- fails

首先让我解释一下如何计算矩阵逆; mat4 是 4x4 浮点矩阵,如果启用 SIMD,则将通过 SIMD 指令(SSE2 和 AVX)计算矩阵的逆。

您可以在 glm_mat4_inv 处看到矩阵逆代码如果启用 SSE2,则通过 glm_mat4_inv_sse2 计算逆数还有glm_mat4_inv_precise_sse2通过避免 _mm_rcp_ps 指令来获得更高精度的版本。我使用第二个(glm_mat4_inv_precise_sse2)版本进行测试。

assert_true(fabsf(m1[i][j] - m2[i][j]) <= 0.0001);

在我的 MacBook 上可以通过,但在 Linux 上仍然失败。

assert_true(fabsf(m1[i][j] - m2[i][j]) <= FLT_EPSILON);这甚至在Macos上都没有通过。也许与 0.001 比较在 Linux 上也可以,但精度太低。

我还在 glm 存储库 ( https://github.com/g-truc/glm/issues/700 ) 上创建了一个问题,因为此问题对 glm 也有效。

这有什么问题吗?为什么精度太低?这个可以吗?我应该这样保留它(通过删除测试或更改精度)吗?

注意:随机矩阵是用 test_rand_mat4 生成的功能。但我只是用它来生成矩阵。我没有在任何地方使用任何随机矩阵,所有矩阵都是仿射变换矩阵,也许我应该使用仿射变换(这是主要目的)进行比较

最佳答案

  1. 4⨉4 矩阵足够小,您可以检测代码以在每一步计算后打印所涉及的每个 float ,然后比较 macOS 和 Linux 结果以查看它们的不同之处。 (使用 C 的 printf 中的 %a 格式来打印十六进制 float ,或者使用类似 %.30g 的格式来打印十进制的整个值.)

  2. 告诉我们差异超过 0.0001 是没有意义的,因为我们不知道您的数据有多大。通常,数值误差大致与所涉及的某些数字的大小成正比。

  3. 如果在 macOS 和使用 IEEE-754 浮点硬件上运行的 Linux 上执行“相同”操作,则应该获得相同的结果。因此,任何差异都可能是因为您没有使用相同的操作。造成此类差异的原因可能包括两个系统使用不同的源代码(例如,一个系统由于启用了 SSE 而使用 SIMD,而另一个系统使用标量代码)或者编译器以不同的方式编译代码。暂时覆盖 SSE 决策,以便您在两个系统上测试相同的源代码。调试完成后,如果可能的话,在两个系统上测试 SSE 代码。之后,将 SSE 代码与非 SSE 代码进行比较。

  4. 您不应使用随机数据进行测试,而应从简单的测试用例开始,然后逐渐发展到更复杂的测试用例。从单位矩阵开始。简单的情况将有助于调试基本逻辑,而不会涉及重大的浮点错误。然后修改元素以生成更复杂的情况。生成测试矩阵时,避免 ill-conditioned matrices 。我在生成用于测试矩阵逆的矩阵方面没有经验,因此您必须研究如何修改矩阵以改善其条件数,否则其他人可能会提出一些建议。

  5. 不要通过调用 inv 两次来测试矩阵逆。这会错过一些简单的错误,例如复制粘贴错误,该错误会导致名为 inv 的例程实际上是矩阵复制或求反。相反,使用矩阵逆的已知良好引用实现或使用已知的测试用例(单位矩阵的逆是单位矩阵,并且可以构造其他矩阵)或使用逆的其他属性(将逆乘以原始矩阵应产生单位矩阵)。使用 double 作为测试代码。在 4⨉4 矩阵求逆中查找错误所需的测试用例数量不够大,因此性能很重要。

关于c - 矩阵的逆不准确,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47351638/

相关文章:

java - Java 中的算术运算

c# - 如何在 C# 中计算这种类型的方程 (x^1+...x^n)?

c - 更新打印到屏幕的 ascii 网格而不重新打印网格

r - R 模型矩阵中因子的所有级别

c - 2 次方大小数据的性能优势?

使用 libpcap 捕获任何接口(interface)时无法获取协议(protocol)

c++ - C/++函数如何正确返回值?

python - 当某些参数未知时,如何使用 sympy 获得分段函数?

c - 从 C 在 Paraview 上打印值

R获得矩阵中每一行的最小值,并返回行名和列名