我正在尝试编写测试来验证矩阵的逆,但当我使用 FLT_EPSILON 比较结果时测试失败。
比较函数如下所示: test_assert_mat4_eq
我想做的是:
A = random matrix (4x4 float matrix)
B = inv(A)
C = inv(B)
assert(A == C) <---- fails
首先让我解释一下如何计算矩阵逆; mat4 是 4x4 浮点矩阵,如果启用 SIMD,则将通过 SIMD 指令(SSE2 和 AVX)计算矩阵的逆。
您可以在 glm_mat4_inv 处看到矩阵逆代码如果启用 SSE2,则通过 glm_mat4_inv_sse2 计算逆数还有glm_mat4_inv_precise_sse2通过避免 _mm_rcp_ps 指令来获得更高精度的版本。我使用第二个(glm_mat4_inv_precise_sse2)版本进行测试。
assert_true(fabsf(m1[i][j] - m2[i][j]) <= 0.0001);
在我的 MacBook 上可以通过,但在 Linux 上仍然失败。
assert_true(fabsf(m1[i][j] - m2[i][j]) <= FLT_EPSILON);
这甚至在Macos上都没有通过。也许与 0.001 比较在 Linux 上也可以,但精度太低。
我还在 glm 存储库 ( https://github.com/g-truc/glm/issues/700 ) 上创建了一个问题,因为此问题对 glm 也有效。
这有什么问题吗?为什么精度太低?这个可以吗?我应该这样保留它(通过删除测试或更改精度)吗?
注意:随机矩阵是用 test_rand_mat4 生成的功能。但我只是用它来生成矩阵。我没有在任何地方使用任何随机矩阵,所有矩阵都是仿射变换矩阵,也许我应该使用仿射变换(这是主要目的)进行比较
最佳答案
4⨉4 矩阵足够小,您可以检测代码以在每一步计算后打印所涉及的每个 float ,然后比较 macOS 和 Linux 结果以查看它们的不同之处。 (使用 C 的
printf
中的%a
格式来打印十六进制 float ,或者使用类似%.30g
的格式来打印十进制的整个值.)告诉我们差异超过 0.0001 是没有意义的,因为我们不知道您的数据有多大。通常,数值误差大致与所涉及的某些数字的大小成正比。
如果在 macOS 和使用 IEEE-754 浮点硬件上运行的 Linux 上执行“相同”操作,则应该获得相同的结果。因此,任何差异都可能是因为您没有使用相同的操作。造成此类差异的原因可能包括两个系统使用不同的源代码(例如,一个系统由于启用了 SSE 而使用 SIMD,而另一个系统使用标量代码)或者编译器以不同的方式编译代码。暂时覆盖 SSE 决策,以便您在两个系统上测试相同的源代码。调试完成后,如果可能的话,在两个系统上测试 SSE 代码。之后,将 SSE 代码与非 SSE 代码进行比较。
您不应使用随机数据进行测试,而应从简单的测试用例开始,然后逐渐发展到更复杂的测试用例。从单位矩阵开始。简单的情况将有助于调试基本逻辑,而不会涉及重大的浮点错误。然后修改元素以生成更复杂的情况。生成测试矩阵时,避免 ill-conditioned matrices 。我在生成用于测试矩阵逆的矩阵方面没有经验,因此您必须研究如何修改矩阵以改善其条件数,否则其他人可能会提出一些建议。
不要通过调用
inv
两次来测试矩阵逆。这会错过一些简单的错误,例如复制粘贴错误,该错误会导致名为inv
的例程实际上是矩阵复制或求反。相反,使用矩阵逆的已知良好引用实现或使用已知的测试用例(单位矩阵的逆是单位矩阵,并且可以构造其他矩阵)或使用逆的其他属性(将逆乘以原始矩阵应产生单位矩阵)。使用double
作为测试代码。在 4⨉4 矩阵求逆中查找错误所需的测试用例数量不够大,因此性能很重要。
关于c - 矩阵的逆不准确,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47351638/