c - 矩阵的逆不准确

我正在尝试编写测试来验证矩阵的逆，但当我使用 FLT_EPSILON 比较结果时测试失败。

我想做的是:

A = random matrix (4x4 float matrix)
B = inv(A)
C = inv(B)

assert(A == C) <---- fails

首先让我解释一下如何计算矩阵逆； mat4 是 4x4 浮点矩阵，如果启用 SIMD，则将通过 SIMD 指令(SSE2 和 AVX)计算矩阵的逆。

您可以在 glm_mat4_inv 处看到矩阵逆代码如果启用 SSE2，则通过 glm_mat4_inv_sse2 计算逆数还有glm_mat4_inv_precise_sse2通过避免 _mm_rcp_ps 指令来获得更高精度的版本。我使用第二个(glm_mat4_inv_precise_sse2)版本进行测试。

assert_true(fabsf(m1[i][j] - m2[i][j]) <= 0.0001);

在我的 MacBook 上可以通过，但在 Linux 上仍然失败。

assert_true(fabsf(m1[i][j] - m2[i][j]) <= FLT_EPSILON);这甚至在Macos上都没有通过。也许与 0.001 比较在 Linux 上也可以，但精度太低。

我还在 glm 存储库 ( https://github.com/g-truc/glm/issues/700 ) 上创建了一个问题，因为此问题对 glm 也有效。

这有什么问题吗？为什么精度太低？这个可以吗？我应该这样保留它(通过删除测试或更改精度)吗？

注意:随机矩阵是用 test_rand_mat4 生成的功能。但我只是用它来生成矩阵。我没有在任何地方使用任何随机矩阵，所有矩阵都是仿射变换矩阵，也许我应该使用仿射变换(这是主要目的)进行比较

最佳答案

4⨉4 矩阵足够小，您可以检测代码以在每一步计算后打印所涉及的每个 float ，然后比较 macOS 和 Linux 结果以查看它们的不同之处。 (使用 C 的 printf 中的 %a 格式来打印十六进制 float ，或者使用类似 %.30g 的格式来打印十进制的整个值.)
告诉我们差异超过 0.0001 是没有意义的，因为我们不知道您的数据有多大。通常，数值误差大致与所涉及的某些数字的大小成正比。
如果在 macOS 和使用 IEEE-754 浮点硬件上运行的 Linux 上执行“相同”操作，则应该获得相同的结果。因此，任何差异都可能是因为您没有使用相同的操作。造成此类差异的原因可能包括两个系统使用不同的源代码(例如，一个系统由于启用了 SSE 而使用 SIMD，而另一个系统使用标量代码)或者编译器以不同的方式编译代码。暂时覆盖 SSE 决策，以便您在两个系统上测试相同的源代码。调试完成后，如果可能的话，在两个系统上测试 SSE 代码。之后，将 SSE 代码与非 SSE 代码进行比较。
您不应使用随机数据进行测试，而应从简单的测试用例开始，然后逐渐发展到更复杂的测试用例。从单位矩阵开始。简单的情况将有助于调试基本逻辑，而不会涉及重大的浮点错误。然后修改元素以生成更复杂的情况。生成测试矩阵时，避免 ill-conditioned matrices 。我在生成用于测试矩阵逆的矩阵方面没有经验，因此您必须研究如何修改矩阵以改善其条件数，否则其他人可能会提出一些建议。
不要通过调用 inv 两次来测试矩阵逆。这会错过一些简单的错误，例如复制粘贴错误，该错误会导致名为 inv 的例程实际上是矩阵复制或求反。相反，使用矩阵逆的已知良好引用实现或使用已知的测试用例(单位矩阵的逆是单位矩阵，并且可以构造其他矩阵)或使用逆的其他属性(将逆乘以原始矩阵应产生单位矩阵)。使用 double 作为测试代码。在 4⨉4 矩阵求逆中查找错误所需的测试用例数量不够大，因此性能很重要。

关于c - 矩阵的逆不准确，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47351638/

c - 矩阵的逆不准确

上一篇：c - Valgrind:C 程序中肯定丢失内存泄漏

下一篇：C-分区不起作用