c++ - 阅读 CF、PF、ZF、SF、OF

我正在为我自己的汇编语言编写一个虚拟机，当我执行加法等操作时，我希望能够像在 x86-64 体系结构中设置的那样设置进位、奇偶校验、零、符号和溢出标志.

注意事项:

我正在使用 Microsoft Visual C++ 2015 和 Intel C++ Compiler 16.0
我正在编译为 Win64 应用程序。
我的虚拟机(目前)只对 8 位整数进行运算
我(目前)对任何其他标志(例如 AF)不感兴趣

我目前的解决方案是使用以下函数:

void update_flags(uint16_t input)
{
    Registers::flags.carry = (input > UINT8_MAX);
    Registers::flags.zero = (input == 0);
    Registers::flags.sign = (input < 0);
    Registers::flags.overflow = (int16_t(input) > INT8_MAX || int16_t(input) < INT8_MIN);

    // I am assuming that overflow is handled by trunctation
    uint8_t input8 = uint8_t(input);
    // The parity flag
    int ones = 0;
    for (int i = 0; i < 8; ++i)
        if (input8 & (1 << i) != 0) ++ones;

    Registers::flags.parity = (ones % 2 == 0);
}

作为补充，我会按如下方式使用:

uint8_t a, b;
update_flags(uint16_t(a) + uint16_t(b));
uint8_t c = a + b;

编辑: 澄清一下，我想知道是否有更有效/更简洁的方法(例如直接访问 RFLAGS) 此外，我的代码可能不适用于其他操作(例如乘法)

EDIT 2 我现在已经将我的代码更新为:

void update_flags(uint32_t result)
{
    Registers::flags.carry = (result > UINT8_MAX);
    Registers::flags.zero = (result == 0);
    Registers::flags.sign = (int32_t(result) < 0);
    Registers::flags.overflow = (int32_t(result) > INT8_MAX || int32_t(result) < INT8_MIN);
    Registers::flags.parity = (_mm_popcnt_u32(uint8_t(result)) % 2 == 0);
}

还有一个问题，我的进位标志代码能正常工作吗？我还希望为减法期间发生的“借用”正确设置它。

注意:我正在虚拟化的汇编语言是我自己设计的，旨在简单并基于 Intel 的 x86-64 实现(即 Intel64)，因此我希望这些标志的行为方式大致相同。

最佳答案

TL:DR:使用惰性标志评估，见下文。

input 是一个奇怪的名字。大多数 ISA 根据操作的结果而不是输入来更新标志。您正在查看 8 位操作的 16 位结果，这是一种有趣的方法。在 C 中，您应该只使用 unsigned int，保证至少为 uint16_t。它将在 x86 上编译成更好的代码，其中 unsigned 是 32 位。 16 位操作需要一个额外的前缀，并可能导致部分寄存器速度变慢。

这可能有助于解决您提到的 8bx8b->16b mul 问题，具体取决于您希望如何为正在模拟的架构中的 mul 指令定义标志更新。

我认为您的溢出检测不正确。参见 this tutorial从 x86 链接为 wiki 标记它是如何完成的。

这可能不会编译成非常快的代码，尤其是奇偶校验标志。您是否需要正在仿真/设计的 ISA 具有奇偶校验标志？你从来没有说过你在模拟 x86，所以我假设这是你自己设计的一些玩具架构。

一个高效的模拟器(尤其是需要支持奇偶校验标志的模拟器)可能会从某种惰性标志评估中获益良多。保存一个值，如果需要，您可以从中计算标志，但在您到达读取标志的指令之前不要实际计算任何东西。大多数指令只写入标志而不读取它们，它们只是将 uint16_t 结果保存到您的架构状态中。标志读取指令可以从保存的 uint16_t 中仅计算它们需要的标志，或者计算所有标志并以某种方式存储。

假设您无法让编译器从结果中实际读取 PF，您可以尝试 _mm_popcnt_u32((uint8_t)x) & 1。或者，将所有位水平异或在一起:

x  = (x&0b00001111) ^ (x>>4)
x  = (x&0b00000011) ^ (x>>2)
PF = (x&0b00000001) ^ (x>>1)   // tweaking this to produce better asm is probably possible

我怀疑任何主要的编译器都可以将对结果的一系列检查优化为 LAHF + SETO al，或 PUSHF。编译器可以导入using a flag condition to detect integer overflow to implement saturating addition, for example .但是要弄清楚你想要所有的标志，并实际使用 LAHF 而不是一系列 setcc 指令，可能是不可能的。当编译器可以使用 LAHF 时，它需要一个模式识别器，而且可能没有人实现它，因为用例非常少。

没有 C/C++ 方法可以直接访问操作的标志结果，这使得 C 成为实现此类功能的糟糕选择。 IDK 如果任何其他语言确实有标志结果，除了 asm。

我希望您可以通过在 asm 中编写部分仿真来获得很多性能，但这将是特定于平台的。更重要的是，需要做更多的工作。

关于c++ - 阅读 CF、PF、ZF、SF、OF，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36231958/

c++ - 阅读 CF、PF、ZF、SF、OF

上一篇：c++ - 非递归删除二叉树的问题

下一篇：c++ - g++ 将字段的基本构造函数错误并忽略它的参数