c++ - 处理小于cpu数据总线的数据类型。 (将c++转换为机器代码。)

标签 c++ assembly ram

在以下答案中:https://softwareengineering.stackexchange.com/a/363379/370129
CPU访问内存的方式已经很清楚地说明了。假设我们创建的数据类型小于CPU的数据总线,例如c++ char;如何读取由CPU读取的数据总线大小的内存块,以修改为在寄存器中用作预期类型?指定的字节是否已移位,以使其占据寄存器中的最低有效字节(如果尚未存在)?那么,多余的(根据类型大小)最高有效字节是否设置为0?
然后,CPU可以将一个/多个修改后的单个字节写入一个/多个内存地址吗,还是必须将整个总线大小的块写入一个或多个占用的总线大小的内存插槽中?使用的字节数?

最佳答案

对于发生的事情,它非常特定于处理器。有些有多种选择。加载字节指令的常见选项是将高位清零或对高位进行符号扩展。因此,如果处理器将0xAB加载到32位寄存器中,则取决于0x000000AB还是0xFFFFFFAB。一些处理器以其他方式解决该问题。
cpu总线的工作方式由CPU决定。如果没有加载/存储字节(加载/存储半字,加载/存储字)指令,处理器将不会非常成功。但是,通过x86和随时间演变的其他方法可以看到实现总线的不同方法。出于性能原因,今天您通常需要32或64或更宽的总线,平衡太 Assembly 带来很大的损失,平衡太小会限制性能。不是必需的,但是通常我们有L1高速缓存,有时有L2,高速缓存有很多原因,但是高速缓存的固定宽度较大,例如32位或64位,因此较小的传输将需要读-修改-写用于写入该内存。这不是处理器问题,也不是要在总线上解决的问题,总线/内存 Controller 将捕获写入信息(地址,数据和大小),然后在另一侧处理sram或总线。
通常,如果在32位或64位总线上进行8位读取,则CPU处理读取操作,然后结果将返回到总线定义的字节通道,然后处理器从指令中知道要从总线中取出多少数据。总线,在总线上的位置以及如何处理(直接进入alu,进入寄存器,对符号进行零或加零等操作)。
由于目标端通常是为此总线设计的高速缓存或外围设备,因此不一定需要设计读取来指示子总线的大小,因此读取的长度通常以总线宽度为单位,因此可以进行128位传输32位总线的长度为4,开销发生在总线之间,然后理想情况下,四个时钟的脉冲串将移动数据(与四个32位传输相比,每个传输具有所有开销)。但是,单个或子大小的读取将仅显示为单个宽度的读取,并且处理器隔离了感兴趣的字节。
对于写操作,通常有一个长度指示器或一个字节掩码,如果它是一条32位宽的总线,分成4个字节通道,则将有一个4位掩码来向另一侧指示写操作的哪个字节有效,哪个字节有效不使用/应用的应用程序,并且会根据需要驱动读取-修改-写入。例如,如果在一个 ARM 上执行了一个带有三个寄存器的stm,而您的内核正在使用64位宽的总线,那么这将显示为两次传输一个32位和一个64位,如果它使用32位宽的总线,那么它将可能是一次传输,长度为三。 (尽管我已经看到臂式总线的长度不超过总线宽度的2倍)。
较小的传输总是有代价的,这取决于是否可以在没有其他处理器/系统开销的情况下看到它。 x86不一定会因为开销而造成损失,但是有时您可以使用arm,进行4字节大小的传输与1个32位传输或什至2个16s与1个32位传输。但这取决于,这并不意味着您会看到它,这意味着您可能会看到。并且要了解,臂是核心而不是芯片,因此大部分芯片与臂无关,但总体性能与芯片供应商而非臂有关。
编辑
第二次尝试。
对于写操作,CPU总线通常支持各种大小,如Fuz所示。如今,CPU(处理器核心)不必处理远端发生的读取-修改-写入。
对于读取,CPU总线通常读取完整的总线宽度,而处理器确实必须处理它。但是总线和处理器是作为系统设计的。取决于指令的处理器将提取正确的位数,并以零填充或符号扩展它们。
这完全取决于处理器/芯片。
我已经看到,根据指令,总线,地址,大小,一条指令可以/可能变成多个总线事务是有意义的。

关于c++ - 处理小于cpu数据总线的数据类型。 (将c++转换为机器代码。),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62903677/

相关文章:

c - 为什么我不能使用 CodeBlocks 从我的 C 源代码调用汇编函数?

c - INT 13 扩展读入 C

Docker 在终止进程后分配了 RAM

C++ 在文件级别创建作用域

C# 通用比较方法 [C++ 模板的模拟]

java - 使用 gcc 创建共享库

linux - 如果 Linux 中有足够的 RAM 可用,则释放交换空间

c++ - 使用c++调用和使用Windows语音识别

performance - 某些通用寄存器是否比其他寄存器更快?

RHEL/CentOS中的缓存(Cache)目录