c - 系统调用如何转换为CPU指令？

假设有一个简单的程序，例如：

#include<stdio.h>

void main() 
{ 
    int x;
    printf("Cool");
    fd = open("/tmp/cool.txt", O_READONLY)
}

open是此处的系统调用。我想外壳程序运行时会进行其他数百次系统调用以实现它？像int x这样的声明怎么样-在某个时候它应该在后台进行一些其他的系统调用以从计算机获取内存？

我不确定系统调用和常规操作之间的界限是什么...最后，一切都需要操作系统的帮助吗？

还是就像C生成了一个可执行文件（代码），该可执行文件可以在处理器上运行，并且在到达系统调用之前不需要OS协助-在这一点上，它必须执行某些操作来加载OS指令等。

有点含糊:)请澄清。

最佳答案

我没有按顺序回答问题，所以我在回答前面加上问题。我已经自由地进行了一些编辑。您没有指定处理器体系结构，但是我假设您想了解x86，因此处理器级别的详细信息将与x86有关。其他体系结构的行为可能有所不同（内存管理，如何进行系统调用等）。我也以Linux为例。

c编译器是否生成可执行代码，无需操作系统协助即可直接在处理器上运行，直到到达系统调用为止，此时必须执行某些操作来加载OS指令？

对，那是正确的。编译器生成可直接在处理器上运行的本机代码。但是，从编译器获得的可执行文件包含代码和其他所需的数据，例如，有关将代码加载到内存中的位置的说明。在Linux上，ELF格式通常用于可执行文件。

如果该进程已完全加载到内存中并具有足够的堆栈空间，则在进行系统调用之前将不需要进一步的OS帮助。当您进行系统调用时，仅是机器代码中的一条指令即可调用OS。程序本身不需要以任何方式“加载OS指令”。处理器处理将执行转移到OS代码。

在x86体系结构的Linux上，机器代码进行系统调用的一种方法是使用软件中断向量128将执行转移到操作系统。在x86程序集（Intel语法）中，表示为int 0x80。然后，Linux将根据调用程序放置在处理器寄存器中的值执行系统调用之前执行的任务：在eax处理器寄存器中找到系统调用号，在其他处理器寄存器中找到系统调用参数。操作系统完成后，它将在eax寄存器中返回结果，并且可能已修改了系统调用参数等指向的缓冲区。但是请注意，这不是进行系统调用的唯一方法。

但是，如果进程不完全在内存中，并且执行移至当前不在内存中的部分代码，则处理器会导致页面错误，该错误将执行移至操作系统，然后加载所需的部分将该进程的数据存储到内存中，并将执行转移回该进程，然后该进程可以正常继续执行，甚至无需注意发生任何事情。

我不太确定接下来要讲的那一点，所以带一点盐。 Wikipedia关于stack overflow的文章（计算机错误，不是此站点：）似乎表明堆栈通常具有固定大小，因此int x;不应使操作系统运行，除非堆栈的该部分不在操作系统中。内存（请参阅上一段）。如果您的系统具有动态堆栈大小（即使有可能，但据我所知是这样），那么当堆栈空间用完时，int x;也会导致页面错误，从而提示操作系统为该进程分配更多的堆栈空间。

页面错误会导致执行移至操作系统，但不是通常意义上的系统调用。当您希望操作系统为您执行某些工作时，系统调用是对操作系统的显式调用。页面错误和其他此类事件是隐式的。硬件中断不断将执行过程从您的进程转移到OS，以便它可以对它们做出反应。之后，它将执行转移回您的流程或其他流程。

在多任务OS上，即使只有一个处理器/内核，也可以一次运行许多程序。这可以通过一次只运行一个程序，但可以在程序之间快速切换来实现。硬件计时器中断可确保将控制权及时转移回操作系统，以使一个进程无法完全占用CPU。当控制权传递给操作系统并完成所需的操作后，它可能总是会从被中断的进程开始一个不同的进程。操作系统完全透明地处理所有这些，因此您不必考虑它，您的过程也不会注意到它。从您的过程的角度来看，它是连续执行的。

简而言之：您的程序仅在明确要求时才执行系统调用。操作系统也可以在需要时在内存中进出交换您的进程的一部分，通常在后台执行与您的进程相关和无关的事情，但是通常您根本不需要考虑这一点。（但是，通过使程序尽可能的小，您可以减少页面错误的数量）

在这种情况下，open()是一个显式的系统调用，但是我想当shell运行它时，它将进行数百次其他系统调用来实现它。

不，shell与c程序中的open()调用无关。您的程序进行了一次系统调用，而shell根本没有出现。

该外壳程序只会在启动时影响您的程序。当您使用外壳启动程序时，外壳会执行fork系统调用以派生第二个进程，然后该进程将执行execve系统调用以用程序替换自身。之后，您的程序将得到控制。但是，在控件进入您的main()函数之前，它将执行一些初始化代码，该代码已由编译器存储在该代码中。如果要查看流程调用的系统，请在Linux上使用strace进行查看。例如，只需说strace ls，以查看系统调用ls在执行期间产生的作用。如果仅使用立即返回的main()函数编译c程序，则可以使用strace查看系统调用初始化代码的方式。

进程如何从计算机等获取其内存？它必须再次涉及一些系统调用，对吗？我不确定系统调用和普通内容之间的界限是什么。最后的一切都需要操作系统的帮助，对吗？

是的，系统调用。通过execve系统调用将程序加载到内存中时，它会为进程获取足够的内存。当您需要更多内存并调用malloc()时，如果内部缓存不足以提供给您，它将进行brk系统调用来扩展进程的数据段。

并非所有东西都需要操作系统的明确帮助。如果您有足够的内存，将所有输入都存储在内存中，然后将输出数据写入内存，则完全不需要操作系统。也就是说，只要您仅对内存中已有的数据进行计算，不需要更多的内存，并且不需要与外界进行通信，就不需要操作系统。另一方面，完全不与外界通信的程序是一个非常无用的程序，因为它无法获取任何输入，也无法提供任何输出。即使您计算出pi的百万分之一小数，如果不将其输出给用户也没关系。

这个答案很大，因此，如果我错过了一些内容或没有足够清楚地解释一些内容，请给我留言，我将尽力加以阐述。如果有人发现任何错误，也请务必指出。

关于c - 系统调用如何转换为CPU指令？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5570893/

c - 系统调用如何转换为CPU指令？

上一篇：asp.net - 如何在 .Net 5 中加载为另一个 .net 版本构建的 .dll？

下一篇：symfony - 在应用 DataTransformer 之前验证字段