linux - percpu 指针在 Linux 内核中是如何实现的?

标签 linux linux-kernel smp

在多处理器上,每个核心都可以有自己的变量。我认为它们是不同地址的不同变量,尽管它们在同一个进程中并且具有相同的名称。

但我想知道,内核是如何实现的?是不是分出一 block 内存存放所有的percpu指针,每次都用shift什么的把指针重定向到某个地址?

最佳答案

普通全局变量不是每个 CPU。自动变量在栈上,不同的CPU使用不同的栈,自然会得到不同的变量。

我猜你指的是 Linux 的每 CPU 变量基础结构。
大多数魔法都在这里(asm-generic/percpu.h):

extern unsigned long __per_cpu_offset[NR_CPUS];

#define per_cpu_offset(x) (__per_cpu_offset[x])

/* Separate out the type, so (int[3], foo) works. */
#define DEFINE_PER_CPU(type, name) \
    __attribute__((__section__(".data.percpu"))) __typeof__(type) per_cpu__##name

/* var is in discarded region: offset to particular copy we want */
#define per_cpu(var, cpu) (*RELOC_HIDE(&per_cpu__##var, __per_cpu_offset[cpu]))
#define __get_cpu_var(var) per_cpu(var, smp_processor_id())

RELOC_HIDE(ptr, offset) 只是将 ptr 前进给定的字节偏移量(无论指针类型如何)。

它有什么作用?

  1. 定义 DEFINE_PER_CPU(int, x) 时,会在特殊的 .data.percpu 部分创建一个整数 __per_cpu_x
  2. 加载内核时,此部分会加载多次 - 每个 CPU 一次(这部分魔法不在上面的代码中)。
  3. __per_cpu_offset 数组填充了副本之间的距离。假设使用 1000 字节的每个 CPU 数据,__per_cpu_offset[n] 将包含 1000*n
  4. 符号 per_cpu__x 将在加载期间重新定位到 CPU 0 的 per_cpu__x
  5. __get_cpu_var(x),在 CPU 3 上运行时,将转换为 *RELOC_HIDE(&per_cpu__x, __per_cpu_offset[3])。这从 CPU 0 的 x 开始,添加 CPU 0 的数据和 CPU 3 的数据之间的偏移量,并最终取消引用结果指针。

关于linux - percpu 指针在 Linux 内核中是如何实现的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16978959/

相关文章:

linux - 为什么curl没有发布我的标题

c - Linux 内核 splice() 是零拷贝吗?

c - select 中可以使用相同的 fd 进行读写

linux - 如何使用 Linux 内核中的内存屏障

linux - SMP 系统中的 linux 内核是否保证将从网络按顺序到达的 UDP 数据包按顺序从套接字读取?

linux - 是否有任何软件可以让我在 Windows 中读取文本二进制文件?

linux - 如何使 vim 指向位于自定义路径的语法文件

linux - 理解Linux中的SMP概念

html - 使用 sed 从文件中删除空的 HTML 标签

multithreading - 如果线程共享相同的PID,如何识别它们?