我想深入理解为什么下面这两个生成的操作码是相同的(加载/存储的值除外)。
特别是这个“BINARY_MULTIPLY”如何同时用于 str 和 int ? C (CPython) 是否在后台进行类型检查并应用正确的函数,无论值是字符串还是整数?
我们可以说这种机制与鸭子类型(duck typing)有关吗?
>>> def tata():
... a = 1
... b = 1
... c = a * b
...
>>> dis.dis(tata)
2 0 LOAD_CONST 1 (1)
3 STORE_FAST 0 (a)
3 6 LOAD_CONST 1 (1)
9 STORE_FAST 1 (b)
4 12 LOAD_FAST 0 (a)
15 LOAD_FAST 1 (b)
18 BINARY_MULTIPLY
19 STORE_FAST 2 (c)
22 LOAD_CONST 0 (None)
25 RETURN_VALUE
>>> def toto():
... a = "1"
... b = "1"
... c = a * b
...
>>> dis.dis(toto)
2 0 LOAD_CONST 1 ('1')
3 STORE_FAST 0 (a)
3 6 LOAD_CONST 1 ('1')
9 STORE_FAST 1 (b)
4 12 LOAD_FAST 0 (a)
15 LOAD_FAST 1 (b)
18 BINARY_MULTIPLY
19 STORE_FAST 2 (c)
22 LOAD_CONST 0 (None)
25 RETURN_VALUE
最佳答案
Python 字节码是非常高级的,考虑到该语言极其动态的语义,它不能做太多不同的事情。 BINARY_MULTIPLY
当您在源代码中指定 *
时发出,无论操作数的类型如何。具体做什么是在运行时确定的。
事后看来这是很明显的:在 Python 中 一般 类型只在运行时才知道,并且考虑到它允许的灵 active (通过例如 monkeypatching)你可以决定只在运行时做什么执行的时刻。毫不奇怪,这就是 CPython 如此缓慢的原因之一。
在特定情况下,例如您的示例中显示的这些情况,编译器可以执行类型推断并在编译时执行计算,或者至少发出一些(假想的)更具体的操作码。不幸的是,这会使解释器复杂化并且在一般情况下不会有太大帮助,因为通常您的计算涉及来自外部的参数,例如:
def square(x):
return x*x
x
这里可以是任何类型,因此编译时智能没有用。
def times5(x):
return x * 5
即使此处的 5 已知,times5
也会根据 x
的类型("a"
-> "aaaaa"
; 2
-> 10
; 4.5
-> 22.5
; 一些自定义类类型 -> 它取决于运算符重载,仅在运行时才知道)。
您可以采用 asm.js 的方式并找到间接的方式来提供类型提示,但 Python (PyPy) 的高性能实现只是使用跟踪 JIT 方法自行推断常用的参数类型 (在运行代码一段时间后)并生成针对观察到的情况定制的优化机器代码。
关于python - 理解为什么来自不同代码的这些操作码是相同的,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51891921/