tl;博士
Python 是否重用 ID?生命周期不重叠的两个对象获得相同 ID 的可能性有多大?
背景:
我一直在研究一个完全用 Python 3 编写的复杂项目。我在测试中看到了一些问题,并花了很多时间寻找根本原因。经过一些分析,我怀疑当测试作为一个整体运行时(它是由专门的调度程序编排并运行的),它正在重用一些模拟方法,而不是用它们的原始方法实例化新对象。为了检查解释器是否正在重用,我使用了 id()
.
问题:id()
通常工作并显示对象标识符,并让我知道我的调用何时创建新实例而不是重用。但是如果两个对象相同,当 ids 时会发生什么? The documentation说:
Return the “identity” of an object. This is an integer which is guaranteed to be unique and constant for this object during its lifetime. Two objects with non-overlapping lifetimes may have the same
id()
value.
问题:
id()
值(value)观?只是在随机选择相同的内存区域时吗?如果它只是随机的,那似乎极不可能,但仍然不能保证。 id()
但是该方法获得了与被模拟时相同的 ID,它实际上只是一个模拟。 最佳答案
是的,CPython 重用 id()
值。 不要指望这些在 Python 程序中是唯一的 .
这是 clearly documented :
Return the “identity” of an object. This is an integer which is guaranteed to be unique and constant for this object during its lifetime. Two objects with non-overlapping lifetimes may have the same id() value.
大胆强调我的。只要对象还活着,id 就是唯一的。没有引用的对象从内存中删除,允许
id()
值要重新用于另一个对象,因此不重叠的生命周期措辞。请注意,这仅适用于 Python.org 提供的标准实现 CPython。还有其他 Python 实现,例如 IronPython、Jython 和 PyPy,它们可以自行选择如何实现
id()
,因为他们每个人都可以对如何处理内存和对象生命周期做出不同的选择。要解决您的具体问题:
id()
是内存地址。新对象将被插入下一个可用内存空间,因此如果特定内存地址有足够的空间来容纳下一个新对象,则内存地址将被重用。创建相同大小的新对象时,您可以在解释器中看到这一点:>>> id(1234)
4546982768
>>> id(4321)
4546982768
1234
字面量创建一个新的整数对象,为其 id()
产生一个数值。由于没有进一步引用 int
值,它再次从内存中删除。但是使用不同的整数文字再次执行相同的表达式,您可能会看到相同的 id()
值(垃圾收集运行打破循环引用可以释放更多内存,因此您也可以 而不是 再次查看相同的 id()
。所以它不是随机的,但在 CPython 中它是内存分配算法的函数。
weakref
weak reference如果您只需要确保对象仍然“活着”。例如,先记录一个对象引用,然后再检查它:
import weakref
# record
object_ref = weakref.ref(some_object)
# check if it's the same object still
some_other_reference is object_ref() # only true if they are the same object
弱引用不会使对象保持事件状态,但如果它处于事件状态,则
object_ref()
将返回它(否则将返回 None
)。您可以使用这种机制来生成真正唯一的标识符,请参见下文。
当对一个对象的所有引用都消失的那一刻,该对象的引用计数下降到 0 并且它被删除,然后。
只需要垃圾收集来打破循环引用,对象只相互引用,不再引用循环。因为这样的循环在没有帮助的情况下永远不会达到 0 的引用计数,垃圾收集器会定期检查此类循环并中断其中一个引用以帮助从内存中清除这些对象。
因此,您可以通过删除对它的所有引用来导致从内存中删除(释放)任何对象。如何实现取决于对象的引用方式。您可以要求解释器告诉您哪些对象正在使用
gc.get_referrers()
function 引用给定的对象。 ,但考虑到不会给你变量名。它为您提供对象,例如字典对象,即 __dict__
将对象引用为全局等的模块的属性。对于完全在您控制之下的代码,最多使用 gc.get_referrers()
作为一种工具,在您编写代码以删除对象时,它会提醒自己引用对象的位置。 如果必须在 Python 应用程序的生命周期内拥有唯一标识符,则必须实现自己的工具。如果您的对象是可散列的并且支持弱引用,那么您可以使用
WeakKeyDictionary
instance将任意对象与 UUIDs 相关联:from weakref import WeakKeyDictionary
from collections import defaultdict
from uuid import uuid4
class UniqueIdMap(WeakKeyDictionary):
def __init__(self, dict=None):
super().__init__(self)
# replace data with a defaultdict to generate uuids
self.data = defaultdict(uuid4)
if dict is not None:
self.update(dict)
uniqueidmap = UniqueIdMap()
def uniqueid(obj):
"""Produce a unique integer id for the object.
Object must me *hashable*. Id is a UUID and should be unique
across Python invocations.
"""
return uniqueidmap[obj].int
这仍然会产生整数,但由于它们是 UUID,因此不能完全保证它们是唯一的,但是您在有生之年遇到相同 ID 的可能性比被陨石击中的可能性要小。见 How unique is UUID?
即使对于生命周期不重叠的对象,这也会为您提供唯一的 id:
>>> class Foo:
... pass
...
>>> id(Foo())
4547149104
>>> id(Foo()) # memory address reused
4547149104
>>> uniqueid(Foo())
151797163173960170410969562162860139237
>>> uniqueid(Foo()) # but you still get a unique UUID
188632072566395632221804340107821543671
关于python - Python 的 id() 有多独特?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52096582/