python - Python 的 id() 有多独特？

tl;博士
Python 是否重用 ID？生命周期不重叠的两个对象获得相同 ID 的可能性有多大？

背景:
我一直在研究一个完全用 Python 3 编写的复杂项目。我在测试中看到了一些问题，并花了很多时间寻找根本原因。经过一些分析，我怀疑当测试作为一个整体运行时(它是由专门的调度程序编排并运行的)，它正在重用一些模拟方法，而不是用它们的原始方法实例化新对象。为了检查解释器是否正在重用，我使用了 id() .

问题:id()通常工作并显示对象标识符，并让我知道我的调用何时创建新实例而不是重用。但是如果两个对象相同，当 ids 时会发生什么？ The documentation说:

Return the “identity” of an object. This is an integer which is guaranteed to be unique and constant for this object during its lifetime. Two objects with non-overlapping lifetimes may have the same id() value.

问题:

解释器什么时候可以重用id()值(value)观？只是在随机选择相同的内存区域时吗？如果它只是随机的，那似乎极不可能，但仍然不能保证。

有没有其他方法可以检查我实际引用的对象？我遇到了一种情况，我有对象，它有一个模拟方法。该对象不再使用，垃圾收集器将其销毁。之后我创建了一个相同类的新对象，它得到了一个新的 id()但是该方法获得了与被模拟时相同的 ID，它实际上只是一个模拟。

有没有办法强制 Python 销毁给定的对象实例？从我所做的阅读来看，似乎没有，并且当它没有看到对对象的引用时，这取决于垃圾收集器，但我认为无论如何都值得一问。

最佳答案

是的，CPython 重用 id()值。 不要指望这些在 Python 程序中是唯一的 .

这是 clearly documented :

Return the “identity” of an object. This is an integer which is guaranteed to be unique and constant for this object during its lifetime. Two objects with non-overlapping lifetimes may have the same id() value.

大胆强调我的。只要对象还活着，id 就是唯一的。没有引用的对象从内存中删除，允许 id()值要重新用于另一个对象，因此不重叠的生命周期措辞。

请注意，这仅适用于 Python.org 提供的标准实现 CPython。还有其他 Python 实现，例如 IronPython、Jython 和 PyPy，它们可以自行选择如何实现 id() ，因为他们每个人都可以对如何处理内存和对象生命周期做出不同的选择。

要解决您的具体问题:

在 CPython 中，id()是内存地址。新对象将被插入下一个可用内存空间，因此如果特定内存地址有足够的空间来容纳下一个新对象，则内存地址将被重用。创建相同大小的新对象时，您可以在解释器中看到这一点:

>>> id(1234)
4546982768
>>> id(4321)
4546982768

1234字面量创建一个新的整数对象，为其 id()产生一个数值。由于没有进一步引用 int值，它再次从内存中删除。但是使用不同的整数文字再次执行相同的表达式，您可能会看到相同的 id()值(垃圾收集运行打破循环引用可以释放更多内存，因此您也可以 而不是 再次查看相同的 id()。

所以它不是随机的，但在 CPython 中它是内存分配算法的函数。

如果您需要检查特定对象，请保留对它的引用。那可以是 weakref weak reference如果您只需要确保对象仍然“活着”。

例如，先记录一个对象引用，然后再检查它:

import weakref

# record
object_ref = weakref.ref(some_object)

# check if it's the same object still
some_other_reference is object_ref()   # only true if they are the same object

弱引用不会使对象保持事件状态，但如果它处于事件状态，则 object_ref()将返回它(否则将返回 None)。

您可以使用这种机制来生成真正唯一的标识符，请参见下文。

“销毁”一个对象所要做的就是删除对它的所有引用。变量(局部和全局)是引用。其他对象的属性以及容器中的条目(如列表、元组、字典、集合等)也是如此。

当对一个对象的所有引用都消失的那一刻，该对象的引用计数下降到 0 并且它被删除，然后。

只需要垃圾收集来打破循环引用，对象只相互引用，不再引用循环。因为这样的循环在没有帮助的情况下永远不会达到 0 的引用计数，垃圾收集器会定期检查此类循环并中断其中一个引用以帮助从内存中清除这些对象。

因此，您可以通过删除对它的所有引用来导致从内存中删除(释放)任何对象。如何实现取决于对象的引用方式。您可以要求解释器告诉您哪些对象正在使用 gc.get_referrers() function 引用给定的对象。，但考虑到不会给你变量名。它为您提供对象，例如字典对象，即 __dict__将对象引用为全局等的模块的属性。对于完全在您控制之下的代码，最多使用 gc.get_referrers()作为一种工具，在您编写代码以删除对象时，它会提醒自己引用对象的位置。

如果必须在 Python 应用程序的生命周期内拥有唯一标识符，则必须实现自己的工具。如果您的对象是可散列的并且支持弱引用，那么您可以使用 WeakKeyDictionary instance将任意对象与 UUIDs 相关联:

from weakref import WeakKeyDictionary
from collections import defaultdict
from uuid import uuid4

class UniqueIdMap(WeakKeyDictionary):
    def __init__(self, dict=None):
        super().__init__(self)
        # replace data with a defaultdict to generate uuids
        self.data = defaultdict(uuid4)
        if dict is not None:
            self.update(dict)

uniqueidmap = UniqueIdMap()

def uniqueid(obj):
    """Produce a unique integer id for the object.

    Object must me *hashable*. Id is a UUID and should be unique
    across Python invocations.

    """
    return uniqueidmap[obj].int

这仍然会产生整数，但由于它们是 UUID，因此不能完全保证它们是唯一的，但是您在有生之年遇到相同 ID 的可能性比被陨石击中的可能性要小。见 How unique is UUID?

即使对于生命周期不重叠的对象，这也会为您提供唯一的 id:

>>> class Foo:
...     pass
...
>>> id(Foo())
4547149104
>>> id(Foo())  # memory address reused
4547149104
>>> uniqueid(Foo())
151797163173960170410969562162860139237
>>> uniqueid(Foo())  # but you still get a unique UUID
188632072566395632221804340107821543671

关于python - Python 的 id() 有多独特？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52096582/

python - Python 的 id() 有多独特？

上一篇：c - 是什么导致堆栈溢出？

下一篇：c# - 引用类型的堆栈条目包含什么？