python - Python 的 id() 有多独特?

标签 python python-3.x unit-testing memory

tl;博士
Python 是否重用 ID?生命周期不重叠的两个对象获得相同 ID 的可能性有多大?

背景:
我一直在研究一个完全用 Python 3 编写的复杂项目。我在测试中看到了一些问题,并花了很多时间寻找根本原因。经过一些分析,我怀疑当测试作为一个整体运行时(它是由专门的调度程序编排并运行的),它正在重用一些模拟方法,而不是用它们的原始方法实例化新对象。为了检查解释器是否正在重用,我使用了 id() .

问题:id()通常工作并显示对象标识符,并让我知道我的调用何时创建新实例而不是重用。但是如果两个对象相同,当 ids 时会发生什么? The documentation说:

Return the “identity” of an object. This is an integer which is guaranteed to be unique and constant for this object during its lifetime. Two objects with non-overlapping lifetimes may have the same id() value.



问题:
  • 解释器什么时候可以重用id()值(value)观?只是在随机选择相同的内存区域时吗?如果它只是随机的,那似乎极不可能,但仍然不能保证。
  • 有没有其他方法可以检查我实际引用的对象?我遇到了一种情况,我有对象,它有一个模拟方法。该对象不再使用,垃圾收集器将其销毁。之后我创建了一个相同类的新对象,它得到了一个新的 id()但是该方法获得了与被模拟时相同的 ID,它实际上只是一个模拟。
  • 有没有办法强制 Python 销毁给定的对象实例?从我所做的阅读来看,似乎没有,并且当它没有看到对对象的引用时,这取决于垃圾收集器,但我认为无论如何都值得一问。
  • 最佳答案

    是的,CPython 重用 id()值。 不要指望这些在 Python 程序中是唯一的 .

    这是 clearly documented :

    Return the “identity” of an object. This is an integer which is guaranteed to be unique and constant for this object during its lifetime. Two objects with non-overlapping lifetimes may have the same id() value.



    大胆强调我的。只要对象还活着,id 就是唯一的。没有引用的对象从内存中删除,允许 id()值要重新用于另一个对象,因此不重叠的生命周期措辞。

    请注意,这仅适用于 Python.org 提供的标准实现 CPython。还有其他 Python 实现,例如 IronPython、Jython 和 PyPy,它们可以自行选择如何实现 id() ,因为他们每个人都可以对如何处理内存和对象生命周期做出不同的选择。

    要解决您的具体问题:
  • 在 CPython 中,id()是内存地址。新对象将被插入下一个可用内存空间,因此如果特定内存地址有足够的空间来容纳下一个新对象,则内存地址将被重用。创建相同大小的新对象时,您可以在解释器中看到这一点:
    >>> id(1234)
    4546982768
    >>> id(4321)
    4546982768
    
    1234字面量创建一个新的整数对象,为其 id()产生一个数值。由于没有进一步引用 int值,它再次从内存中删除。但是使用不同的整数文字再次执行相同的表达式,您可能会看到相同的 id()值(垃圾收集运行打破循环引用可以释放更多内存,因此您也可以 而不是 再次查看相同的 id()

    所以它不是随机的,但在 CPython 中它是内存分配算法的函数。
  • 如果您需要检查特定对象,请保留对它的引用。那可以是 weakref weak reference如果您只需要确保对象仍然“活着”。

    例如,先记录一个对象引用,然后再检查它:
    import weakref
    
    # record
    object_ref = weakref.ref(some_object)
    
    # check if it's the same object still
    some_other_reference is object_ref()   # only true if they are the same object
    

    弱引用不会使对象保持事件状态,但如果它处于事件状态,则 object_ref()将返回它(否则将返回 None)。

    您可以使用这种机制来生成真正唯一的标识符,请参见下文。
  • “销毁”一个对象所要做的就是删除对它的所有引用。变量(局部和全局)是引用。其他对象的属性以及容器中的条目(如列表、元组、字典、集合等)也是如此。

    当对一个对象的所有引用都消失的那一刻,该对象的引用计数下降到 0 并且它被删除,然后。

    只需要垃圾收集来打破循环引用,对象只相互引用,不再引用循环。因为这样的循环在没有帮助的情况下永远不会达到 0 的引用计数,垃圾收集器会定期检查此类循环并中断其中一个引用以帮助从内存中清除这些对象。

    因此,您可以通过删除对它的所有引用来导致从内存中删除(释放)任何对象。如何实现取决于对象的引用方式。您可以要求解释器告诉您哪些对象正在使用 gc.get_referrers() function 引用给定的对象。 ,但考虑到不会给你变量名。它为您提供对象,例如字典对象,即 __dict__将对象引用为全局等的模块的属性。对于完全在您控制之下的代码,最多使用 gc.get_referrers()作为一种工具,在您编写代码以删除对象时,它会提醒自己引用对象的位置。

  • 如果必须在 Python 应用程序的生命周期内拥有唯一标识符,则必须实现自己的工具。如果您的对象是可散列的并且支持弱引用,那么您可以使用 WeakKeyDictionary instance将任意对象与 UUIDs 相关联:
    from weakref import WeakKeyDictionary
    from collections import defaultdict
    from uuid import uuid4
    
    class UniqueIdMap(WeakKeyDictionary):
        def __init__(self, dict=None):
            super().__init__(self)
            # replace data with a defaultdict to generate uuids
            self.data = defaultdict(uuid4)
            if dict is not None:
                self.update(dict)
    
    uniqueidmap = UniqueIdMap()
    
    def uniqueid(obj):
        """Produce a unique integer id for the object.
    
        Object must me *hashable*. Id is a UUID and should be unique
        across Python invocations.
    
        """
        return uniqueidmap[obj].int
    

    这仍然会产生整数,但由于它们是 UUID,因此不能完全保证它们是唯一的,但是您在有生之年遇到相同 ID 的可能性比被陨石击中的可能性要小。见 How unique is UUID?

    即使对于生命周期不重叠的对象,这也会为您提供唯一的 id:
    >>> class Foo:
    ...     pass
    ...
    >>> id(Foo())
    4547149104
    >>> id(Foo())  # memory address reused
    4547149104
    >>> uniqueid(Foo())
    151797163173960170410969562162860139237
    >>> uniqueid(Foo())  # but you still get a unique UUID
    188632072566395632221804340107821543671
    

    关于python - Python 的 id() 有多独特?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52096582/

    相关文章:

    python - 更改 RStudio 的默认 python 版本

    Python 3 FancyURLopener cookie 处理

    python - 为什么要用get_context_data(self,**kwargs)和super()

    java - 如何使用单例实例模拟类

    python - 自定义路径参数解析drf-yasg和Django

    python - 改进流 Python 分类器并组合功能

    python - 向量化列表理解中的嵌套 for 循环

    c# - 我可以在单元测试中写入控制台吗?如果是,为什么控制台窗口不打开?

    javascript - 特定组件中的 'expecting to render' 测试代码覆盖率较低

    python - Python 中的子进程 : File Name too long