Python 类内存使用情况

我试图了解Python的类是如何实现的以及分配给它们会消耗多少内存。所以我创建了一个大的 numpy 数组，然后将其分配给一个类，然后将该类分配给另一个类(如下)。

import numpy as np

class Foo(object):
    def __init__(self, x=0):
        self.x = x

class Bar(object):
    def __init__(self, x=None):
        self.x = x

x = np.random.normal(0, 1, (50000, 10))
a = Foo(x)
b = Bar(a)

使用 sys.getsizeof 似乎无助于获取 numpy 数组的内存大小。 Numpy 数组使用 nbytes，但引用 numpy 数组的类没有 nbytes 作为方法。

如果我对 x 进行更改，则 a.x 和 b.x.x 会自动更新以反射(reflect)它。 python documentation注意对象别名就像指针。我认为 a.x 和 b.x.x 可以被认为更像是指向原始 x 的指针，对吗？与指针类似，a 和 b 的内存占用不应与 x 的底层大小相关。这是正确的吗？

最佳答案

将这些对象分配给numpy将为您提供仅代表指针大小的对象引用，因此它们与对象的实际大小无关。

至于sys.getsizeof()，这将为您提供 numpy 对象描述的大小，但不是所有子对象的大小，因此对于这种情况来说它肯定是不准确的。我的猜测是，这种情况下的实际大小将是 sys.getsizeof(x) + x.nbytes。

至于a存储x，是的，默认情况下Python只复制引用，而不复制实际值。

为了说明这种行为:

x = []
y = x
x.append('SPAM')
print y
# Returns: ['SPAM']

一个很好的分析内存使用情况的模块是 pympler

关于Python 类内存使用情况，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28117929/

Python 类内存使用情况

上一篇：python - 为 Django 管理员使用替代身份验证后端

下一篇：python - 使用 boto + Python 上传 Amazon S3 失败