我试图了解Python的类是如何实现的以及分配给它们会消耗多少内存。所以我创建了一个大的 numpy 数组,然后将其分配给一个类,然后将该类分配给另一个类(如下)。
import numpy as np
class Foo(object):
def __init__(self, x=0):
self.x = x
class Bar(object):
def __init__(self, x=None):
self.x = x
x = np.random.normal(0, 1, (50000, 10))
a = Foo(x)
b = Bar(a)
使用 sys.getsizeof 似乎无助于获取 numpy 数组的内存大小。 Numpy 数组使用 nbytes,但引用 numpy 数组的类没有 nbytes 作为方法。
如果我对 x
进行更改,则 a.x
和 b.x.x
会自动更新以反射(reflect)它。 python documentation注意对象别名就像指针。我认为 a.x
和 b.x.x
可以被认为更像是指向原始 x
的指针,对吗?与指针类似,a
和 b
的内存占用不应与 x
的底层大小相关。这是正确的吗?
最佳答案
将这些对象分配给numpy
将为您提供仅代表指针大小的对象引用,因此它们与对象的实际大小无关。
至于sys.getsizeof()
,这将为您提供 numpy 对象描述的大小,但不是所有子对象的大小,因此对于这种情况来说它肯定是不准确的。我的猜测是,这种情况下的实际大小将是 sys.getsizeof(x) + x.nbytes
。
至于a
存储x
,是的,默认情况下Python只复制引用,而不复制实际值。
为了说明这种行为:
x = []
y = x
x.append('SPAM')
print y
# Returns: ['SPAM']
一个很好的分析内存使用情况的模块是 pympler
关于Python 类内存使用情况,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28117929/