我有一个表示线性代数表达式(作为表达式树)的类层次结构,类似这样的东西(实际上比这更复杂,但这应该足以让您有一个想法)。
- 表达式
- 运算符
- 次数
- 加上
- 符号
- 矩阵
- 标量
- 运算符
我以多种不同的方式操纵这些表达式,所以我必须大量复制这些表达式,因为我想探索操纵它们的不同方式(我真的看不到任何复制它们的方法)。毫不奇怪,copy.deepcopy()
很慢。
并非所有类属性都需要进行深度复制,并且这些表达式树将始终是树(如果不是,则从根本上是错误的),因此我可能可以通过简化内存来节省一些时间(或者根本不使用它) )。
我想通过实现自定义复制功能来加快复制速度。这可能意味着实现 __deepcopy__()
,编写一个全新的函数或使用类似 get_state
的东西和set_state
,我真的不在乎。目前,我不关心酸洗。
我使用的是 Python 3。
由于我有这样的类层次结构,其中在不同级别引入了新属性,因此我不希望在每个级别上从头开始。相反,最好重用父类(super class)的一些功能,类似于 __init__
中的方式。 ,通常调用__init__
父类(super class)的。然而,我不想打电话__init__
因为有时会执行一些复制时不必要的额外操作。
我如何以最快、最Pythonic的方式做到这一点?我无法找到有关如何在这种情况下实现此复制功能的任何合理指南。我研究了Python 2和3中deepcopy的实现。在Python 2中,使用了一堆不同的方法( get_state
/set_state
,使用 __dict__
,…),在Python 3中,我不是完全能够找到对应的函数。
最佳答案
我自己找到了一个可能的解决方案:
class Expression(object):
...
def __deepcopy__(self, memo):
cpy = object.__new__(type(self))
# manually copy all attributes of Expression here
return cpy
class Operator(Expression):
...
def __deepcopy__(self, memo):
cpy = Expression.__deepcopy__(self, memo)
# manually copy all attributes exclusive to Operator here
return cpy
新对象始终在__deepcopy__
中创建的Expression
。通过使用object.__new__(type(self))
,新对象具有 __deepcopy__
所在对象的类型最初被称为(例如 Operator
)。
不幸的是,这个解决方案并不比默认的深度复制快多少。我想知道这是否是因为所有这些对 __deepcopy__
的调用造成的一直到类层次结构的顶部。我会调查此事。
关于Python:类层次结构中的自定义深度复制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35798327/