python - 递归与迭代图遍历中的内存利用率

标签 python memory recursion stack iteration

我查看了一些常用工具,例如 Heapy测量每种遍历技术使用了多少内存,但我不知道它们是否给了我正确的结果。这是一些给出上下文的代码。

代码只是测量图中唯一节点的数量。提供了两种遍历技术,即。 count_bfscount_dfs

import sys
from guppy import hpy
class Graph:
    def __init__(self, key):
        self.key = key       #unique id for a vertex 
        self.connections = []
        self.visited = False 

def count_bfs(start):
    parents = [start]
    children = []
    count = 0
    while parents:
        for ind in parents:
            if not ind.visited:
                count += 1
                ind.visited = True
                for child in ind.connections:

        parents = children
        children = []
    return count

def count_dfs(start):
    if not start.visited:
          start.visited = True
          return 0

    n = 1
    for connection in start.connections:
        n += count_dfs(connection)
    return n

def construct(file, s=1): 
    """Constructs a Graph using the adjacency matrix given in the file

    :param file: path to the file with the matrix
    :param s: starting node key. Defaults to 1

    :return start vertex of the graph
    d = {}
    f = open(file,'rU')
    size = int(f.readline())
    for x in xrange(1,size+1):
        d[x] = Graph(x)
    start = d[s]
    for i in xrange(0,size):
           l = map(lambda x: int(x), f.readline().split())
           node = l[0]
           for child in l[1:]:
    return start

if __name__ == "__main__":
    s = construct(sys.argv[1])
    #h = hpy()
    #print h.heap()
    s = construct(sys.argv[1])
    #h = hpy()
    #print h.heap()

我想知道两种遍历技术的总内存利用率不同的因素是什么。 count_dfscount_bfs?人们可能会直觉 dfs 可能会很昂贵,因为每次函数调用都会创建一个新堆栈。如何测量每种遍历技术中的总内存分配?
(注释的)hpy 语句是否给出了所需的度量?


1 2 3
2 1 3
3 4 


这是一个 Python 问题,使用多少 堆栈空间 可能比总内存量更重要。 Cpython 的下限为 1000 帧,因为它与 c 调用堆栈共享其调用堆栈,而 c 调用堆栈又在大多数地方限制为 1 兆字节的数量级。因此,当递归深度不受限制时,您几乎应该*总是更喜欢迭代解决方案而不是递归解决方案。

* python 的其他实现可能没有这个限制。 cpython 和 pypy 的无堆栈变体具有这个确切的属性

关于python - 递归与迭代图遍历中的内存利用率,我们在Stack Overflow上找到一个类似的问题:


