python - 如何使用递归记录父子层次结构中的所有路由?

标签 python pandas dataframe recursion hierarchy


原始数据框 (df)。最高列意味着父列中的值不是任何子列:

<表类="s-表"> <头> 父元素 child 最高 <正文> a b 1 b c 0 b d 0 d e 0


<表类="s-表"> <头> 级别 3 级别 2 级别 1 级别 0 <正文> a b c a b d e


def search(parent):
    for i in range(df.shape[0]):
        if(df.iloc[i,0] == parent):

for i in range(df.shape[0]):
    if(df.iloc[i,2] == 1):



您可以使用 networkx解决问题。请注意,如果您使用 networkx,则不需要 highest 列。查找所有路径的主要功能是all_simple_paths

# Python env: pip install networkx
# Anaconda env: conda install networkx
import networkx as nx

# Create network from your dataframe
#G = nx.from_pandas_edgelist(df, source='parent', target='child',
#                            create_using=nx.DiGraph)

# For older versions of networkx
G = nx.DiGraph()
for _, (source, target) in df[['parent', 'child']].iterrows():
    G.add_edge(source, target)

# Find roots of your graph (a root is a node with no input)
roots = [node for node, degree in G.in_degree() if degree == 0]

# Find leaves of your graph (a leaf is a node with no output)
leaves = [node for node, degree in G.out_degree() if degree == 0]

# Find all paths
paths = []
for root in roots:
  for leaf in leaves:
    for path in nx.all_simple_paths(G, root, leaf):

# Create a new dataframe
out = pd.DataFrame(paths).fillna('')
out.columns = reversed(out.add_prefix('level ').columns)


>>> out
  level 3 level 2 level 1 level 0
0       a       b       c        
1       a       b       d       e

关于python - 如何使用递归记录父子层次结构中的所有路由?,我们在Stack Overflow上找到一个类似的问题:


python - 在 Pandas 分析报告中显示 "Other Values"

python - 强制 PyGtk main 重绘

python - 捕获屏幕并找到引用图像

python - 如何随机选择一些 Pandas 数据框行?

python - 数据打印,但不写入数据框

python - 有没有比使用循环和 iloc 更快的方法在小 Pandas 数据帧上进行整行比较?

python - Pandas 列的条件值

r - 如何简洁地编写包含数据框中许多变量的公式?

python - "getNumPartitions"是一个昂贵的操作吗?

python - 属性错误: 'Index' object has no attribute 'replace'