这是我创建的一个虚拟数据集来说明我的问题:
import pandas as pd
import numpy as np
import altair as alt
# Use more rows than recommended so it's a bit easier to
# see the slowdown with human eyes.
alt.data_transformers.disable_max_rows()
# Create N rows with 2 columns.
N=10000
test_df = pd.DataFrame({'t' : range(0, N, 1), # Integers counting up from 0 to N - 1.
'A' : np.random.randint(0, 100, size=N)}) # random integer between 0 and 100.
我用它来创建线图:
test_line = alt.Chart(test_df).mark_line().encode(x='t:Q', y='A:Q').interactive(bind_y=False)
一切都很好,即使有超过 5000 行,当我平移和缩放时,渲染的交互式折线图也很流畅。这显然是与机器相关的(即,在不同的机器上运行此代码将导致平移和缩放的不同性能)。
接下来,我尝试画一条垂直线来标记一个兴趣点。该代码的灵感来自 this .
v_rule = alt.Chart(test_df).mark_rule(color='red').encode(x='a:Q').transform_calculate(a=str(5000))
alt.layer(test_line, v_rule).display()
这样,生成的交互式折线图在屏幕上显示垂直线时平移和缩放速度会很慢:
如果我移动绘图,垂直线不在屏幕上,平移和缩放会再次变得敏捷。
当我尝试将多个图连接在一起时,这个问题变得更加严重,每个图都是交互式的并且有一条垂直线。
有没有更好的方法来绘制这条垂直线?有什么方法可以提前预渲染所有内容并保存到本地文件吗?我很惊讶(也很困惑)一条线怎么会对渲染速度造成如此大的损害。
最佳答案
导致性能损失的不是垂直线,而是 tranform_calculate
。原因是正在计算数据框中每一行的值,您可以看到,如果单击三点操作按钮“在 Vega 编辑器中打开图表”,请单击数据查看器
向右并选择 data_1
。我相信这也是为什么图中的线看起来有点粗的原因,可能有 10000 条线相互重叠。
要仅创建一行,您可以这样做:
v_rule = alt.Chart(pd.DataFrame({'a': [5000]})).mark_rule(color='red').encode(x='a')
alt.layer(test_line, v_rule)
关于python - 将 mark_line 分层到交互式线图上会显着降低 Altair 的性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67325434/