python - 将 mark_line 分层到交互式线图上会显着降低 Altair 的性能

标签 python pandas altair

这是我创建的一个虚拟数据集来说明我的问题:

import pandas as pd
import numpy as np
import altair as alt

# Use more rows than recommended so it's a bit easier to 
# see the slowdown with human eyes.
alt.data_transformers.disable_max_rows()

# Create N rows with 2 columns. 
N=10000
test_df = pd.DataFrame({'t' : range(0, N, 1), # Integers counting up from 0 to N - 1.
                        'A' : np.random.randint(0, 100, size=N)}) # random integer between 0 and 100.

我用它来创建线图:

test_line = alt.Chart(test_df).mark_line().encode(x='t:Q', y='A:Q').interactive(bind_y=False)

一切都很好,即使有超过 5000 行,当我平移和缩放时,渲染的交互式折线图也很流畅。这显然是与机器相关的(即,在不同的机器上运行此代码将导致平移和缩放的不同性能)。

接下来,我尝试画一条垂直线来标记一个兴趣点。该代码的灵感来自 this .

v_rule = alt.Chart(test_df).mark_rule(color='red').encode(x='a:Q').transform_calculate(a=str(5000))
alt.layer(test_line, v_rule).display()

这样,生成的交互式折线图在屏幕上显示垂直线时平移和缩放速度会很慢:

enter image description here

如果我移动绘图,垂直线不在屏幕上,平移和缩放会再次变得敏捷

enter image description here

当我尝试将多个图连接在一起时,这个问题变得更加严重,每个图都是交互式的并且有一条垂直线。

有没有更好的方法来绘制这条垂直线?有什么方法可以提前预渲染所有内容并保存到本地文件吗?我很惊讶(也很困惑)一条线怎么会对渲染速度造成如此大的损害。

最佳答案

导致性能损失的不是垂直线,而是 tranform_calculate。原因是正在计算数据框中每一行的值,您可以看到,如果单击三点操作按钮“在 Vega 编辑器中打开图表”,请单击数据查看器向右并选择 data_1。我相信这也是为什么图中的线看起来有点粗的原因,可能有 10000 条线相互重叠。

要仅创建一行,您可以这样做:

v_rule = alt.Chart(pd.DataFrame({'a': [5000]})).mark_rule(color='red').encode(x='a')
alt.layer(test_line, v_rule)

关于python - 将 mark_line 分层到交互式线图上会显着降低 Altair 的性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67325434/

相关文章:

python - 如果 Pandas 中月份差异超过 1,如何按排名分组并开始新的排名?

python - 将 4 个一对一映射列表转换为字典列表(python)

python - Pandas:计算特定值的差距

jupyter-notebook - Altair 保护程序 ValueError : Unsupported format: 'png'

python - 使用某些图像标记图像中断的 Altair 可视化

python-3.x - 排序 Altair 列顺序

python - Selenium 无法获取页面的所有元素

python - 具有对角权重矩阵的自定义层

在终端(Trutle 模块)中执行 Python 脚本错误

html - 停止 jupyter notebook 在 pandas html 表输出中包装单元格内容