python - 如何在 Apache Superset 中定义自定义指标？

我一直在工作中实现超集，到目前为止我很喜欢它。但是，我有这样一个表:

name,age,gender
John,42,M
Sally,38,F
Patricia,27,F
Steven,29,M
Amanda,51,F

我想针对每个名字定义一个新的指标，计算年轻的人数。我的数据在 MySQL 数据库中，我想对于一个人来说，我可以这样编写查询:

SELECT COUNT(DISTINCT name) from users where users.age <= 42;

例如，约翰的争吵。那么，如何对整个表连续执行此操作？

最佳答案

您的查询可能类似于

select *, 
  (select count(distinct all_users.name) from users all_users where all_users.age <= users.age)
FROM users

就影子而言 - 这在大型数据集上运行会变得相当昂贵。

如果是这种情况，您可能想尝试对年龄建立索引，或者完全取消该计数 - 代价是插入会变慢。

关于python - 如何在 Apache Superset 中定义自定义指标？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47920193/

相关文章：

mysql - 捕获复选框列表输入并分配到文本区域