我一直在工作中实现超集,到目前为止我很喜欢它。但是,我有这样一个表:
name,age,gender
John,42,M
Sally,38,F
Patricia,27,F
Steven,29,M
Amanda,51,F
我想针对每个名字定义一个新的指标,计算年轻的人数。我的数据在 MySQL 数据库中,我想对于一个人来说,我可以这样编写查询:
SELECT COUNT(DISTINCT name) from users where users.age <= 42;
例如,约翰的争吵。那么,如何对整个表连续执行此操作?
最佳答案
您的查询可能类似于
select *,
(select count(distinct all_users.name) from users all_users where all_users.age <= users.age)
FROM users
就影子而言 - 这在大型数据集上运行会变得相当昂贵。
如果是这种情况,您可能想尝试对年龄建立索引,或者完全取消该计数 - 代价是插入会变慢。
关于python - 如何在 Apache Superset 中定义自定义指标?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47920193/