我有一个查询需要几个小时才能运行,因为我在同一数据集上运行多个计算,并且必须针对不同的计算重复查询同一数据集。
我没有能力创建临时表。
我的数据集看起来像:
ITEM NUMBER | BRAND | X | Seller ID | Y
我需要计算每个品牌内 x > y 评估为 true 的唯一卖家。
最佳答案
为什么不只编写一个查询?
select brand, count(distinct sellerID)
from t
where x > y
group by brand;
关于python - SELECT COUNT(distinct CASE WHEN x > y THEN seller_id ELSE NULL END) FROM 表 GROUP BY 列 PANDAS 等效项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40644640/