python - SELECT COUNT(distinct CASE WHEN x > y THEN seller_id ELSE NULL END) FROM 表 GROUP BY 列 PANDAS 等效项

我有一个查询需要几个小时才能运行，因为我在同一数据集上运行多个计算，并且必须针对不同的计算重复查询同一数据集。

我没有能力创建临时表。

我的数据集看起来像:

ITEM NUMBER | BRAND | X | Seller ID | Y

我需要计算每个品牌内 x > y 评估为 true 的唯一卖家。

最佳答案

为什么不只编写一个查询？

select brand, count(distinct sellerID)
from t
where x > y
group by brand;

关于python - SELECT COUNT(distinct CASE WHEN x > y THEN seller_id ELSE NULL END) FROM 表 GROUP BY 列 PANDAS 等效项，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40644640/

上一篇：javascript - Django request.DATA 获取损坏的值

下一篇：python - 在虚拟环境中运行 Spyder 最简单的方法是什么？

相关文章：

python - Pandas:通过正则表达式在单列中提取不同的值

python - pyparsing - 如何使用比较运算符解析字符串？

python:返回列表方法以索引作为参数

sql - 多对多关系 - 在多个表中显示行

java - 我怎样才能让这个程序也打印列表中的第一个条目？

python - pandas.to_datetime 时间字符串格式不一致

python - 打开目录中的每个文本文件，然后替换每个文本文件中的特定行

python - 根据所选值总结和绘制 ndarrays 列表

mysql - 如何在特定条件下自连接表

python - Pandas 数据框范围索引