sql - 转置 PostgreSQL 表或聚合函数什么都不做

标签 sql postgresql pivot crosstab

我有一个 PostgreSQL 表,我必须转置它。
原始数据如下所示:

user_id role_id assigned
P0001   SA      t
P0001   Guest   t
P0002   SA      f
P0002   Guest   t

转置之后应该是这样的:

user_id SA  Guest
P0001   t   t
P0002   f   t

下面是我用来生成转置表的:

SELECT user_id, 
CAST(CAST(CASE role_id WHEN 'SA' THEN 1 ELSE 0 END) AS int) AS boolean) AS "SA",
CAST(CAST((CASE role_id WHEN 'Guest' THEN 1 ELSE 0 END) AS int) AS boolean) AS "Guest" 
FROM user_to_roles GROUP BY user_id

但它看起来很丑。有没有一种方法可以编写自定义聚合函数,除了返回原始值外什么都不做。所以上面的语句可以重写为:

SELECT user_id, 
Do_Nothing(CASE role_id WHEN 'SA' THEN true ELSE false END) AS "SA",
Do_Nothing(CASE role_id WHEN 'Guest' THEN true ELSE false END) AS "Guest" 
FROM user_to_roles GROUP BY user_id

编辑:

实际上,我需要一个动态生成的列,并在 this article 的帮助下使用游标实现了它.我查看了文档并编写了一个自定义聚合,如下所示:

CREATE AGGREGATE do_nothing(anyelement) (
  SFUNC=donothing,
  STYPE=anyelement,
  INITCOND=''
);

CREATE OR REPLACE FUNCTION donothing(anyelement var)
  RETURNS anyelement AS
$BODY$
    RETURN var;
$BODY$
  LANGUAGE sql IMMUTABLE
  COST 100;

因为想做成通用的,所以这里使用了anyelment
但是上面的代码根本不起作用。

最佳答案

交叉表()

SELECT * FROM crosstab(
       'SELECT user_id, role_id, assigned
        FROM   tbl
        ORDER  BY 1,2'

      ,$$VALUES ('SA'::text), ('Guest')$$)
AS ct (user_id text, "SA" bool, "Guest" bool);

这与当前版本的 Postgres 一样快速。 (比下面的替代方案更快。)

但这两种解决方案都不是完全“动态的”,不完全可能:

对于完全动态的解决方案,您必须输出数组或其他一些容器类型以返回可变数量的列。最近的相关问题及答案:

带有聚合 CASE 表达式的穷人交叉表

仅针对几列:简单的 CASE 语句与聚合函数相结合。

min()max() 适用于大多数基本类型 ... per documentation :

any array, numeric, string, or date/time type

但不适用于 boolean。使用 bool_or()@Richard suggested .
FALSE OR NULL 会产生 NULL,但所有提到的聚合函数(包括。bool_or())忽略 NULL,所以它也适用于 NULL

SELECT user_id
      ,bool_or(CASE WHEN role_id = 'SA'    THEN assigned ELSE NULL END) AS "SA"
      ,bool_or(CASE WHEN role_id = 'Guest' THEN assigned ELSE NULL END) AS "Guest"
FROM   tbl
GROUP  BY 1
ORDER  BY 1;

您必须适应预期的数据类型。

任何类型的自定义聚合

没有以您需要的方式适用于任何 数据类型的标准聚合函数。你可以创建一个:

CREATE OR REPLACE FUNCTION f_echo1(anyelement,anyelement)
  RETURNS anyelement AS 'SELECT $1' LANGUAGE sql IMMUTABLE STRICT;

CREATE AGGREGATE first_notnull(anyelement) (
   SFUNC = f_echo1
 , STYPE = anyelement
);

这是您在编辑中概述的内容的简单有效版本:
NULL(无 INITCOND)开始,使用 STRICT 转换函数,它采用第一个非空值,转换函数只保留该值一。所以我们得到聚合函数遇到的第一个非空值。

这适用于任何输入类型:

SELECT user_id
      ,first_notnull(CASE WHEN role_id = 'SA'    THEN assigned ELSE NULL END) AS "SA"
      ,first_notnull(CASE WHEN role_id = 'Guest' THEN assigned ELSE NULL END) AS "Guest"
FROM   tbl
GROUP  BY 1
ORDER  BY 1;

bool_or()复制为max()

sql 或 plpgsql 中的自定义聚合函数比用 C 编写并经过优化的内置函数慢得多。你可以自己用 C 写一个。不会那么难。或者你可以复制 pg_procmax 名称下的 bool_or 的定义,并在 pg_aggregate 中的另一个副本中引用它> 使 max() 也适用于 boolean。不过,不建议临时用户乱用目录表。如果你破坏了某些东西,你的系统可能会崩溃......

关于sql - 转置 PostgreSQL 表或聚合函数什么都不做,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25420084/

相关文章:

SQL Server 数据透视查询 - 问题

php - 不正确的日期时间值 : 'item.purchase_date'

mysql - 在数据库中存储一对多列的最佳方法

PostgreSQL pgp_sym_encrypt() 在版本 9.1 中被破坏

postgresql 9.6 使用我所有的 ram

mysql - 我需要一种在 MySQL 中使用列值作为列名的方法

sql-server - 将 MS Access 中的数据透视表转换为 SQL Server 中的数据透视表

MySQL嵌套集在选定节点上方添加节点

mysql - SQL错误: 1364 Field 'XXXX' doesn't have a default value1

sql - 如何计算重复行?