sql - postgres替换文本中的计算值

我有一个表列numbers，其中包含如下字符串:

1, 2, 2A, 14, 14A, 20

按所需的升序排列。

如何制定 ORDER BY 子句来实现此顺序？

默认情况下，postgres 必须采用字母顺序:

1, 2, 14, 20, 2A, 14A

可以仅使用 Postgres 附带的字符串操作功能来完成此操作吗？ (replace()、regex_replace() 等？)

我的第一个想法是:

剪掉这封信(如果有)
数字 * 100
添加字母的 ASCII(如果存在)

这将产生所需的结果，因为映射值将是:

100, 200, 265, 1400, 1465, 2000

我还可以为此操纵值建立索引以加快排序速度。

其他限制:

我无法使用十六进制数字转换，因为例如:14Z 也是有效的。

理想情况下，结果是单个表达式。我需要使用此转换进行过滤和排序，例如:

SELECT * FROM table WHERE transform(numbers) < 15 ORDER BY transform(numbers)
RESULT:

 1, 2, 2A, 14, 14A

我尝试利用从 @klin 的答案中学到的知识来实现我的想法:

剪切字母并将数字乘以 100:

substring('12A' from '(\d+).*')::int*100

剪切数字并得到字母的 ASCII:

ascii(substring('12A' from '\d+([A-Z])'))

将两者相加。

这适用于 12A，但不适用于 12，因为第二个表达式返回 NULL 而不是 0(数字零)。有什么想法吗？

最佳答案

基于这些假设:

数字由数字和可选的一个待处理字母组成，仅包含其他内容。
始终至少有一位前导数字。
所有字母均为大写[A-Z]或小写[a-z]，但不能混合使用。

我会通过表列上的 CHECK 约束强制执行绝对可靠的操作。

创建一个微小的IMMUTABLE SQL 函数:

CREATE OR REPLACE FUNCTION f_nr2sort(text)
  RETURNS int AS
$func$
   SELECT CASE WHEN right($1, 1) > '9' COLLATE "C"  -- no collation
               THEN left($1, -1)::int * 100 + ascii(right($1, 1))
               ELSE $1::int * 100 END  -- only digits
$func$ LANGUAGE SQL IMMUTABLE;

根据上述假设优化性能。我用更便宜的 left() and right() 替换了所有正则表达式.

我disabled collation rules with COLLATE "C"用于 CASE 表达式(它也更便宜)以确保 ASCII 字母的默认字节顺序。 [a-zA-Z] 中的字母排序高于“9”，如果最后一个字母也是这种情况，我们将相应地继续。
这样我们就可以避免添加 NULL 值，并且不需要使用 COALESCE 进行修复。 .

那么您的查询可以是:

SELECT *
FROM   tbl
WHERE  f_nr2sort(numbers) < f_nr2sort('15C')
ORDER  BY f_nr2sort(numbers);

由于该函数是IMMUTABLE，您甚至可以创建一个简单的 functional index支持此类查询:

CREATE INDEX tbl_foo_id ON tbl (f_nr2sort(numbers));

关于sql - postgres替换文本中的计算值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34044410/

sql - postgres替换文本中的计算值

上一篇：sql - 从数组创建字符串

下一篇：sql - Postgres WHERE col1, col2 IN 中的多列