sql - 在 SQL Server 中将字符串拆分为给定行分隔符和列分隔符的表

标签 sql sql-server string split

如何在 SQL Server 中将包含矩阵的字符串拆分为表?字符串具有列分隔符和行分隔符。

假设我有一个字符串:

declare @str varchar(max)='A,B,C;D,E,F;X,Y,Z';

预期结果(在三个单独的列中):

+---+---+---+
| A | B | C |
+---+---+---+
| D | E | F |
+---+---+---+
| X | Y | Z |
+---+---+---+

我正在寻找未定义列数和行数的通用解决方案。所以字符串:

declare @str varchar(max)='A,B;D,E';

将被分成两列的表格:

+---+---+
| A | B |
+---+---+
| D | E |
+---+---+

我的努力。我的第一个想法是使用动态 SQL 将字符串转换为: 插入 dbo.temp 值 (...) 这种方法虽然速度非常快,但有一个小缺点,因为它需要首先创建一个具有正确列数的表。我在the answer to my own question below中介绍了这个方法只是为了保持问题简短。

另一个想法是将字符串写入服务器上的 CSV 文件,然后从中批量插入。虽然我不知道该怎么做,也不知道第一个和第二个想法的表现如何。

我之所以问这个问题是因为我想将数据从Excel导入到SQL Server。由于我尝试过不同的 ADO 方法,这种发送矩阵字符串的方法取得了压倒性的胜利,尤其是当字符串长度增加时。我在这里问了一个双胞胎弟弟的问题:Turn Excel range into VBA string 您可以在其中找到如何从 Excel 范围准备此类字符串的建议。

赏金 我决定奖励马特。我高度重视肖恩·兰格的回答。谢谢肖恩。我喜欢马特的回答,因为它简单而简短。除了马特和肖恩之外的不同方法可以并行使用,所以暂时我不接受任何答案(更新:最后,几个月后,我接受了马特的答案)。我要感谢艾哈迈德·赛义德 (Ahmed Saeed) 的 VALUES 想法,因为它是我开始时的答案的一个很好的演变。当然,它比不上马特或肖恩的。我对每个答案都投了赞成票。我将感谢您对使用这些方法的任何反馈。谢谢你的探索。

最佳答案

好吧,这个谜题引起了我的兴趣,所以我决定看看是否可以在没有任何循环的情况下做到这一点。要使其发挥作用,有几个先决条件。首先,我们假设您有某种统计表。如果你没有,这是我的代码。我将其保留在我使用的每个系统上。

create View [dbo].[cteTally] as

WITH
    E1(N) AS (select 1 from (values (1),(1),(1),(1),(1),(1),(1),(1),(1),(1))dt(n)),
    E2(N) AS (SELECT 1 FROM E1 a, E1 b), --10E+2 or 100 rows
    E4(N) AS (SELECT 1 FROM E2 a, E2 b), --10E+4 or 10,000 rows max
    cteTally(N) AS 
    (
        SELECT  ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) FROM E4
    )
select N from cteTally

这个难题的第二部分是需要一个基于集合的字符串分割器。我最喜欢的是超快的 Jeff Moden 分路器。需要注意的是,它仅适用于 8,000 以下的 varchar 值。这对于我使用的大多数分隔字符串来说已经足够了。您可以在这里找到 Jeff Moden 的分离器 (DelimitedSplit8K)。

http://www.sqlservercentral.com/articles/Tally+Table/72993/

最后但并非最不重要的是,我在这里使用的技术是动态交叉表。这是我从杰夫·莫登那里学到的另一件事。他在这里发表了一篇关于该主题的精彩文章。

http://www.sqlservercentral.com/articles/Crosstab/65048/

将所有这些放在一起,您可以想出这样的东西,它会非常快并且可以很好地扩展。

declare @str varchar(max)='A,B,C;D,E,F;X,Y,Z';

declare @StaticPortion nvarchar(2000) = 
'declare @str varchar(max)=''' + @str + ''';with OrderedResults as
    (
        select s.ItemNumber
            , s.Item as DelimitedValues
            , x.ItemNumber as RowNum
            , x.Item
        from dbo.DelimitedSplit8K(@str, '';'') s
        cross apply dbo.DelimitedSplit8K(s.Item, '','') x
    )
    select '

declare @DynamicPortion nvarchar(max) = '';
declare @FinalStaticPortion nvarchar(2000) = ' from OrderedResults group by ItemNumber';

select @DynamicPortion = @DynamicPortion + 
    ', MAX(Case when RowNum = ' + CAST(N as varchar(6)) + ' then Item end) as Column' + CAST(N as varchar(6)) + CHAR(10)
from cteTally t
where t.N <= (select MAX(len(Item) - LEN(replace(Item, ',', ''))) + 1
                from dbo.DelimitedSplit8K(@str, ';')
            )

declare @SqlToExecute nvarchar(max) = @StaticPortion + stuff(@DynamicPortion, 1, 1, '') + @FinalStaticPortion
exec sp_executesql @SqlToExecute

--编辑--

这里是 DelimitedSplit8K 函数,以防链接无效。

ALTER FUNCTION [dbo].[DelimitedSplit8K]
--===== Define I/O parameters
        (@pString VARCHAR(8000), @pDelimiter CHAR(1))
RETURNS TABLE WITH SCHEMABINDING AS
 RETURN
--===== "Inline" CTE Driven "Tally Table" produces values from 0 up to 10,000...
     -- enough to cover VARCHAR(8000)
  WITH E1(N) AS (
                 SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL 
                 SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL 
                 SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1
                ),                          --10E+1 or 10 rows
       E2(N) AS (SELECT 1 FROM E1 a, E1 b), --10E+2 or 100 rows
       E4(N) AS (SELECT 1 FROM E2 a, E2 b), --10E+4 or 10,000 rows max
 cteTally(N) AS (--==== This provides the "zero base" and limits the number of rows right up front
                     -- for both a performance gain and prevention of accidental "overruns"
                 SELECT 0 UNION ALL
                 SELECT TOP (DATALENGTH(ISNULL(@pString,1))) ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) FROM E4
                ),
cteStart(N1) AS (--==== This returns N+1 (starting position of each "element" just once for each delimiter)
                 SELECT t.N+1
                   FROM cteTally t
                  WHERE (SUBSTRING(@pString,t.N,1) = @pDelimiter OR t.N = 0) 
                )
--===== Do the actual split. The ISNULL/NULLIF combo handles the length for the final element when no delimiter is found.
 SELECT ItemNumber = ROW_NUMBER() OVER(ORDER BY s.N1),
        Item       = SUBSTRING(@pString,s.N1,ISNULL(NULLIF(CHARINDEX(@pDelimiter,@pString,s.N1),0)-s.N1,8000))
   FROM cteStart s
;

关于sql - 在 SQL Server 中将字符串拆分为给定行分隔符和列分隔符的表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39752188/

相关文章:

MySQL select查询返回250K+结果,delete查询只删除一个?

java - 检查空字符串 null 吗?

SQL:为什么在此 where 子句中过滤掉 NULL 值?

mysql - 如何在 MySQL 中存储特定用户的一组信息的多个值?

sql-server - 维护父子表历史数据变化

c - 错误: sql. h:路径名中的文件或目录不存在

sql-server - null 未按预期工作的情况

javascript - 修改函数以仅反转第三个字

ruby - 如何检查一个数组中的元素是否存在于另一个数组中

mysql - 使用内部联接更新 = 错误代码 : 1111. 组函数的使用无效