我正在尝试编写一个存储过程来检查字符串是否包含另一个表中的值。
我无法控制 TableA,并且存储在理论上的 Packages 列中的数据是一组分隔的单词。
为了演示,TableA 包含一列“Packages”。此列包含以脱字符分隔的包字符串,例如 A^B
表示该行有 2 个包。
TableB 是我控制的一个表,列出了可用的包。
我们可以看到,TableA 有一些行没有对应的包;例如D
。
表A
ID | Packages
============
1 | A
2 | A^B
3 | C
4 | A^B
5 | A^C
6 | D
7 | C^D
表B
ID | Package
============
91 | A
92 | B
93 | C
我正在尝试编写一个脚本,将表 A 中的包与表 B 中已知的包列表进行比较,并从表 A 中选择没有支持包的任何行。
一旦运行,我的目标是返回与此类似的结果,
TableAID | PackageNotSupported
================================
6 | D
7 | D
我无法真正展示到目前为止我已经尝试过的内容,因为我只是不知道从哪里开始。我在数据库中有一个函数,可以将分隔字符串拆分到表中。我可以将其用于 xx^xx^xx
数据,但我根本不知道如何连接/比较字符串。
我尝试了这篇文章中找到的解决方案,How to compare multiple values in one column against a delimited string in a stored procedure但无法得到我想要的结果。最终,SQL 不是我的强项,而且我对该帖子中提出的解决方案也没有最深入的理解。
最佳答案
选项 1 - 没有解析/分割功能
Declare @TableA table (ID int,Packages varchar(25))
Insert Into @TableA values
(1 ,'A'),
(2 ,'A^B'),
(3 ,'C'),
(4 ,'A^B'),
(5 ,'A^C'),
(6 ,'D'),
(7 ,'C^D')
Declare @TableB table (ID int,Package varchar(25))
Insert Into @TableB values
(1 ,'A'),
(2 ,'B'),
(3 ,'C')
Select A.ID
,Package=B.RetVal
From @TableA A
Cross Apply (
Select RetSeq = Row_Number() over (Order By (Select null))
,RetVal = LTrim(RTrim(B.i.value('(./text())[1]', 'varchar(max)')))
From (Select x = Cast('<x>' + replace((Select replace(A.Packages,'^','§§Split§§') as [*] For XML Path('')),'§§Split§§','</x><x>')+'</x>' as xml).query('.')) as A
Cross Apply x.nodes('x') AS B(i)
) B
Left Join @TableB C on B.RetVal=C.Package
Where C.Package is null
返回
ID Package
6 D
7 D
选项 2 - 具有解析/分割功能
Select A.ID
,Package=B.RetVal
From @TableA A
Cross Apply [dbo].[udf-Str-Parse](A.Packages,'^') B
Left Join @TableB C on B.RetVal=C.Package
Where C.Package is null
如果感兴趣的话可以解析 UDF
CREATE FUNCTION [dbo].[udf-Str-Parse] (@String varchar(max),@Delimiter varchar(25))
Returns Table
As
Return (
with cte1(N) As (Select 1 From (Values(1),(1),(1),(1),(1),(1),(1),(1),(1),(1)) N(N)),
cte2(N) As (Select Top (IsNull(DataLength(@String),0)) Row_Number() over (Order By (Select NULL)) From (Select N=1 From cte1 a,cte1 b,cte1 c,cte1 d) A ),
cte3(N) As (Select 1 Union All Select t.N+DataLength(@Delimiter) From cte2 t Where Substring(@String,t.N,DataLength(@Delimiter)) = @Delimiter),
cte4(N,L) As (Select S.N,IsNull(NullIf(CharIndex(@Delimiter,@String,s.N),0)-S.N,8000) From cte3 S)
Select RetSeq = Row_Number() over (Order By A.N)
,RetVal = LTrim(RTrim(Substring(@String, A.N, A.L)))
From cte4 A
);
--Orginal Source http://www.sqlservercentral.com/articles/Tally+Table/72993/
--Much faster than str-Parse, but limited to 8K
--Select * from [dbo].[udf-Str-Parse-8K]('Dog,Cat,House,Car',',')
--Select * from [dbo].[udf-Str-Parse-8K]('John||Cappelletti||was||here','||')
关于Sql 将分隔字符串与已知值表进行比较以查找不匹配项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42071845/