sql-server - 使用完整缓存时,查找组件无法匹配空字符串

标签 sql-server ssis etl ssis-2012

我有一个带有查找表的查找组件 a,该查找表重新设置具有 3 个可能值的 varchar(4) 列:“T”、“R”或“”(空字符串)。

我正在使用 OLE DB 连接作为查找表,并尝试直接访问该表,并在列上使用 RTRIM() 指定查询,以确保该字符串是空的,而不是“一定长度的空白字符串”。

如果我将缓存模式设置为“部分缓存”,则一切正常(直接读取表或使用修剪查询),并且输入表的空字符串与相应的查找表行正确匹配.

但是,如果我将缓存模式更改为“完全缓存”,则根本不会匹配任何空字符串。

我已检查查找表和输入表中的数据类型 DT_STR 和长度 4 是否相同。

有什么可以解释这种行为吗?可以修改吗?

注意:这不是已记录的空值问题。这是关于空字符串的。

最佳答案

在某个地方,您有尾随空格,无论是在源代码中还是在查找中。

考虑以下源查询。

SELECT
    D.SourceColumn
,   D.Description
FROM
(
    VALUES 
        (CAST('T' AS varchar(4)), 'T')
    ,   (CAST('R' AS varchar(4)), 'R')
    ,   (CAST('' AS varchar(4)), 'Empty string')
    ,   (CAST('    ' AS varchar(4)), 'Blanks')
    ,   (NULL, 'NULL')
) D (SourceColumn, Description);

对于我的查找,我将上述查询限制为仅 T、R 和空字符串行。

enter image description here

您可以看到,对于 5 个源行,T、R 和空字符串匹配并转到匹配输出路径。当我使用 NULL 或显式使用空格时,没有匹配。

如果我将查找模式从“完全缓存”更改为“部分”,则 NULL 继续不匹配,而显式空格匹配。

什么?

在完全缓存模式下,查找转换执行源查询并将数据保存在正在执行 SSIS 的计算机本地。此查找将使用 .NET 相等规则进行精确匹配。在这种情况下,'' 将不会匹配 ' '

但是,当我们将缓存模式更改为 None 或 Partial 时,我们将不再依赖 .NET 匹配规则,而是使用源数据库的匹配规则。在 TSQL 中,'' 匹配 ' '

要使完整缓存模式按预期工作,您需要在源和/或查找转换中应用 RTRIM。如果您确信 RTRIM 无法在您的源代码中工作,请添加派生列转换,然后在那里应用您的 RTRIM,但我发现最好滥用数据库而不是 SSIS。

Biml

Biml(商业智能标记语言)描述了商业智能平台。 BIDS Helper ,是 Visual Studio/BIDS/SSDT 的免费插件,我们将使用它来将下面的 Biml 文件转换为 SSIS 包。

以下 biml 将生成

<Biml xmlns="http://schemas.varigence.com/biml.xsd">
    <Connections>
        <OleDbConnection Name="CM_OLE" ConnectionString="Data Source=localhost\dev2012;Initial Catalog=tempdb;Provider=SQLNCLI11.0;Integrated Security=SSPI;" />
    </Connections>
    <Packages>
        <Package ConstraintMode="Linear" Name="so_26719974">
            <Tasks>
                <Dataflow Name="DFT Demo">
                    <Transformations>
                        <OleDbSource 
                            ConnectionName="CM_OLE" 
                            Name="OLESRC Source">
                            <DirectInput>
                            SELECT
                                D.SourceColumn
                            ,   D.Description
                            FROM
                            (
                                VALUES 
                                    (CAST('T' AS varchar(4)), 'T')
                                ,   (CAST('R' AS varchar(4)), 'R')
                                ,   (CAST('' AS varchar(4)), 'Empty string')
                                ,   (CAST('    ' AS varchar(4)), 'Blanks')
                                ,   (NULL, 'NULL')
                            ) D (SourceColumn, Description);
                            </DirectInput>
                        </OleDbSource>
                        <Lookup 
                            Name="LKP POC"
                            OleDbConnectionName="CM_OLE"
                            NoMatchBehavior="RedirectRowsToNoMatchOutput"
                            >
                            <DirectInput>
                            SELECT
                                D.SourceColumn
                            FROM
                            (
                                VALUES 
                                    (CAST('T' AS varchar(4)))
                                ,   (CAST('R' AS varchar(4)))
                                ,   (CAST('' AS varchar(4)))
                            ) D (SourceColumn);
                            </DirectInput>
                            <Inputs>
                                <Column SourceColumn="SourceColumn" TargetColumn="SourceColumn"></Column>
                            </Inputs>
                        </Lookup>
                        <DerivedColumns Name="DER Default catcher" />
                        <DerivedColumns Name="DER NoMatch catcher">
                            <InputPath OutputPathName="LKP POC.NoMatch" />
                        </DerivedColumns>
                    </Transformations>

                </Dataflow>
            </Tasks>
        </Package>
    </Packages>
</Biml>

关于sql-server - 使用完整缓存时,查找组件无法匹配空字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26719974/

相关文章:

python - 使用 Python 将大型压缩 JSON 文件从 Amazon S3 导入 AWS RDS-PostgreSQL

sql-server - 线串到点

sql-server - Azure 数据工厂复制事件失败。用户登录失败

sql - 使用 UNION 的自定义结果顺序 - SQL

mysql - 在 MySQL 中验证日期

sql-server - Azure 数据工厂从 VM SQL Server 到 FTP 上的文件

c# - 在没有 Entity Framework 的情况下使用 C# 进行数据库交互

sql-server - 将数据从一个数据库移动到 Azure 中的另一个数据库

Python:将excel文件转换为JSON格式

ssas - 通过在 ETL 或 SSAS 中计算 KPI 获得最佳性能?