我正在创建一个 SSIS 包,如果一个产品标签存在重复的产品代码,则需要通知用户。我们通过在共享位置发送给我们的 csv 平面文件检索产品。
在这个例子中,我为产品标签 Physio Ormix 和 Nixen 设置了 Productcode = 1a。
所以基本上 productcode = 1a 是重复的,因为它也被 productlabel=Nixen 使用。因此,通知用户使用了重复的 ProductCode 和 Productlabel。我尝试创建一个按 ProductCode 执行分组并对其进行计数的聚合。
有人可以告诉我如何做到这一点吗?
最佳答案
我认为您可以使用脚本组件和条件拆分来获取重复项,而无需所有这些逻辑:
- 在数据流任务中添加一个脚本组件
- 添加
DT_BOOL
类型的输出列(示例名称为Flag
) 在脚本组件中编写一个类似的脚本:
using System.Collections.Generic; public class ScriptMain: UserComponent { List<string> lstKey = new List<string>; List<string> lstKeylabel = new List<string>; public override void Input0_ProcessInputRow(InputBuffer0 Row) { if(!lstKey.Contains(Row.ProductCode){ lstKey.Add(Row.ProductCode); lstKeylabel.Add(Row.ProductCode + ";" + Row.ProductLabel); Row.Flag = true; }else if(lstKeylabel.Contains(Row.ProductCode + ";" + Row.ProductLabel)) { Row.Flag = true; }else{ Row.Flag = false; } } }
在具有类似表达式的脚本组件后添加条件拆分:
[Flag] == true
所有通过真实路径的记录都是唯一的,所有通过错误路径的记录都是重复的。
关于sql - 如何通过分组和计数在 SSIS 中获得所需的输出?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55036780/