我正在尝试学习使用 RapidMiner,我的老板希望我对一组数据进行市场购物篮分析。但是当我使用给定的模板时,出现以下错误:
常规属性必须是二项式类型。
这是通过 FP-Growth 算子给出的。
我有一个 customerID(仅数字)、一个 ProductName(字母)和一个 Product Quantity(数字)列。
由于我是 RM 的新手,我不知道出了什么问题。
任何意见都将不胜感激。
预先感谢您。
最佳答案
FP-Growth 需要一个 ExampleSet 作为输入,其中所有常规属性都是二项式的,在这种情况下意味着 bool 值。有时,二项式属性具有预定义的正/真和负/假值,否则可以将正值指定为 FP-Growth 运算符中的参数。此外,每个示例代表一次交易(或客户的购物篮),每个属性代表完整产品线中的一个项目,其中该属性的值定义该项目是否在购物篮中。
要找到关联规则,您需要首先找到频繁项集。这是 FP-Growth 运算符(operator)的工作。您的工作是将 ExampleSet 转换为“事务数据库”,即所有属性都是二项式的。
不幸的是,RapidMiner 中的模板有点错误。要修复该过程,您必须在 FP-Growth 运算符之前添加两个运算符。首先,您需要将所有缺失值替换为值 0(操作符“替换缺失值”和参数“默认”为零)。替换后,您需要“数值到二项式”运算符。默认参数值足以将所有属性转换为二项式属性。该过程现在应该运行!请注意,您需要足够小的最小支持来查找频繁项集。
关于data-mining - RapidMiner错误: Regular Attributes must be of type binomial.市场购物篮分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9594503/