data-mining - RapidMiner错误: Regular Attributes must be of type binomial.市场购物篮分析

标签 data-mining rapidminer

我正在尝试学习使用 RapidMiner,我的老板希望我对一组数据进行市场购物篮分析。但是当我使用给定的模板时,出现以下错误:

常规属性必须是二项式类型。
这是通过 FP-Growth 算子给出的。

我有一个 customerID(仅数字)、一个 ProductName(字母)和一个 Product Quantity(数字)列。

由于我是 RM 的新手,我不知道出了什么问题。

任何意见都将不胜感激。
预先感谢您。

最佳答案

FP-Growth 需要一个 ExampleSet 作为输入,其中所有常规属性都是二项式的,在这种情况下意味着 bool 值。有时,二项式属性具有预定义的正/真和负/假值,否则可以将正值指定为 FP-Growth 运算符中的参数。此外,每个示例代表一次交易(或客户的购物篮),每个属性代表完整产品线中的一个项目,其中该属性的值定义该项目是否在购物篮中。

要找到关联规则,您需要首先找到频繁项集。这是 FP-Growth 运算符(operator)的工作。您的工作是将 ExampleSet 转换为“事务数据库”,即所有属性都是二项式的。

不幸的是,RapidMiner 中的模板有点错误。要修复该过程,您必须在 FP-Growth 运算符之前添加两个运算符。首先,您需要将所有缺失值替换为值 0(操作符“替换缺失值”和参数“默认”为零)。替换后,您需要“数值到二项式”运算符。默认参数值足以将所有属性转换为二项式属性。该过程现在应该运行!请注意,您需要足够小的最小支持来查找频繁项集。

关于data-mining - RapidMiner错误: Regular Attributes must be of type binomial.市场购物篮分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9594503/

相关文章:

math - 如何计算两个等维时间序列之间的马氏距离?

mysql - 导入到 Rapidminer 时格式化向量

machine-learning - 从java程序访问Rapid Miner API时出错

algorithm - 计算机算法的可扩展性

data-mining - 韦卡先验法

machine-learning - 机器学习中使用的 "Relative absolute error"和 "Root relative squared error"的公式(由 Weka 计算)

pandas - 类型错误 : unhashable type: 'numpy.ndarray' - How to get data from data frame by querying radius from ball tree?

java - 在java中创建过滤器示例rapidminer运算符

machine-learning - K-NN 算法如何在 Rapidminer 中以相同距离工作?

java - rapidminer.init() 中的错误