algorithm - Apriori 的最小置信度和最小支持度

标签 algorithm parameters data-mining apriori

Apriori algorithm 的最小置信度和最小支持值的合适值是多少? ?你怎么能调整它们?它们是固定值,还是会在算法运行期间发生变化?如果您以前使用过此算法,您使用的是什么值?

最佳答案

我建议从支持值 0.05 和置信度值 0.80 开始。但我同意您应该了解它们究竟代表什么,以便能够恰本地定义它们。 对于规则 A => B(其中 A、B 非空集)

Support (A ⇒ B): s = P(A, B)
Confidence (A ⇒ B): c = P(B | A)
Lift (A ⇒ B): L = c/P(B)

提升对于评估规则的趣味性很重要(因为您通常会想出数百个规则)。已经提出了 20 多个有趣的度量。这些包括 Ф 系数、kappa、互信息、J 度量和基尼指数。我个人根据 J 度量来排序我的规则。

J.measure (A ⇒B): J = s/c * (c*log(L) + (1-c)*log((L-c)/L))

关于algorithm - Apriori 的最小置信度和最小支持度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2008488/

相关文章:

c++ - 非大 O 复杂性

c++ - 为什么允许通过 const 引用而不是通过普通引用传递 R 值?

algorithm - 在搜索引擎查询日志中查找趋势

c++ - 如何在插入点后不重新索引/移动项目的情况下将数据插入到有序的、随机可访问的列表中?

javascript - 随着时间的推移应该接近另一个变量 X 的变量 Y

swift - Swift 中忽略参数的用例是什么

function - 在 Clojure 中传递带有参数作为参数的函数

r - PCA空间和 'feature-space'发散中的质心距离计算

algorithm - 如何使用机器学习算法识别 URL 中的新模式(文本挖掘)

python - Q : big O of nested while loop inside for loop