rules <- apriori(table2, parameter = list(minlen=1, sup=s))
itemsets <- unique(generatingItemsets(rules))
itemsets.df <- as(itemsets, "data.frame")
F <- as.matrix(itemsets.df[with(itemsets.df, order(-support,items)),])
输出:
# items support
"{a,b}" "1.0"
"{a}" "1.0"
"{b}" "1.0"
"{c,a,b}" "0.5"
"{c,a}" "0.5"
"{c,b}" "0.5"
"{a,b,d}" "0.5"
"{a,d}" "0.5"
"{b,d}" "0.5"
使用apriori和generateItemsets来获取频繁事件集,如“items”中所示。但我只想要输出中的超集,即本例中的“{c,a,b}”和“{a,b,d}”。我该怎么做才能仅在 R 中获得超集?
最佳答案
如果对项集进行排序(并删除大括号), 您要删除的集合是下一个集合的前缀。
# Sample data
library(arules)
example(apriori)
itemsets <- unique(generatingItemsets(rules))
itemsets.df <- as(itemsets, "data.frame")
F <- as.matrix(itemsets.df[with(itemsets.df, order(-support,items)),])
library(stringr)
x <- as.character(F[,1])
x <- sort( str_replace_all( x, "[{}]", "" ) )
x
i <- seq_len( length(x) - 1 )
to_remove <- str_detect(x[i+1], paste0("^", x[i]))
x[ ! to_remove ]
关于r - 如何在R中获得超集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17547953/