php - 推荐用于高效查找/评估关联规则的数据结构或表模式?

标签 php postgresql artificial-intelligence data-mining

在最近的一个项目中,我实现了 FP-Growth 算法来读取事务并生成公共(public)集,然后我从中生成关联规则。这对我的目的来说效果很好。

现在我正在生成数以千计的规则,我正在寻找一种有效的方法来执行它们......目前我正在将规则存储在一个 postgres 表中,其中主体是一个整数数组,头部是一个单一的诠释。我的查询查找我所获得的项目集包含主体但不包含头部的行。

我仅限于使用 PHP 和 Postgres - 这个项目是一个更大的应用程序的一小部分。

谁能推荐一个数据结构或表模式/指导我一些好的资源?另外,在讨论关联规则的应用时,首选术语是什么 - 评估、执行、查找、运行?

谢谢!

最佳答案

所以你有一组规则,其中每个左侧都描述为一组谓词。 一种选择是使用像 Lucene 这样的 bool 搜索引擎对它们进行索引,然后给定一组应用于当前事件的谓词,您可以搜索可能的规则,然后尝试准确地应用它们,我相信它会工作得非常快。

其他选项是对谓词进行排序并将每个规则转换为规则左侧字符串 (P1 P2 P3 P4)。现在我们来到多个字符串匹配的领域,并且可以使用前缀树(一个问题,我们应该搜索子字符串不太精确,但复杂度也是 O(log(n)))

关于php - 推荐用于高效查找/评估关联规则的数据结构或表模式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5348107/

相关文章:

python - 用神经网络填充序列的缺失值

php - Drupal 到 zen cart sql 查询转换

php - Apache htaccess 选项 +FollowSymLinks 不再适用于托管公司 Hostgator

sql - 我如何分组连接每一行?

algorithm - Dijkstra 算法与 A-Star 相比如何?

artificial-intelligence - 遗传交叉函数

php - 如何避免此 PDO 异常 : Cannot execute queries while other unbuffered queries are active

php - TCPDF 防止 div 进入新页面

Java JDBC 与 Heroku 的连接

jquery - Heroku PostgreSQL 更改 sortable_list POST?