php - 是否可以自动分类论坛或 BBS 中的帖子?

标签 php mysql algorithm forum webbbs

如果我有一个使用标签对帖子进行分类的论坛,是否可以在创建帖子后根据内容和标题自动添加标签?

非常感谢

最佳答案

执行此操作的最简单方法是拥有一个已知标签表。遍历帖子中的每个单词,如果该单词在标签表中,则将其添加到列表中。为了使这稍微更有效,您可以将标签存储在其显示版本和词干版本(例如,算法和算法)中。然后将帖子中的词干词与词干标签名称进行比较。请参阅 Porter 的词干提取算法以了解执行此操作的简单方法(对于英语单词)。

更有效的解决方案是使用 TF-IDF 之类的东西并将向量与每个标签相关联。为新帖子创建一个向量,并使用余弦相似度将其与每个标签向量进行比较。任何高于特定阈值的标签都将添加到帖子中。我从未将它用于自动标记,但根据我的经验,它是处理非垃圾数据时非常有效的匹配工具。 (即,人们不会试图欺骗或愚弄系统。)

这两种方法都假设您已经构建了某种标签字典来开始。您可以通过查看帖子中频繁使用哪些不常见的词(需要频率表)来猜测标签名称。

关于php - 是否可以自动分类论坛或 BBS 中的帖子?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5387441/

相关文章:

php - Zend框架1带有db select的空数组

PHP/MySQL Function result in a variable, 电子邮件检查

php - 使用存储过程建立 MySQL 数据库连接

mysql - VB.Net 中 mysql 数据库的数据库备份

java - 加速度计数据中的峰值检测

java - 寻找斐波那契数的黄金比例

algorithm - 改进 k 均值聚类

php - php-cpp 是否适用于 C 库?

php - 通过不使用 mysql 日期函数 laravel 来排序

php - 从数据库中获取值到多个选择标签-在Codeigniter中