什么样的算法适合在逻辑社区(科技、娱乐等)中对博客进行聚类和排名?
对博客文章进行聚类和排名的算法会更好。
接受的答案是算法、伪代码、Java 代码或指向特定算法解释的链接。
更新: 所以,我似乎想要 Partional Clustering 类别的东西主要基于文本特征。
最佳答案
首先,您必须通过定义以下内容来更好地定义您的问题:
- 每个博客的特征向量(描述符)
- 评估描述符之间“距离”的指标。
一旦你这样做了,你就有了一卡车的 clustering algorithms可供选择,例如kmeans等
关于algorithm - 按逻辑类别对博客进行集群和排名,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1526332/