algorithm - 按逻辑类别对博客进行集群和排名

标签 algorithm machine-learning blogs

什么样的算法适合在逻辑社区(科技、娱乐等)中对博客进行聚类和排名?

对博客文章进行聚类和排名的算法会更好。

接受的答案是算法、伪代码、Java 代码或指向特定算法解释的链接。

更新: 所以,我似乎想要 Partional Clustering 类别的东西主要基于文本特征。

最佳答案

首先,您必须通过定义以下内容来更好地定义您的问题:

  1. 每个博客的特征向量(描述符)
  2. 评估描述符之间“距离”的指标。

一旦你这样做了,你就有了一卡车的 clustering algorithms可供选择,例如kmeans

关于algorithm - 按逻辑类别对博客进行集群和排名,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1526332/

相关文章:

algorithm - 在实践中,什么是更好的选择 : hash table, 基数树、红黑树或...?

c# - 试图找到在图中导航一组边的最快方法

每个帖子都有 Facebook 评论吗?

github - 在我的博客中添加github gist的问题(使用Google博客)

c++ - 枚举完整图的哈密顿循环的算法(循环、反转、环绕或重复不计算在内的排列)

java - 添加 fragment ?

python - keras访问预训练模型的层参数以卡住

python - Tensorflow 下一个词预测器错误

machine-learning - (双向)RNN 用于简单文本分类

Python循环读取并解析目录中的所有内容