algorithm - 如何计算聚类熵 - 给出的示例和我的解决方案是否正确?

标签 algorithm math cluster-analysis hierarchical-clustering entropy

<分区>

我想计算这个示例方案的熵

http://nlp.stanford.edu/IR-book/html/htmledition/evaluation-of-clustering-1.html

enter image description here

熵方程

那么熵就是(第一行)

enter image description here

所以熵就是这个方案

For the first cluster - ( (5/6)*Log(5/6) + (1/6)*Log(1/6) ) 
For the second cluster  - ( (1/6)*Log(1/6) + (1/6)*Log(1/6) + (4/6)*Log(4/6) )
For the third cluster  - ( (2/5)*Log(2/5) + (3/5)*Log(3/5) )

最终的熵是:

 FirtCluster_Entropy + SecondCluster_Entropy  + ThirdCluster_Entropy  

我说的对吗?

最佳答案

非常接近!对于聚类的总熵,您需要通过相对权重对每个聚类的熵进行加权。请看我对你之前问题的回答https://stackoverflow.com/a/35780505/159646 .

此外,这可能应该发布到 Cross Validated而不是堆栈溢出。

关于algorithm - 如何计算聚类熵 - 给出的示例和我的解决方案是否正确?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35760706/

相关文章:

java - 圆形与矩形相交的面积

c# - 高维数据聚类

r - 集群分配有时在两个 DBSCAN 实现中有所不同

math - 帕斯卡 - 奇数和偶数

java - 循环产生意想不到的结果

mysql - MySQL可以在表中显示百分号(%)吗

algorithm - Bisecting k-means聚类算法解释

c - 有没有一种简单的方法可以获取最后 x 分钟的成功读取百分比?

string - Boyer More exact 子串是否匹配动态规划的范例?

c++ - 如何从普通bst继承红黑树