math - 计算两个相同数据集之间的汉明距离

标签 math dataset measure hamming-distance

如何计算相同点的两个数据集之间的汉明距离?两个数据集看起来完全一样。
http://postimg.org/image/u11qnsolh/

有两个点数相同的数据集。
总分-19


第一个数据集有 3 个簇。
簇 A 中有 4 个点
簇 B 中有 2 个点
C 组有 4 个点

其余点在簇外


第二个数据集有 3 个簇。
簇 A 中有 8 个点
Cluster B 有 5 个点
C 组有 6 个点

最佳答案

首先,让我们索引点:

enter image description here

你对两组集合之间的汉明距离感兴趣:

L = { {1,2,3,4}, {5,6}, {7}, {8}, {9}, {10}, {11}, {12}, { 13}, {14,15,17,18}, {16}, {19} }

R = {{1,2,3,4,5,6,7,8}, {9,10,11,12,13}, {14,15,16,17,18, 19}


改编自 [ 1 ] (第2节),将汉明距离推广到两组X,Y,距离可以定义为:

enter image description here

改编自 [ 2 ] (3.4节),两组集合的并集和差集可以定义为:

enter image description here

enter image description here

所以在你的情况下:

L ⋃ R = { {1,2,3,4,5,6,7,8}, {9,10,11,12,13}, {14,15,16,17, 18,19}

L - R = {{}}

R - L = { {5,6,7,8}, {1,2,3,4,7,8}, {1,2,3,4,5,6,8} , {1,2,3,4,5,6,7}, {10,11,12,13}, {9,11,12,13}, {9,10,12,13}, {9, 10,11,13}, {9,10,11,12}, {16,19}, {14,15,17,18,19}, {14,15,16,17,18} }

(L-R) ⋃ (R-L) = { {}, {5,6,7,8}, {1,2,3,4,7,8}, {1,2,3,4 ,5,6,8}, {1,2,3,4,5,6,7}, {10,11,12,13}, {9,11,12,13}, {9,10,12 ,13}, {9,10,11,13}, {9,10,11,12}, {16,19}, {14,15,17,18,19}, {14,15,16,17 ,18}

所以

|(L-R) ⋃ (R-L)| = 13

|L ⋃ R| = 3

所以 d(L,R) = 13/3 = 4.333


[ 1 ] 将汉明距离推广到有限集以对异构对象进行分类 [Bezem、Keijzer、Volmac]

[ 2 ] 概念模型中的模式匹配——一种正式的多建模语言方法 [Delfmann、Herwig、Lis、Stein]

关于math - 计算两个相同数据集之间的汉明距离,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29425742/

相关文章:

c# - 自动化 mdb 到 sql server

JQuery 你的密码有多强

c++ - 计算pi的值-我的代码有什么问题

php - 生成总和为 N 的所有可能的 3 个正整数

javascript - Google Visualization data.join 方法导致工具提示被删除

delphi - 在数据集过滤器中使用 coalesce()

Java,商品商店折扣数学错误

Javascript lerp 函数没有给出准确的答案

frequency - 如何在 SPSS 中将一个变量的频率保存为新变量?

powerbi - 删除 Power Bi 中未使用的度量