algorithm - 比较两个数据结构的相似性

标签 algorithm comparison computer-science equality fuzzy

我正在尝试寻找一种算法来检查两个数据条目之间的相似性。假设我有两个数据结构(联系人列表中的字段),其中包含以下数据:

// UserA addressbook.
name: Frank Sinatra
mobile: +44 555 555 555 55

// UserB addressbook.
name: Frank Albert Sinatra
phone: 004455555555555

我从不同的提供商处获得了这些条目,UserA 同步了他的 Google 帐户,而 UserB 同步了他的 Microsoft 帐户,但我希望我的算法告诉我两个用户都知道同一个人(在一定概率内)。

有谁知道我应该去哪里看?我试图找到创建“不安全”散列的散列算法,即相似数据的相似散列,但这条路线没有成效。

最佳答案

可以使用 Levenshtein distance 来确定字符串的相似性.字符串应在测试前准备好,例如删除特殊字符或拆分字符串。 对于数据结构,请查看 How do you measure similarity between 2 series of data?

关于algorithm - 比较两个数据结构的相似性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20284903/

相关文章:

computer-science - 什么是必读的EWD?

arrays - 两个文件之间的外部排序

C#引用比较

algorithm - 找到给定概率的分位数的时间复杂度

python - 为什么 '362' > 378?

python - 如何比较 2 个有序字典并创建一个新的有差异的有序字典? ( python 3.7)

algorithm - 在一长串字符中找到单词。自动分词

database - 在数据库中存储和索引二进制字符串

sql - 用于检查一列是否包含另一列值的正则表达式

在六边形图中寻找最优节点对的算法