php - 找出数组中的序列相似性

标签 php c arrays sorting sequences

我有一个任务,我有三个数组 A、B、C。所有这些都包含相同的数据。为了简单起见,我们假设数据是数字 1 到 5。数据将处于不同的困惑序列中。我想找出 B 和 C 中哪个数组的数据与 A 最相似。

Eg: 
A = 1,2,3,4,5
B = 1,2,3,5,4
C = 4,1,2,3,5

在这种情况下,很容易从视觉上理解 B 与 A 更相似。但对于真正困惑的序列,它会变得更加复杂。

Eg: 
A = 1,2,3,4,5
B = 5,3,1,4,2
C = 4,1,2,3,5

在这种情况下,我会假设 C 更接近 A。我认为这个假设可以量化为:两个数组中有多少元素具有相同的序列?在上面的示例中,[1,2,3] 的子序列在两个数组中是相同的。第二个问题是相似子序列之间的偏移量差异是多少?在这种情况下它是 1,因为子序列从 A 的索引 0 和 C 的索引 1 开始。

所以匹配序列中的元素数量和它们的偏移量是我想用的。我计划为这两个实体添加权重(匹配序列中的元素数量,以及它们出现时的偏移差异)

这有意义吗?我只需要一个粗略的相似度近似值,结果不需要很精确。是否有任何正式的数学或数据结构模型可以解决这个问题?

顺便说一句,我需要这个实现的项目是用 PHP 编写的。它是否有任何内置函数,例如用于字符串差异的 levenstein 模型?

非常欢迎任何建议!

最佳答案

嗯,我想你可以想出你自己的算法(例如生成所有后缀然后搜索它们然后定义评分程序)或者你可以使用众所周知的算法如
Smith-Waterman用于本地对齐或 Needleman-Wunsch为全局。这些算法的优势在于它们易于理解并为您提供所有可能的对齐方式(您可以选择最适合您的情况)。

NW in PHP

SW in PHP

关于php - 找出数组中的序列相似性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35765684/

相关文章:

php - 在 Windows 上将 Xdebug 和 PhpStorm 与 Docker 容器一起使用

c - 在同一个 scanf_s 中写入两个变量

conio.h 在 C 中不工作

java - 有人可以帮我用java中的for循环格式化二维数组显示吗

php - 执行 javascript : link + refreshing. JS + PHP

php - SilverStripe Fluent 菜单模板

c - 编写代码以查找字符串 C 中的第一个整数

javascript - 从 JavaScript 中的对象数组创建嵌套对象

ios - 在 swift 中读取并保存在数组中设置数组

php - 如何在 Prestashop 的产品列表中一次显示含税和不含税的产品价格?