用于比较高级语言(例如 Javascript)的数据图形相似性的数学库?

标签 math comparison statistics analytics

我正在寻找我认为相当复杂且可能不公开存在但希望它公开存在的东西。

我基本上有一个包含许多项目的数据库,这些项目都具有对应于其他值 (x) 的值 (y)。例如。其中一项可能如下所示:

x | 1 | 2 | 3 | 4 | 5
y | 12 | 14 | 16 | 8 | 6

这只是一个随机的例子。现在,有成千上万的这些项目都有自己的一组 x 和 y 值。一个 x 和那个 x 之后的 x 之间的范围不固定,可能因每个项目而异。

我正在寻找的是一个库,我可以在其中插入所有这些 X 和 Y 集,并告诉它返回最常见的项目(遵循可比较曲线/进展的 x 和 y 集),以及能够检查某个集合是否与另一集合至少有 x% 的可比性。

如果您要绘制数据图,可比较的意思是曲线的斜率。因此,实际上不是静态值,而是事件的检测,例如高增长后缓慢下降等。

由于我在数学方面的经验不足,我不太确定我要找的东西叫什么,因此很难解释我需要什么。希望我能给别人足够多的指点,让我找到正确的方向。

我最感兴趣的是 javascript 库,但如果没有这样的东西,任何库都会有帮助,也许我可以尝试移植我需要的东西。

最佳答案

再次关于 Markov Cluster(ing),我恰好是作者,以及您的应用程序。您提到您对对象之间的趋势相似性感兴趣。这通常是使用 Pearson 相关性计算的。如果您使用 http://micans.org/mcl/ 中的 mcl 实现,您还将获得程序“mcxarray”。这可用于计算例如之间的 PIL 逊相关性。表中的行。它可能对你有用。它能够处理丢失的数据——在一种简单的方法中,它只计算那些值对两者都可用的指数的相关性。如果您有进一步的问题,我很乐意回答他们——需要注意的是,我通常喜欢抄送对 mcl 邮件列表的回复,以便将它们存档并可供将来引用。

关于用于比较高级语言(例如 Javascript)的数据图形相似性的数学库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3746225/

相关文章:

python - 使用特定经度和纬度计算距离时的值域误差

php - 3个不同的等于

performance - 如何加速这个对象比较算法?

statistics - P值,显着性水平和假设

postgresql - 有哪些用于绘制存储在 postgres 数据库中的时间序列图表的选项

java - 能否以 map-reduce 的方式计算一组数据的百分位数?

c++ - qFastSin 和 qFastCos(速度、安全和精度)

c# - 为什么没有以 int 作为指数的 Math.Pow?

java - 计算出圆形图案的坐标?

PHP日期6个月以内