python - 用python统计比较曲线

我来自生物医学研究领域。

我的一个实验可以生成如所附图像中的曲线(所附图像是随机生成的示例数据)。

我想从统计上说，蓝色曲线与橙色曲线相比表现明显不同。

例如，在时间 ~1 - 5 之间，两条曲线之间的标准差不重叠，因此我假设它们在统计上是不同的。

有谁知道我可以在这里使用哪种统计方法(是方差分析吗？)来用 python 编写代码？

谢谢大家 example curve

最佳答案

在您的情况下(将数据点作为时间序列)，我想到的一件事是使用相关性指标(低分意味着您的特征之间的相关性较低: 在你的例子中，你实际上有 3 个特征(时间、red_trend、blue_trend)，当然还有作为平均点的趋势。

这里的重要问题是，使用什么相关性指标？ 基于this website, by Jason Brownlee PhD ，因为你的特征都是数字，并且可能存在非线性关系，所以你最好使用斯 PIL 曼相关系数。但使用 pearson 也没什么坏处。

您还可以在之前提出的网站中查看何时使用其他方法(即方差分析)。

作为实现示例

import numpy as np
import matplotlib.pyplot as plt
from scipy import stats


t = np.linspace(1, 20, 100)
x = np.sin(np.exp(t))
y = np.cos(np.exp(t))

plt.plot(t, x)
plt.plot(t, y)

res1 = stats.spearmanr(x, y)
print(res1)
# SpearmanrResult(correlation=-0.01120912091209121, pvalue=0.9118658174696723)

res2 = stats.pearsonr(x, y)
print(res2)
# (-0.016667117318862758, 0.8692689697764168)

只要您的相关性接近于零，您的特征之间就应该没有关系。

在您自己的测试中，也请注意 p 值，在我的示例中，p 值很高，在统计上不显着(由于手动生成数据)，您的结果将是如果您设法获得 p 值 < 0.05，则具有统计显着性。

关于python - 用python统计比较曲线，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/77286120/

python - 用python统计比较曲线

上一篇：python - np.select Int64 和 int64 区别

下一篇：google-sheets - 根据查询中的 X 个单词数将查询拆分为 N 个结果