python - Pandas/Python - 确定一定范围内多项式方程的局部最小值和最大值

标签 python pandas polynomial-math

我有一个四阶回归方程,我想找到因变量 (y) 的值以及给出该方程的相应自变量 (x)。本质上,我正在寻找给定范围内曲线斜率为零的点(曲线触底)。

我的等式是:

y = 2661x^5 + 637x^4 + 9.32x^3 - 3.88x^2 - 0.62x + .21

我对 x[-0.155,0.103] 范围内的最小 y 值感兴趣。

实际方程变量如下:

     In [54]:

df3.dtypes
Out[54]:
date       datetime64[ns]
expDate    datetime64[ns]
X^5               float64
X^4               float64
X^3               float64
X^2               float64
X                 float64
Const             float64
minls             float64
maxls             float64
dtype: object

In [55]: 
df3

Out[55]:
        date    expDate          X^5         X^4       X^3       X^2  \
5 2008-01-02 2008-01-19  2661.368357  637.214501  9.320573 -3.884286   

          X    Const     minls     maxls  
5 -0.621015  0.21083 -0.154444  0.102655  

其中 minls 和 maxls 是范围变量

有没有一种优雅的方式来做到这一点?我确实查看了 scipy.optimize.brent 但无法跟踪它的实现。

我还想提一下,我已经对数据框按 [date, expDate] 进行了分组,以防它对解决方案很重要。我的愿望是让一个新变量 df3.zerols 包含 [minls,maxls] 范围内的“ls”值

预先感谢您的帮助

约翰

更新: 我得到了一些帮助,当我只有一行数据时能够执行所需的过程。下面是我迄今为止的代码。在对日期和 expDate 执行分组后,我需要能够对许多行执行相同的分析。

In [13]:


%cd C:\Users\camcompco\PycharmProjects\Regression
df=pd.read_csv('min.csv')
C:\Users\camcompco\PycharmProjects\Regression
In [14]:

df.head()
Out[14]:
       date    expDate      X^5     X^4    X^3   X^2     X  Const  minls  \
0  1/2/2008  1/19/2008  2661.37  637.21   9.32 -3.88 -0.62   0.21  -0.15   
1  1/2/2008  2/16/2008   188.65   94.25  11.00 -1.44 -0.73   0.22  -0.15   
2  1/2/2008  3/22/2008    28.31   19.98   3.85 -0.53 -0.57   0.23  -0.15   
3  1/3/2008  1/19/2008  2715.64  571.99  -6.31 -3.66 -0.48   0.20  -0.15   
4  1/3/2008  2/16/2008   135.61   76.55   9.96 -1.18 -0.70   0.21  -0.15   

    maxls  
0  0.1000  
1  0.1001  
2  0.1002  
3  0.1003  
4  0.1004  
In [21]:

row = df.iloc[0]
f = np.poly1d(row.iloc[2:8])
In [22]:

f
Out[22]:
poly1d([2661.3699999999999, 637.21000000000004, 9.3200000000000003,
       -3.8799999999999999, -0.62, 0.20999999999999999], dtype=object)
In [23]:

result = scipy.optimize.minimize_scalar(f, bounds=(row["minls"], row["maxls"]), method='bounded')
In [24]:

result.x
Out[24]:
0.066556628458908085
In [25]:

f(result.x)
Out[25]:
0.1702749792881138
In [ ]:

最佳答案

你说你想要斜率为零的地方,然后你说你想要一个范围内的最小 y 值。这两者不必相同(您正在寻找的地方甚至不需要存在局部最小值)。假设您确实对 (a) 最小 y 值感兴趣,我们可以使用 np.poly1d 将系数转换为函数,然后使用 scipy.optimize.minimize_scalar > 找到范围内的最小值。

首先我们得出多项式:

>>> row = df3.iloc[0]
>>> f = np.poly1d(row.iloc[2:8])
>>> f
poly1d([2661.3683569999998, 637.21450100000004, 9.3205729999999996,
       -3.8842859999999999, -0.62101499999999998, 0.21082999999999999], dtype=object)

检查以确保系数符合我们预期的顺序始终是个好主意:

>>> f(0)
0.21082999999999999

然后我们将 minimize_scalar 与有界方法一起使用:

>>> result = scipy.optimize.minimize_scalar(f, bounds=(row["minls"], row["maxls"]), method='bounded')
>>> result
 message: 'Solution found.'
 success: True
     fun: 0.17101866540403174
  status: 0
       x: 0.06659055175137768
    nfev: 11

我们想要的x的值在result中:

>>> result.x
0.06659055175137768
>>> f(result.x)
0.17101866540403174

关于python - Pandas/Python - 确定一定范围内多项式方程的局部最小值和最大值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31222891/

相关文章:

C++重载*用于多项式乘法

python - 函数中的预定义描述符如何工作?

python - 访问数组中的元素

python - 如何使用列表重命名 pyspark 数据框的所有列

python - 如何将两个日期时间列合并为一? Pandas python

java - 按度数对多项式链表进行排序

python - 如何在 Windows 8.1 上安装 PyBluez?

python - 如何追加 n 个 csv 文件并保留列顺序

pandas - 根据 Pandas 数据框中的其他分类值填充分类值的缺失值

python - 优化 Python 多项式计算