非线性回归预测法/非线性回归分析(Nonlinear Regression Analysis)
目录 |
非线性回归分析是线性回归分析的扩展,也是传统计量经济学的结构模型法分析。
在社会现实经济生活中,很多现象之间的关系并不是线性关系,对这种类型现象的分析预测一般要应用非线性回归预测,通过变量代换,可以将很多的非线性回归转化为线性回归。因而,可以用线性回归方法解决非线性回归预测问题。
选择合适的曲线类型不是一件轻而易举的工作,主要依靠专业知识和经验。常用的曲线类型有幂函数,指数函数,抛物线函数,对数函数和S型函数。
线性回归模型分析的线性经济变量关系只是经济变量关系中的特例,现实中的多数经济变量关系是非线性的。
对于无法通过初等数学变换转化为线性回归模型的非线性经济变量关系,必须直接用非线性变量关系进行分析。
即使非线性变量关系可以通过初等数学变换转化为线性模型,也可能造成模型随机误差项性质的改变,这种情况下,常常也是直接作为非线性模型进行分析比较有利。
非线性模型计量经济分析的基本思路与线性模型是相似的,仍然可以以回归分析为核心,称为“非线性回归分析”。
选择回归函数的具体形式应遵循以下原则:
第一,函数形式应与经济学的基本理论相一致;
如:生产函数常采用幂函数的形式;成本函数常采用多项式方程的形式等。
第二,方程有较高的拟合优度;说明了函数形式选取较为适当。
第三,函数的形式尽可能简单。
非线性回归预测模型有很多,其中除“直线回归方程(LIN)”外的对数曲线方程(LOG)、反函数曲线方程(INV)、二次曲线方程(抛物线)(QUA)、三次曲线方程(CUB)、复合曲线方程(COM)、幂函数曲线方程(POW)、S形曲线方程(S)、生长曲线方程(GRO)、指数曲线方程(EXP)与logistic曲线方程(LGS)等均为非线性回归方程。当然还有双曲线回归方程、超指数曲线方程等许多非线性回归方程,可用于预测预报。
1、抛物线函数:
Y = a + bX + cX2
2、双曲线函数:
Y=a+b(1/X)
3、幂函数:
4、指数函数:
Y = abX
5、对数函数:
Y=a+bln(X)
6、S形曲线函数:
其中:L,a, b>0, 称该函数为逻辑曲线
7、多项式方程:
非线性回归函数模型常常采用将其线性化后,采用线性方程形式进行估计的。常用的变换方法有如下几种:
(1)、倒数变换
如,对双曲线函数,设Z=1/X,则原函数化为如下线性形式:
Y=a+bZ
(2)、半对数变换
如,对对数函数,设Z=lnX,则原函数变换为:
Y=a+bZ
在实际问题中,当变量之间的相关关系不是线性相关关系时,不能用线性回归方程描述它们之间的相关关系,需要进行非线性回归分析,然而,非线性回归方程一般很难求,因此,把非线性回归化为线性回归应该说是解决问题的好方法。
首先,所研究对象的物理背景或散点图可帮助我们选择适当的非线性回归方程
其中a及b为未知参数(在此仅讨论含两个参数的非线性回归方程) ,为求参数a及b的估计值,往往可以先通过变量置换,把非线性回归化为线性回归,再利用线性回归的方法确定参数及b的估计值。
下面列出常用的曲线方程及其图形,并给出相应的化为线性方程的变量置换公式。以帮助我们观察散点图确定回归方程的类型。不过,值得注意的是,散点图毕竟只是相关关系的粗略表示,有时散点图可能与几种曲线都很接近,这时建立相应的回归方程可能都是合理的,但一个非线性回归问题,由于选择不同的非线性回归,得到同一个问题的多个不同回归方程,哪一个回归方程最优呢? 对于能化为一元线性回归的问题,可通过计算样本相关系数的办法来解决,样本相关系数的绝对值最大的对应最优的回归方程。
曲线方程 | 变换公式 | 变换后的线性方程 | 曲线图形 |
---|---|---|---|
Y=a+bX | |||
y = axb | X=ln x Y=ln y | Y=a'+bX(a'=ln x) | |
y=a+b ln x | X=ln x Y=y | Y=a+bX | |
y = aebx | X=x Y=ln y | Y=a'+bX(a'=ln x) | |
Y=ln y | Y=a'+bX(a'=ln x) |
例:在彩色显影中,析出银的光学密度ξ与形成染料η的光学密度的试验数据如下:
xi | yi | xi | yi | xi | yi |
0.05 | 0.10 | 0.14 | 0.59 | 0.38 | 1.19 |
0.06 | 0.14 | 0.20 | 0.79 | 0.43 | 1.25 |
0.07 | 0.23 | 0.25 | 1.00 | 0.47 | 1.29 |
0.10 | 0.37 | 0.31 | 1.12 |
求η关于ξ的回归方程.
解:由散点图(右图)知可设回归方程为(b<0)其中A及b为参数,两边取对数,得,
作变量代换,
并设a=ln A,得,
则由试验数据(xi,yi),(i=1,2,...,11)求出对应数据(Xi,Yi)(i=1,2,...,11)如下
Xi | Yi | Xi | Yi | Xi | Yi |
20.000 | -2.303 | 7.143 | -0.528 | 2.632 | 0.174 |
16.667 | -1.966 | 5.000 | -0.236 | 2.326 | 0.223 |
14.286 | -1.470 | 4.000 | 0 | 2.128 | 0.255 |
10.000 | -0.994 | 3.226 | 0.113 |
计算得
样本相关系数
查相关系数显著性检验表,当n-2-9时,r0.05(9) = 0.602,r0.001(9) = 0.0735
因为, | r | > r0.01(9) = 0.735所以,认为Y与X之间的线性相关关系特别显著.
再求a及b的估计值
则Y关于X的线性回归方程为
换回原变量,得,即
所以,η关于ξ的回归方程为