逐步回归的基本思想是:对全部因子按其对y影响程度大小(偏回归平方的大小),从大到小地依次逐个地引入回归方程,并随时对回归方程当时所含的全部变量进行检验,看其是否仍然显著,如不显著就将其剔除,知道回归方程中所含的所有变量对y的作用都显著是,才考虑引入新的变量。再在剩下的未选因子中,选出对y作用最大者,检验其显著性,显著着,引入方程,不显著,则不引入。直到最后再没有显著因子可以引入,也没有不显著的变量需要剔除为止。
从方法上讲,逐步回归分析并没有采用什么新的理论,其原理还只是多元线性回归的内容,只是在具体计算方面利用一些技巧。
逐步回归分析时在考虑的全部自变量中按其对y的贡献程度大小,由大到小地逐个引入回归方程,而对那些对y作用不显著的变量可能是中不被引入回归方程。另外,已被引入回归方程的变量在引入新变量进行F检验后失去重要性时,需要从回归方程中剔除出去。
Step 1 计算变量均值x1,x2,变量为uj,xn,y和差平方和L11,L22,,Lpp,Lyy.记各自的标准化
xjxjLjj,j1,,p,up1yy. LyyStep 2 计算x1,x2,,xp,y的相关系数矩阵R(0).
,xik,且i1,i2,Step 3 设已经选上了K个变量:xi1,xi2,为R(k)(ri(jk)).对j1,2,,ik互不相同,R(0)经过变换后
)2(ri(jk,(p1)),k逐一计算标准化变量uij的偏回归平方和Vi(jk)ri(jikj),
记Vl(k)Vl(k),对给定的显著性水平,拒绝max{Vij},作F检验,F(k)r(p1)(p1)(nk1)(k)域为FF1(1,nk1)。
Step 4 最Step 3 循环,直至最终选上了t个变量xi1,xi2,,xit,且i1,i2,,it互不相同,
R(0)经过变换后为R(t)(ri(jt)),则对应的回归方程为:
xi1xi1ˆyyk)ri1(,(p1)LyyLi1i1)rik(k,(p1)xikxikLikik,
ˆb0bi1xi1通过代数运算可得y
bikxik。
因篇幅问题不能全部显示,请点此查看更多更全内容