【摘要】MATLAB和Mathematica、Maple并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。回归分析,是对现有数据进行处理、从中发现有用信息的一种重要手段。而线性回归,特别是一元线性回归分析更是人们优先考虑采用的方式。基于此,本文就一元线性回归的MATLAB实现作了一番探讨,给出了多种实现方式,并通过一个实例加以具体展示,在数据处理时可根据自己的需要灵活地加以选用。
【关键词】MATLAB程序、一元线性回归、多元线性回归问题、线性回归拟合问题、Subplot、三次样条插值函数。
一、提出问题
在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。
二、简述原理
(一)一元线性回归
1.命令 polyfit最小二乘多项式拟合
[p,S]=polyfit(x,y,m)
多项式y=a1xm+a2xm-1+…+amx+am+1
其中x=(x1,x2,…,xm)x1…xm为(n*1)的矩阵;
y为(n*1)的矩阵;
p=(a1,a2,…,am+1)是多项式y=a1xm+a2xm-1+…+amx+am+1的系数;
S是一个矩阵,用来估计预测误差.
2.命令 polyval多项式函数的预测值
Y=polyval(p,x)求polyfit所得的回归多项式在x处的预测值Y;
p是polyfit函数的返回值;
x和polyfit函数的x值相同。
3.命令 polyconf 残差个案次序图
[Y,DELTA]=polyconf(p,x,S,alpha)求polyfit所得的回归多项式在x处的预测值Y及预测值的显著性为1-alpha的置信区间DELTA;alpha缺省时为0.05。
p是polyfit函数的返回值;
x和polyfit函数的x值相同;
S和polyfit函数的S值相同。
4. 命令 polytool(x,y,m)一元多项式回归命令
5.命令regress多元线性回归(可用于一元线性回归)
b=regress( Y, X )
[b, bint,r,rint,stats]=regress(Y,X,alpha)
b 回归系数
bint 回归系数的区间估计
r 残差
rint 残差置信区间
stats 用于检验回归模型的统计量,有三个数值:相关系数R2、F值、与F对应的概率p,相关系数R2越接近1,说明回归方程越显著;F > F1-α(k,n-k-1)时拒绝H0,F越大,说明回归方程越显著;与F对应的概率p 时拒绝H0,回归模型成立。
Y为n*1的矩阵;
X为(ones(n,1),x1,…,xm)的矩阵;
alpha显著性水平(缺省时为0.05)。
(二)多元线性回归
1.命令 regress
2.命令 rstool 多元二项式回归
命令:rstool(x,y,’model’, alpha)
x 为n*m矩阵
y为 n维列向量
model 由下列4个模型中选择1个(用字符串输入,缺省时为线性模型):
linear(线性):
purequadratic(纯二次):
interaction(交叉):
quadratic(完全二次):
alpha 显著性水平(缺省时为0.05)
返回值beta 系数
返回值rmse剩余标准差
返回值residuals残差
非线性回归
1.命令 nlinfit
[beta,R,J]=nlinfit(X,Y,’’model’,beta0)
X 为n*m矩阵
Y为 n维列向量
model为自定义函数
beta0为估计的模型系数
beta为回归系数
R为残差
2.命令 nlintool
nlintool(X,Y,’model’,beta0,alpha)
X 为n*m矩阵
Y为 n维列向量
model为自定义函数
beta0为估计的模型系数
alpha显著性水平(缺省时为0.05)
3.命令 nlparci
betaci=nlparci(beta,R,J)
beta为回归系数
R为残差
返回值为回归系数beta的置信区间
4.命令 nlpredci
[Y,DELTA]=nlpredci(‘model’,X,beta,R,J)
Y为预测值
DELTA为预测值的显著性为1-alpha的置信区间;alpha缺省时为0.05。
X 为n*m矩阵
model为自定义函数
beta为回归系数
R为残差
三、多元线性回归问题
在实际经济问题中,一个变量往往受到多个变量的影响。例如,家庭消费支出,除了受家庭可支配收入的影响外,还受诸如家庭所有的财富、物价水平、金融机构存款利息等多种因素的影响,表现在线性回归模型中的解释变量有多个。这样的模型被称为多元线性回归模型。(multivariable linear regression model )
1、多元线性回归模型的一般形式
多元线性回归模型的一般形式为:
Y =0 +1X1i+2X2i++kXki +i, i=1,2,,n (1)
其中 k 为解释变量的数目,j (j1,2,k ) 称为回归系(regressioncoefficient)。式也被称为总体回归函数的随机表达式。它的非随机表达式为:
Y =0+1X1i +2X2i ++ k X ki , i=1,2,n (2)
â j 也被称为偏回归系数(partial regression coefficient)。
2、 多元线性回归计算模型
Y=0+1x1+2x2+kxk +∼N (0,2 ) (3)
多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和(Σe)为最小的前提下,用最小二乘法或最大似然估计法求解参数。
设 ( x11, x12 , x1 p , y1 ),, ( xn1, xn 2 , xnp , yn ) 是一个样本,用最大似然估计法估计参数:
取 b0 , b1 bp ,当 b0b0 , b1b1,b− b 达到最小。
发表评论: