您好,欢迎来到微智科技网。
搜索
您的当前位置:首页回归分析实验

回归分析实验

来源:微智科技网
实验5 回归分析实验

一、实验目的

复习回归分析的基本理论,熟练掌握sas系统绘制散点图,计算相关系数,拟合线性回归方程,拟合简单的非线性回归方程,利用回归方程进行预测。 二、实验准备 常用的sas过程 1、reg过程 一般格式为: proc reg 选项;

model 因变量=自变量/选项; weight 变量; print 选项;

plot 纵轴变量*横轴变量=“符号”;

proc reg语句的选项有data=输入数据集,simple给出简单统计数,corr给出简单相关系数等。 Model语句设定线性数学模型。 Weight语句给出权系数变量。 Print语句打印分析结果。 Plot语句作散点图。 2、corr过程 一般格式为: proc corr 选项; var 变量; with 变量; partial 变量;

proc corr语句的选项可设定相关系数,比如pearson,spearman等,缺省为pearson系数。 Var语句指明分析变量。

With语句设定放在左边的变量,此时var语句的变量之间和with语句的变量语句之间的相关系数不给出,只给出两组变量之间的相关系数。

Partial语句指明偏相关变量。 3、glm过程 一般格式为: proc glm 选项;

model 因变量=自变量/选项;

model语句定义模型和需要输出的统计数。

另外,nlin过程可用于非线性回归分析,orthoreg过程可对病态数据进行比较精确的估计。 三、实验任务

 基础实验部分:数学软件sas命令操作 1、变量x和y的观测值如下,

x 0.10 0.30 0.40 0.55 0.70 0.80 0.95 y 15 18 19 21 22.6 23.8 26 绘制x和y的散点图。 2、变量x和y的观测值如下,

x 820 780 720 867 690 787 934 679 639 820 y 165 158 130 180 134 167 186 145 120 158 试作直线回归。

3、变量x和y的观测值以及频数如下, 1.5 4.5 3 1.6 4.55 2 1.8 4.82 4 2.5 5.5 1 3.2 6.18 2 试作直线回归。

4、变量x和y的观测值如下,

x 1.58 9.98 9.42 1.25 0.30 2.41 11.01 1.85 6.04 5.92 y 180 28 25 117 165 175 40 160 120 80

试作x和y之间的相关系数。 探索实验部分:

5、下列数据是1957年美国旧轿车价格的调查资料,x表示轿车使用年数,y表示相应的平均价格,求y关于x的回归方程。(提示:先绘制散点图)

X 1 2 3 4 5 6 7 8 9 10 Y 2651 1943 1494 1087 765 538 484 290 226 204 应用实验部分:

6、下列数据是18个5—8岁儿童的重量(这是容易测量的)和体积(这是难以测量的)。 重量x千克 17.1 10.5 13.8 15.7 11.9 10.4 15.0 16.0 17.8 15.8 体积y立方分米 16.7 10.4 13.5 15.7 11.6 10.2 14.5 15.8 17.6 15.2 重量15.1 12.1 18.4 17.1 16.7 16.5 15.1 15.1 体积14.8 11.9 18.3 16.7 16.6 15.9 15.1 14.5 试求重量和体积的线性回归方程。 四、实验过程 1、data a1; input x y@@; cards;

0.10 15 0.30 18 0.40 19 0.55 21 0.70 22.6 0.80 23.8 0.95 26 ; proc plot; plot y*x; run;

输出散点图如下:

2、data a2; input x y@@; cards;

820 165 780 158 720 130 867 180 690 134 787 167 934 186 679 145 639 120 820 158 ; proc reg; model y=x; run;

输出结果为: Model: MODEL1 Dependent Variable: Y

Analysis of Variance Sum of Mean

Source DF Squares Square F Value Prob>F Model 1 3737.41063 3737.41063 60.197 0.0001 Error 8 496.637 62.08617 C Total 9 4234.10000

Root MSE 7.87948 R-square 0.8827 Dep Mean 154.30000 Adj R-sq 0.8680 C.V. 5.10660

Parameter Estimates Parameter Standard T for H0:

Variable DF Estimate Error Parameter=0 Prob > |T| INTERCEP 1 -17.357456 22.243147 -0.780 0.4581 X 1 0.2214 0.02859949 7.759 0.0001 上面对回归进行方差分析和t检验,概率为0.0001<0.05,说明回归系数b(y=a+bx)与 0有显著差异。

回归方程为:y=-17.357456+0.2214x 3、data a3; input x y w@@; cards; 1.5 4.5 3 1.6 4.55 2 1.8 4.82 4 2.5 5.5 1 3.2 6.18 2 porc reg; model y=x; weight w; run;

上面程序中weight语句表示权系数变量,此处有可用freq代替。程序的输出结果为: Model: MODEL1 Dependent Variable: Y

Analysis of Variance Sum of Mean

Source DF Squares Square F Value Prob>F Model 1 4.30681 4.30681 1857.307 0.0001

Error 3 0.00696 0.00232 C Total 4 4.31377

Root MSE 0.04815 R-square 0.9984 Dep Mean 4.97833 Adj R-sq 0.9978 C.V. 0.96728

Parameter Estimates Parameter Standard T for H0:

Variable DF Estimate Error Parameter=0 Prob > |T| INTERCEP 1 3.006381 0.04782167 62.867 0.0001 X 1 0.994262 0.02307060 43.096 0.0001

上面对回归进行方差分析和t检验,概率为0.0001<0.05,说明回归系数b(y=a+bx)与 0有显著差异。

回归方程为:y=3.006381+0.994262x 4、data a4; input x y@@; cards;

1.58 180 9.98 28 9.42 25 1.25 117 0.30 165 2.41 175 11.01 40 1.85 160 6.04 120 5.92 80 ; proc corr; var x y; run;

输出结果为:

Correlation Analysis 2 'VAR' Variables: X Y Simple Statistics

Variable N Mean Std Dev Sum Minimum Maximum X 10 4.9760 4.0395 49.7600 0.3000 11.0100

Y 10 109.0 61.9480 1090.0 25.0000 180.0 Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0 / N = 10 X Y X 1.00000 -0.92010 0.0 0.0002 Y -0.92010 1.00000 0.0002 0.0

结果表明,x和y的相关系数为-0.92010,两者之间是负相关。相关系数下面的数据是对H0:ρ=0检验结果的概率值。概率为0.0002,拒绝H0,认为该相关系数有统计意义。 5、先绘制散点图, data a5; input x y@@; cards;

1 2651 2 1943 3 1494 4 1087 5 765 6 538 7 484 8 290 9 226 10 204 ; proc plot; plot y*x; run;

得到x和y之间的散点图如下:

从上图可以看出,y和x之间呈现出指数关系,于是我们可以采用指数回归模型

令,,则

,化成了线性回归问题。

Data a52; Input x y@@; X1=x; Y1=log(y); Cards;

1 2651 2 1943 3 1494 4 1087 5 765 6 538 7 484 8 290 9 226 10 204 ; proc reg; model y1=x1; run;

上面程序输出结果为: Model: MODEL1 Dependent Variable: Y1

Analysis of Variance Sum of Mean

Source DF Squares Square F Value Prob>F Model 1 7.31063 7.31063 1048.194 0.0001 Error 8 0.05580 0.00697 C Total 9 7.362

Root MSE 0.08351 R-square 0.9924 Dep Mean 6.52734 Adj R-sq 0.9915 C.V. 1.27944

Parameter Estimates Parameter Standard T for H0:

Variable DF Estimate Error Parameter=0 Prob > |T| INTERCEP 1 8.1585 0.05705055 143.111 0.0001

X1 1 -0.297680 0.00919453 -32.376 0.0001

得到y1和x1的回归方程为:y1=8.1585-0.29768x1,而且知道回归效果是高度显著的。 Y和x之间的回归方程为: Y=exp(y1)=3514.26exp(-0.29768x)

6、(1)问题分析,体重看成是自变量,体积是因变量,利用回归分析过程求解。 (2)data a6; input x y@@; cards;

17.1 16.7 10.5 10.4 13.8 13.5 15.7 15.7 11.9 11.6 10.4 10.2 15.0 14.5 16.0 15.8 17.8 17.6 15.8 15.2 15.1 14.8 12.1 11.9 18.4 18.3 17.1 16.7 16.7 16.6 16.5 15.9 15.1 15.1 15.1 14.5 ; proc reg; model y=x; run;

输出结果为: Model: MODEL1 Dependent Variable: Y

Analysis of Variance Sum of Mean

Source DF Squares Square F Value Prob>F Model 1 94.09987 94.09987 2311.5 0.0001 Error 16 0.65124 0.04070 C Total 17 94.75111

Root MSE 0.20175 R-square 0.9931 Dep Mean 14.72222 Adj R-sq 0.9927 C.V. 1.37037

Parameter Estimates

Parameter Standard T for H0:

Variable DF Estimate Error Parameter=0 Prob > |T| INTERCEP 1 -0.104046 0.31199786 -0.333 0.7431 X 1 0.988052 0.02054924 48.082 0.0001 得到回归方程为:y=-0.104046+0.988052x 五、思考与提高

1、 如何由sas系统进行预测。 2、如何使用sas系统进行抛物线拟合。 3、如何实现逐步回归。 六、练习内容

1、变量x和y的观测值如下, x 10.0 15.0 20.0 25.0 30.0 y 25.2 29.8 31.2 31.7 32.8 绘制x和y的散点图。 2、变量x和y的观测值如下, x 300 400 500 600 700 800 y 40 50 55 60 67 70 试作直线回归。

3、变量x和y的观测值以及频数如下, 1.1 3.21 3 1.6 4.19 2 2.0 4.98 4 2.5 6.10 1 3.5 8.10 2 试作直线回归。

4、变量x和y的观测值如下,

x 1.7 1.9 1.9 1.9 2.1 2.3 2.5 2.7 2.9

y 65 65 85 95 75 65 75 95 105 试作x和y之间的相关系数。

5、槲寄生是一种寄生在大树上部树支上的寄生植物。它喜欢寄生在年轻的大树上。下面给出了在一定条件下完成的试验中采集的数据,试分析大树年龄和每株大树上槲寄生株数的关系(提示:先绘制散点图) 大树年龄X 3 3 3 4 4 4 9 9 9 15 15 15 40 40 槲寄生株数Y 28 33 22 10 36 24 15 22 10 6 14 9 1 1

6、炼钢是个氧化脱碳的过程。因为钢液含碳量x与精炼时间y有一定的关系,现将某平炉共炼34炉钢记录下来的含碳量x与精炼时间y的数据列如下表:

精炼时间含碳量x(%) y(分) 1.80 1.04 1.34 1.41 2.04 1.50 1.20 1.51 1.47 1.45 1.41 1.44 1.90 1.90 1.61 1.65 1.54 200 100 135 125 235 170 125 135 155 165 135 160 190 210 145 195 150 精炼时间含碳量x(%) y(分) 1.16 1.23 1.51 1.10 1.08 1.58 1.07 1.80 1.27 1.15 1.91 1.90 1.53 1.55 1.77 1.77 1.43 100 110 180 130 110 130 115 240 135 120 205 220 145 160 185 205 160 编 号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 编 号 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 试分析y与x的相互关系。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 7swz.com 版权所有 赣ICP备2024042798号-8

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务