您好,欢迎来到爱go旅游网。
搜索
您的当前位置:首页第七章 习题及答案

第七章 习题及答案

来源:爱go旅游网
第七章 相关与回归分析

一、单项选题题

1、当自变量X减少时,因变量Y随之增加,则X和Y之间存在着( ) A、线性相关关系 B、非线性相关关系 C、正相关关系 D、负相关关系

2、下列属于函数关系的有( )

A、身高与体重之间 B、广告费用支出与商品销售额之间 C、圆面积与半径之间 D、施肥量与粮食产量之间 3、下列相关程度最高的是( )

A、r=0. B、r=-0.93 C、r=0.928 D、r=0.8 4、两变量x与y的相关系数为0.8,则其回归直线的判定系数为( ) A、0.80 B、0.90 C、0. D、0.50 5、在线性回归模型中,随机误差项被假定服从( )

A、二项分布 B、t分布 C、指数分布 D、正态分布

6、物价上涨,销售量下降,则物价与销售量之间的相关属于( ) A、无相关 B、负相关 C、正相关 D、无法判断 7、相关分析中所涉及的两个变量( )

A、必须确定哪个是自变量、哪个是因变量 B、都不能为随机变量 C、都可以是随机变量 D、不是对等关系 8、单位产品成本y(元)对产量x(千件)的回归方程为:yt1000.2xt,其中“—0.2”的含义是( )

A、产量每增加1件,单位成本下降0.2元 B、产量每增加1件,单位成本下降20%

C、产量每增加1000件,单位成本下降20% D、产量每增加1000件,单位成本平均下降0.2元 E、产量每增加1000件,单位成本平均下降20% 二、多项选择题

1、下列说法正确的有( )

A、相关分析和回归分析是研究现象之间相关关系的两种基本方法 B、

相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况 C、回归分析可以不必确定变量中哪个是自变量,哪个是因变量 D、相关分析必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量 E、相关分析中所涉及的变量可以都是随机变量,而回归分析中因变量是随机的,自变量是非随机的 2、判定现象之间有无相关关系的方法有( )

A、计算回归系数 B、编制相关表 C、绘制相关图 D、计算相关系数 E、计算中位数

3、相关关系按相关的形式可分为( )

A、正相关 B、负相关 C、线性相关 D、非线性相关 E、复相关

4、在直线回归方程yt=1+2Xt中,回归系数2的数值( )

A、表明两变量之间的平衡关系 B、其正、负号表明两变量之间的相关方向 C、表明两变量之间的密切程度 D、表明两变量之间的变动比例 E、在数学上称为斜率

5、下列那些项目属于现象完全相关( )

A、r=0 B、r= —1 C、r= +1 D、y的数量变化完全由X的数量变化所确定 E、r=0.98

6、在回归分析中,要求所涉及的两个变量x和y( )

A、必须确定哪个是自变量、哪个是因变量 B、不是对等关系 C、是对等关系

D、一般来说因变量是随机的,自变量是非随机变量 E、y对x的回归方程与x对y的回归方程是一回事 7、下列有相关关系的是( )

A、居民家庭的收入与支出 B、广告费用与商品销售额 C、产量与单位产品成本 D、 学生学习的时间与学习成绩 E、学生的身高与学习成绩

8、可决系数r2=86.49%时,意味着( )

A、自变量与因变量之间的相关关系密切 B、因变量的总变差中,有80%可

通过回归直线来解释 C、因变量的总变差中,有20%可由回归直线来解释 D、相关系数绝对值一定是0.93 E、相关系数绝对值一定是0. 三、填空题

1、相关系数r的取值范围为 。 2、可决系数的取值范围为 。

3、客观现象之间的数量联系存在着两种不同的类型:一种是 关系;另一种是 关系。

4、已知r=0.90,x=20,y=40,又知y是x的3倍,则Y对X的回归直线方程为 。

5、若已知(xx)2是(yy)2的2倍,(xx)(yy)是(yy)2的1.2倍,则相关系数r等于 。 四、判断题

1、当自变量X按一定的数量变化时,因变量Y也相应随之等量变化,则X和Y之间存在着线性相关关系。( )

2、可决系数是判断回归模型拟合优度优劣最常用的数量指标,但不是最佳指标。( )

3、样本相关系数是总体相关系数的一致估计量。( )

4、若有线性回归方程Y(元)=34.5+7.8X(元),则表明当X增加一元时,Y增加7.8元。( )

5、若有线性回归方程Y(元)=160-52.5X(件),则表明当X增加一件时,Y平均减少52.5元。( )

6、可决系数越大,则模型对样本的拟合程度越差。( ) 7、可决系数r2=0时,SSE=SSR。( ) 8、数学上可以证明,S2e=

2tn2是2的无偏估计。( )

9、回归估计标准误S越小,表明实际观测点与所拟合的样本回归线的离差程度越大,即回归线的代表性较差。( )

10、r=0时,表明两个变量之间不存在任何形式的相关关系。( ) 11、对于简单线性回归模型,相关系数r的平方等于可决系数。( ) 12、变量间的相关关系也就是函数关系。( )

13、逻辑上没有关系,但却在数值上相互依存的相关关系称为“伪相关”。( ) 14、最小二乘法估计的样本回归直线yt=1+( )

15、所有样本观测点全部在最小二乘法估计的样本回归直线yt=1+( )

16、最小二乘法适用的前提是Y与X之间的关系确为Y=a+bX。( ) 17、对于可划为线性模型的非线性回归问题,一般先划为线性模型,然后再用最小二乘法估计参数。( )

18、一元线性回归方程的回归系数2的符号与相关系数的符号完全一致。正号表示正相关,负号表示负相关。( )

19、Y倚X的回归方程与X倚Y的回归方程是一回事。( )

20、r=0时,只是表明两变量之间不存在线性相关关系,有可能存在非线性相关关系。( )

21、相关分析中,所涉及的两个变量都可以是随机变量。( ) 22、相关系数是在所有情况下,用来说明两个变量相关关系密切程度的统计分析指标。( )

23、两个变量中不论假定哪个变量为自变量X,哪个变量为因变量Y,都只能计算出一个相关系数。( )

五、简答题

1、试举例说明什么是相关关系?什么是函数关系? 2、试述回归分析中误差项的标准假定。

3、什么是单相关、复相关和偏相关?什么是线性相关和非线性相关?请各举一个你熟悉的例子说明。

4、相关分析与回归分析之间的联系与区别?

2Xt一定通过点(X,Y)。

2Xt上。

六、计算分析题

1、某商店想了解职工工龄长短与月工资的关系,调查了10名售货员的工龄和月工资情况。设工龄为X(年),月工资为Y(元)。经计算,已得到以下结果: x=70,

y=0, x2=532 ,y2=42816, xy=47

要求:(1)计算相关系数r;(2)拟合以月工资为因变量的直线回归方程,并指出其回归系数的意义;(3)计算判定系数,并评价拟合优度。

2、设销售收入X为自变量,销售成本Y为因变量。现根据某百货公司10个月的有关资料计算出以下数据:(单位:万元)

(Xt-X)2=4250, X=6.5, (Yt-Y)2=2620, Y=5.5, -Y)(Xt-X)=3300

(Yt要求;(1)计算简单相关系数,拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释;(2)计算可决系数和回归估计标准误差;(3)对2进行显著性水平为5%的显著性检验。

3、从某大学统计系的学生中随机抽取16人,对数学和统计学的考试成绩(单位:分)进行调查,结果如下: 学生编号 1 2 3 4 5 6 7 8 数学成绩 统计学成绩 学生编号 81 90 91 74 70 73 85 60 72 90 96 68 82 78 81 71 9 10 11 12 13 14 15 16 数学成绩 统计学成绩 83 81 77 60 66 84 70 78 94 68 66 58 87 82 46 要求:(1)根据上表数据绘制散点图,判断数学考试成绩与统计学考试成绩之间的关系形态;(2)计算数学考试成绩与统计学考试成绩之间的简单相关系数;(3)

对相关系数的显著性进行检验(取=0.05),并说明数学考试成绩与统计学考试成绩之间的关系密切程度;(4)拟合统计学考试成绩对数学考试成绩的回归直线;(5)对回归方程的线性关系和回归系数进行显著性检验(取=0.05);(6)确定数学考试成绩为80分时,统计学考试成绩置信度为95%的预测区间。

4、某企业生产某种产品的产量和单位成本资料如下:

月 份 产量(千件) X 单位成本(元/件) Y 1 4 73 2 6 72 3 8 71 4 7 72 5 8 70 6 9 69 要求:(1)计算简单相关系数;(2)确定单位成本对产量的一元线性回归模型,并指出其回归系数的意义;(3)对该模型拟合优度进行评价;(4)分别对回归系数2及回归方程进行显著性水平为5%的显著性检验;(5)计算估计标准误差,并以95%的置信度求产量为10000件时单位成本的预测区间。

5、随机抽取某地12个居民家庭为样本,调查得到有关人均收入与食品支出的资料如下:

单位:元

编号 1 2 3 4 5 6 7 8 9 10 11 家庭人均生活费收入 82 93 105 130 144 150 160 180 200 270 300 人均食品支出 75 85 92 105 120 120 130 145 156 200 200 12 400 220 要求:(1)分析判断人均生活费收入与人均食品支出之间是否存在相关关系?其相关程度如何?

(2)检验其相关系数(=0.05);

(3)拟合适当的回归模型,并对该模型的拟合优度作出评价。

6、在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关。现对给定时期内的价格与需求量进行观察,得到如下一组数据: 价格x (元) 需求量y(吨) 10 60 6 72 8 70 9 56 12 55 11 57 9 57 10 53 12 7 70 要求:(1)计算价格与需求量之间的简单相关系数;

(2)拟合需求量对价格的回归直线,并解释回归系数的实际意义; (3)计算判定系数r2和估计标准误S,分析回归直线的拟合程度;

(4)对回归方程的线性关系和回归系数进行显著性检验(取=0.05),并对结果作简要分析。

7、某农业科学院研究院在土质、面积、种子完全相同的条件下。测得8块试验田种植的小麦产量Y(千克)与化肥施用量X(千克)的数据如下表:

小麦产量Y(千克) 266 化肥施用量X(千克) 15 340 18 356 21 372 24 3 27 404 30 420 33 435 36 要求:(1)建立小麦产量Y对化肥施用量X的直线回归方程; (2)求方差2的无偏估计(即求S2); (3)检验回归效果是否显著(取=0.05) (4)求X=40千克时,小麦产量Y的预测区间。

8、从某项n=20的资料中已经求得: x=124.00(m2); y=67.80(千元); Lxx=(xx)2=2080; Lyy=(yy)2=71.20; Lxy=(xx)(yy)=296.00

要求:(1)计算相关系数r;(2)估计回归系数1、2; (3)计算估计标准误差。

9、已知两个变量,即亩产量(y)和施肥量(x)。假定两变量间存在线性关系,并已知:n=10,x=27, y=380, xy=985.5, x=101.2,y=12995,

222(yy)

t2=337,t=t0.10=1.86

22要求:(1)建立亩产量对施肥量的线性方程,并说明回归系数的含义; (2)计算估计标准误S,并说明其含义;

(3)计算相关系数r及判定系数r2,并说明其含义;

(4)当施肥量Xf=35时,试以90%的置信度预测亩产量的区间。

10、下面是7个地区2000年的人均GDP和人均消费水平的统计数据:

地 区 北京 辽宁 上海 江西 河南 贵州 陕西 人均GDP(元) 22460 11226 347 4851 44 2662 49 人均消费水平(元) 7326 4490 116 2396 2208 1608 2035 要求:(1)以人均GDP做自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态;

(2)计算两个变量之间的线性相关关系,说明两个变量之间的关系强度; (3)利用最小二乘法求人均消费水平对人均GDP的线性回归方程,并解释回归系数的实际意义;

(4)计算判定系数,并解释其意义;

(5)检验回归方程线性关系的显著性(=0.05);

(6)如果某地区的人均GDP为5000元,预测其人均消费水平(点预测); (7)求人均GDP为5000元时,人均消费水平在95%置信水平下的预测区间。 *11、某农场通过试验取得早稻收获量与春季降雨和春季温度的如下数据: 收获量(公斤/公顷)y 降雨量(mm)x1 温度(℃)x2 1500 2300 3000 4500 4800 5000 5500 25 6 33 8 45 10 105 13 110 14 115 16 120 17 要求:确定早稻收获量对春季降雨和春季温度的二元线性回归方程,并解释回归系数的实际含义。

第七章 参 一、单项选择题

1、D 2、C 3、B 4、C 5、D 6、B 7、C 8、D 二、多项选择题

1、ABE 2、BCD 3、CD 4、BCDE 5、BCD 6、ABD 7、ABCD 8、ABD 三、填空题

1.21、-1≤r≤+1 2、0≤ r2 ≤1 3、函数 相关 4、-14+2.7X 5、

2四、判断题

1、√ 2、√ 3、√ 4、× 5、√ 6、× 7、× 8、√ 9、× 10、× 11、√ 12、× 13、√ 14、√ 15、× 16、√ 17、√ 18、√ 19、× 20、√ 21、√ 22、× 23、√

五、1、答:相关关系是指当一个或几个相互联系的变量取一定值时,与之相对应的另一变量的值虽然不确定,但它仍按一定规律在一定范围内变化。相关关系是一种非确定性的关系。例如收入与支出的关系。函数关系是指当一个或几个变量取一定的值时,另一个变量有确定值与之相对应。函数关系是一种确定性的关系。例如圆面积与半径之间的关系。

2、答:在回归分析中,对误差项共有五条标准假定:(1)误差项的期望值为0;(2)误差项的方差为常数;(3)误差项之间不存在序列相关关系,其协方差为0;(4)自变量是给定的变量,与随机误差项线性无关;(5)随机误差项服从正态分布。

3、答:单相关,是指两个现象的相关,即一个变量对另一个变量的相关关

系,例如销售量与销售价格之间的关系;复相关,是一个变量对两个或两个以上其它变量的相关关系,例如商品销售量与销售价格及其广告支出额之间的关系;偏相关,是指在某一现象与多种现象相关的场合,当假定其它变量不变时,其中两个变量的相关关系,例如假定销售价格不变,商品销售量与广告支出额之间的关系。

当两种相关现象之间的关系大致呈现为线性关系时,称之为线性相关,例如居民收入与储蓄之间的关系;当两种相关现象之间的关系不表现为线性关系而是近似于某种曲线方程的关系,称为非线性相关,例如失业率和通货膨胀率之间的关系。

4、答:所谓回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。所谓相关分析,就是用一个指标来表明现象间相互依存关系的密切程度和方向。相关分析和回归分析有着密切的联系,它们不仅有共同的研究对象,而且在具体应用时互相补充。相关分析依靠回归分析表明现象数量相关的具体形式,回归分析依靠相关分析表明现象数量变化的相关程度。相关分析与回归分析都是定量分析的手段。

相关分析和回归分析在研究目的和方法上有明显区别。(1)相关分析研究变量之间相关的方向和相关的程度,不指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分析研究变量之间相互关系的具体形态,选择一个合适的数学模型,从而为估算和预测提供一个重要的方法。(2)相关分析中的变量不必区分哪个是自变量,哪个是因变量,可以都是非随机的;而回归分析要确定哪个是自变量,哪个是因变量,一般而言因变量是随机的,自变量是非随机的。

六、计算题 1、解:(1)r =

nxyxynx(x)222ny(y)222

=

104770010532(70)1042816(0)=0.9814

(2)2=(10×47-70×0)/(10×532-702)=6.5238

1=(0/10)-6.5238×(70/10)=18.3334

yt =18.3334+6.5238 xt

回归系数表示:工龄每增加一年,月工资将平均增加6.5238元。 (3)判定系数r2=(0.9814)2=0.9631, 这说明在月工资的总变差中,有96.31%可由工龄与月工资之间的线性关系来解释,二者之间有较强的线性关系,回归直线拟合的较好。

2、解:(1)r =

(xx)(yy)=

22(xx)(yy)3300=0.98

425026202=(xx)(yy)3300==0.7765 24250(xx)=5.5-0.7765×6.5=0.4528

yt =0.4528+0.7765 xt

回归系数表示:销售收入每增加一万元,销售成本将平均增加0.7765万元。 (2)r2=0.982=0.9779 由r2=1-S=

SSE,推出SSE=57.902 SSTSSE57.902==2.69(万元) n2102(3)回归系数的检验: H0:2=0, H1:20 t=

220S=

0.7765S=0.7765÷(2.69/4250)=18.82

2i(xx)2t=18.82>t=2.306,拒绝H0,回归系数显著。

23、解:(1)略;(2)r =0.78476;(3)t=4.737> t=2.1448,r 显著;(4)

2yt =5.422+0.9427xt ;(5)F=2.4445>F

=4.60,回归关系显著;

t=4.737>t=2.1448,回归系数显著;(6)预测区间:[61.9;99.7]分。

224、解:(1)x=42, y=427, x2=310 ,y2=30399, xy=2977 n=6 r=

nxyxynx(x)22ny(y)22=-0.9115

nxyxyˆ(2)2=-0.75 22nxxˆ1ynˆ=76.42 2xnyt =76.42-0.75xt,回归系数表示产量每增加1千件,单位成本平均下降

0.75元。

(3)r2=(-0.9115)2=0.8308,这说明在单位成本的总变差中,有83.08%可由产量与单位成本之间的线性关系来解释,二者之间有较强的线性关系,回归直线拟合的较好。

(4)对回归系数的检验: H0:2=0, H1:20 S=

y21y2xyn2=

3039976.42427(0.75)2977=0.32(元/件)

62S2S(xtx)0.32220.32x2(x)/n2

==0.08

310(42)/6t220S2=-0.75/0.08 =-9.375

|t|=9.375>t0.025(4)=2.77,拒绝原假设,表明产量对单位成本的影响是显著的

对回归方程的检验: H0:2=0, H1:20

r2(n2) F==19.65>F0.05(1,4)=7.71,拒绝H0,表明产量与单位成本之21r间的线性关系是显著的,回归方程有效

(5)S=

y21y2xyn2=0.32(元/件)

(xtx)2xt2(xt)2/n=310-(42×42)/6=16

21(xfx)Sef=S1=0.322n(xx)1(107)21616=0.2592

yf=76.42-0.75×10=68.92 预测区间为:

yft(n-2) Sef=68.922.77×0.2592

2即:[68.20;69.](元/件)

5、解:(1)r=0.97,人均生活费收入和人均食品支出之间存在高度正相关关系。

(2)t=

rn21r2=12.6>t0.025(10)=2.2281,r通过显著性检验。

(3)yt =46.56+0.492 x

拟合优度r2=0.9409,这说明在人均食品支出的总变差中,有94.09%可由

1人均生活费收入与人均食品支出之间的线性关系来解释,二者之间有较强的线性关系,回归直线拟合的较好。表明该回归模型是合适的。

6、解:(1)r =-0.85375

(2)yt =.74-3.1209xt,回归系数表示价格每增加1元,需求量平均下降3.1209吨。

(3)r2=(-0.85375)2=0.72,这说明在需求量的总变差中,有72.%可由价格与需求量之间的线性关系来解释,二者之间有较强的线性关系,回归直线拟合的较好。

估计标准误S=4.0269(吨)。S数值不大,说明回归直线拟合的较好。 (4)线性关系的检验: H0:2=0, H1:20 计算检验统计量:F=SSE=y-2S回/1=(SSR/1)÷(SSE/n-2)

S残(/n2)2y-xy=36968-.74×604-(-3.1209)×55

=129.7276 由r2=1-

SSE,推出SST=SSE/(1-r2)=129.7276/(1-0.72)=478.523 SSTSSR=SST-SSE=478.523-129.7276=348.79

F=(348.79/1)÷(129.7276)/(10-2)=21.5094

r2(n2)0.728(或:F===21.5094)

1r210.72检验统计量F=21.5094>F0.05(1,8)=5.32,拒绝H0,说明需求量与价格之间的线性关系是显著的。

回归系数的检验: H0:2=0, H1:20

检验统计量︴t︴=4.6753>t0.025=2.3060, 拒绝H0,回归系数显著,即价格对需求量的影响是显著的。

7、解:(1)x=204, y=2982, x2=5580, xy=78657,n=8

y2=1131638

nxyxy8786572042982ˆ2==6.92 22285580204nxxˆ1ynˆ=2xn2982204=196.29 6.9288小麦产量Y对化肥施用量X的直线回归方程为:yt =196.29+6.92 x (2)2的无偏估计: S2=

e2tn2n2n21131638196.2929826.92786571994.78==332.46 826=

(yy)=y2t21y2xy

(3)H0:2=0, H1:20 根据已知数据计算得 SST=y2t(yt)2n298221131638=20097.5,

8SSE=et21994.78

SSR=SST-SSE=20097.5-1994.78=18102.72, F=

S回/1=(SSR/1)÷(SSE/n-2)=18102.72÷(1994.78/6)=.45

S残(/n2)F=.45>F0.05(1,6)=5.99,拒绝原假设,说明Y对X的回归效果非常显著。

(4)yf=196.29+6.92 ×40=473.09,t0.025(6)=2.4469,

(xx)x22(x)2n20425580=378

8S=

y21y2xyn2=

1131638196.2929826.9278657

82=18.23

1121(xfx)1(4025.5)2Sef=S1=18.23×1=23.

8378n(xx)2预测区间为:yft(n-2) Sef=473.092.4469×23.

2即:[415.25,530.93] 8、解:(1)r=

LxyLxxLyy=0.7692

(2)2=

LxyLxx=0.1423

=67.8-0.1423×124=50.18 (3)SST= Lyy=(yy)2=71.20 由r2=1-S=

SSESSE,得:0.76922=1-,SSE=29.07 SST71.2SSE=1.27(千元) n29、解:

22(1)2= xy/x=985.5/101.2=9.7381 =380-9.7381×

27=117.0713

yt =117.0713+9.7381xt

回归系数表明:施肥量每增加1个单位,亩产量将平均增加9.738个单位。

2et337=65.09,表明y的实际观察值与其估计值之

tn2102(2)S=

间的平均离差为65.09个单位。

(3)r = xy/xy=0.8594;r=0.7386,表明在亩产量的总变差中,有73.86%可以由施肥量同亩产量的依存关系来解释,只有26.14%属于随机因素的影响。因此,这条回归直线是基本合适的。

(4)yf=117.0713+9.7381 ×35=457.9048,t0.05(8)=1.86,

22210101.21012 (xx)2nx2et337=65.09, n2102S=

Sef=S1=70.2019

1=65.09×2n(xx)(xfx)21(3527)21101012

预测区间为:yft(n-2) Sef=457.90481.86×70.2019

2即:[327.33;588.48]

10、解:(1)散点图(略),二者之间为高度的正相关关系。 (2)r =0.998128,二者之间为高度的正线性相关关系。

(3)估计的回归方程为:yt =734.6928+0.308683 xt。回归系数

2=0.308683表示人均GDP每增加1元,人均消费水平将平均增加0.308683元。

(4)判定系数r2=0.996259。表明在人均消费水平的变差中,有99.6259%是由人均GDP决定的。

(5)检验统计量F=1331.692>F=6.61,拒绝原假设,线性关系显著。 (6)y5000=734.6928+0.308683×5000=2278.1078(元) (7)预测区间:[1580.463;2975.750]元。

*11、解:(此题供参考,借此了解偏回归系数的含义)

yt=-0.394+14.924 x1+218.447 8x2,2=14.924表示假定温度不变,

降雨量每增加1mm,早稻产量将平均增加14.924公斤/公顷;3=218.4478表示假定降雨量不变,温度每增加1℃,早稻产量将平均增加218.4478公斤。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- igat.cn 版权所有 赣ICP备2024042791号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务