您好,欢迎来到爱go旅游网。
搜索
您的当前位置:首页统计学R语言实验

统计学R语言实验

来源:爱go旅游网
.

实验5 R绘图(二)

一、实验目的:

1. 熟练掌握描述性统计分析中常用的统计量; 2. 掌握R语言的高水平作图命令; 3. 掌握R语言的低水平作图命令;

4. 掌握多元数据的三个数据特征:均值向量、协方差矩阵、相关系数矩阵。

二、实验内容:

练习: 要求:①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。④修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,...。如文件名为“13053109张立1”,表示学号为13053109的张立同学的第1次实验,注意文件名中没有空格及任何其它字符。最后连同数据文件、源程序文件等(如果有的话,本次实验没有),一起压缩打包发给课代表,压缩包的文件名同上。 截图方法:

法1:调整需要截图的窗口至合适的大小,并使该窗口为当前激活窗口(即该窗口在屏幕最前方),按住键盘Alt键(空格键两侧各有一个)不放,再按键盘右上角的截图键(通常印有“印屏幕”或“Pr Scrn”等字符),即完成截图。再粘贴到word文档的相应位置即可。 法2:利用QQ输入法的截屏工具。点击QQ输入法工具条最右边的“扳手”图标,选择其中的“截屏”工具。)

1. 自行完成教材P130页开始的3.3-3.4节中的例题。

2. (习题3.5)小白鼠在接种了3种不同菌型的伤寒杆菌后的存活天数如下表所示,

试绘出数据的箱线图(采用两种方法,一种是plot语句,另一种是boxplot语句)来判断小白鼠被注射3种菌型后的平均存活天数有无显著性差异?

白鼠试验数据

菌型 1 2 3 2 5 7 4 6 3 8 2 5 6 4 7 存活天数 7 9 7 5 2 5 2 5 6 4 3 10 10 7 12 12 6 11 6 10 6 注:平均存活天数其实应该是均值,但当不知道总体的分布时,通常是比较中位数。因此,这里考虑用箱线图中的中位数来进行比较。

解:源代码:

y<-c(2,4,3,2,4,7,7,2,2,5,4, 5,6,8,5,10,7,12,12,6,6, 7,11,6,6,7,9,5,5,10,6,3,10)

f<-factor(c(rep(1,11),rep(2,10),rep(3,12))) plot(f,y)

.

.

A<-c(2,4,3,2,4,7,7,2,2,5,4) B<-c(5,6,8,5,10,7,12,12,6,6) C<-c(7,11,6,6,7,9,5,5,10,6,3,10) boxplot(A,B,C) 运行截图:

结论:

从箱线图中可以看到,菌型2和3的平均存活天数无显著差异,但是与菌型1的有显著差异

3. (习题3.6)绘出习题3.16关于3项指标的离散图,从图中分析例3.16的结论的

合理性。

序号 硬度X1 变形X2 弹性X3 1 2 3 4 5 6 7 8 9 10 65 70 70 69 66 67 68 72 66 68 45 45 48 46 50 46 47 43 47 48 27.6 30.7 31.8 32.6 31.0 31.3 37.0 33.6 33.1 34.2 注:1.绘出的图形类似教材P133页的图3.8。 2. 把上述表格分复制到记事本中即可实现表格转化为文本,再用read.table()函数存入到数据框中即可,避免输入麻烦。

.

.

解:源代码:

> df<-read.table(\"例3.6_data\ header=T) > df

> pairs(df)

运行截图:

结论:

具有相关关系的两个变量的散点图要么是从左下角到右上角(即正相关关系),要么是从左上角到右下角(即负相关关系)。但从上图可知所有的图中都没有这样的趋势,故均不相关。

4. (习题3.7)某校测得19名学生的四项指标,性别、年龄、身高(cm)和体重(lb),

具体数据如下表所示。

(1) 试绘出体重对于身高的散点图;

(2) 绘出不同性别情况下,体重与身高的散点图;(coplot(a~b|c))

.

.

(3) 绘出不同年龄段的体重与身高的散点图;

(4) 绘出不同性别和不同年龄段的体重与身高的散点图。(coplot(a~b|c+d))

学号 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 姓名 Alice Becka Gail Karen Kathy Mary Sandy Sharon Tammy Alfred Duke Guido James Jeffrey John Philip Robert Thomas William 性别 F F F F F F F F F M M M M M M M M M M 年龄 13 13 14 12 12 15 11 15 14 14 14 15 12 13 12 16 12 11 15 身高 56.5 65.3 .3 56.3 59.8 66.5 51.3 62.5 62.8 69.0 63.5 67.0 57.3 62.5 59.0 72.0 .8 57.5 66.5 体重 84.0 98.0 90.0 77.0 84.5 112.0 50.5 112.5 102.5 112.5 102.5 133.0 83.0 84.0 99.5 150.0 128.0 85.0 112.0

解:源代码:

> ef<-read.table(file.choose(),header=T);ef > attach(ef)

> plot(体重~身高)

> coplot(体重~身高|性别) > coplot(体重~身高|年龄)

> coplot(体重~身高|年龄+性别)

运行截图:

.

.

.

.

.

.

4222

5. (习题3.8)画出函数z = x − 2xy + x − 2xy + 2y + 9x/2 − 4y + 4 在区域 −2

≤ x ≤ 3,−1 ≤ y ≤ 7上的三维网格曲面和二维等值线,其中x与y各点之间的间隔为0.05,等值线的值分别为0, 1, 2, 3, 4, 5, 10, 15, 20, 30, 40, 50, 60, 80, 100,共15条。(注:在三维图形中选择合适的角度)

解:源代码:

x<-seq(-2,3,0.05) y<-seq(-1,7,0.05)

f<-function(x,y) x^4-2*x^2*y+x^2-2*x*y+2*y^2+9*x/2-4*y+4 z<-outer(x,y,f)

contour(x,y,z,levels=c(0, 1, 2, 3, 4, 5, 10, 15, 20, 30, 40, 50, 60, 80, 100),col=\"black\")

> persp(x,y,z,theta=30,phi=30,expand=0.7,col=\"lightblue\") 运行截图:

.

.

6. (习题3.9)用Pearson相关检验法检验习题3.7中的身高与体重是否相关。

解:源代码:

cor.test(身高,体重) 运行截图:

结论:

其P值为7.887e-07<0.05,拒绝原假设,认为变量身高与体重相关。

7. (习题3.10)绘出例3.17中48号求职者数据的星图。(数据见文档最后)

(1) 以15项自变量FL,APP,…,SUIT为星图的轴; (2) 以G1,G2,…,G5为星图的轴。(提示:先) 通过这些星图,能否说明应选哪6名应聘者。为使星图能够充分反映应聘者的情况,在作图中可适当调整各种参数。

提示:第(2)小题,先利用教材P153页的公式,计算出48个求职者这5个变量的值,公式如下:

G1<-(SC+LC+SMS+DRV+AMB+GSP+POT)/7

.

.

G2<-(FL+EXP+SUIT)/3 G3<-(LA+HON+KJ)/3 G4<-AA G5<-APP

再将G1,…,G5这5个列向量(即48行5列数据)赋值一个新的数据框,再按第(1)小题的方法绘出星图。

解:源代码:

> X<-read.csv(\"applicant.csv\") > stars(X) > attach(X)

> X$G1<-(SC+LC+SMS+DRV+AMB+GSP+POT)/7 >X$G2<-(FL+EXP+SUIT)/3 > X$G3<-(LA+HON+KJ)/3 > X$G4<-AA > X$G5<-APP

>rt<-scale(X[,17:21]) >stars(rt)

运行截图:

.

.

思考:

1. R语言的高水平作图函数与低水平作图函数的主要区别是什么?

所谓高水平函数是与低水平作图函数相对应的,即所有的绘图函数均可产生图形,可以有坐标轴,以及图和坐标轴的说明文字。

2. plot()函数除了能画出散点图外,还能画什么图?能画出曲线图吗?

曲线图,箱线图;能

3. 多元数据主要有哪三个数据特征指标?

均值向量、协方差矩阵、相关系数矩阵 4. 相关检验的原假设是什么?

总体X,Y不相关

5. 多元数据的图形表示方法主要有哪几种图?

轮廓图,星图,调和曲线图

三、实验小结(必写,但字数不限)

本次实验,主要是在星图方面有些阻碍,用不同的函数读取的结果会不一样,有时还读不出来,最终还是把数据存入excel中,才能成功。要学会描述性统计分析中常用的统计量,高水平作图函数与低水平图函数的区别。

.

.

附:

48名应聘者的得分情况

ID FL APP AA LA SC LC 1 2 3 4 5 6 7 8 9 6 9 7 5 6 7 9 9 9 7 10 8 6 8 7 9 9 9 7 7 7 9 9 8 9 7 8 7 8 8 8 10 8 9 8 10 3 3 6 5 3 3 4 7 8 9 9 2 5 3 8 8 7 8 9 7 5 8 6 5 8 6 8 8 8 8 7 HON SMS EXP DRV AMB GSP POT KJ SUIT 8 9 9 9 9 10 8 8 8 7 3 7 9 8 10 8 8 6 5 10 10 10 10 10 9 8 10 5 0 10 10 10 10 8 9 8 8 7 8 10 7 2 5 5 8 8 5 10 9 8 4 2 2 9 6 4 4 5 5 10 10 10 3 2 5 0 0 3 3 3 3 1 0 2 9 9 3 5 4 8 8 9 10 10 9 3 5 2 4 5 7 8 6 3 4 2 3 3 3 2 2 3 3 0 0 1 2 2 2 1 1 2 1 1 8 9 9 4 5 6 8 9 8 10 9 8 4 2 5 8 7 3 2 6 6 10 9 9 4 4 5 3 4 3 5 5 2 3 0 2 3 2 9 9 9 5 5 5 10 10 9 10 10 8 5 6 3 7 8 6 6 7 7 8 9 7 4 5 6 3 4 3 5 3 3 3 2 4 9 10 7 8 8 8 8 8 8 9 8 10 8 10 4 6 6 6 6 7 8 9 8 10 10 9 4 6 7 0 0 2 3 7 6 3 3 5 7 8 5 8 6 7 8 6 9 9 8 9 10 10 7 7 6 8 6 2 3 8 8 8 9 9 4 5 6 0 0 2 4 5 4 2 1 6 5 5 7 8 8 6 7 6 8 9 8 3 2 3 6 5 4 6 7 6 5 8 5 10 10 10 5 7 6 10 10 10 10 5 7 8 6 6 10 8 4 4 9 8 10 9 9 6 4 8 8 9 8 8 5 4 7 8 9 8 10 4 11 4 12 4 13 6 14 8 15 4 16 6 17 8 18 6 19 6 20 4 21 3 22 9 23 7 24 9 25 6 26 7 27 2 28 6 29 4 30 4 31 5 32 3 33 2 34 3 35 6 36 9 37 4 38 4 10 2 10 0 10 4 8 8 8 6 7 8 8 7 6 7 7 7 7 7 7 5 4 5 4 5 5 6 4 5 6 6 10 10 10 8 10 10 4 3 4 9 5 8 8 9 8 10 9 10 5 4 9 3 0 4 4 9 9 3 0 6 10 5 9 7 7 7 4 4 8 8 8 9 6 5 8 9 8 7 8 8 9 9 10 8 10 8 10 8 5 5 4 5 5 7 8 5 5 5 5 6 3 5 4 6 5 0 0 3 3 2 2 2 3 3 2 2 10 8 7 8 9 3 3 6 7 7 7 4 3 5 4 6 4 5 8 5 3 9 8 7 7 3 3 6 10 8 9 9 .

.

39 10 6 40 10 6 41 10 7 42 10 3 43 3 44 7 45 9 46 9 47 0 48 0 4 7 6 8 7 6 9 9 8 8 9 7 10 9 10 9 0 0 8 6 2 1 2 9 7 10 10 1 1 4 8 7 9 0 0 10 10 2 0 5 8 10 10 10 10 10 10 0 0 3 6 2 3 0 0 10 10 10 10 6 8 1 1 0 0 10 10 2 0 2 8 5 5 2 2 8 10 0 0 1 10 5 7 2 2 10 10 3 0 3 8 7 9 0 0 10 10 0 0 3 8 8 9 0 0 10 10 10 10 0 0 3 6 4 4 0 0 10 10 8 5 5 4 0 0 10 9 10 10 7 10 3 10 1 5 5

.

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- igat.cn 版权所有 赣ICP备2024042791号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务