R语言判别分析实验报告
班级:应数1201 学号: 姓名:麦琼辉
时间:2014年11月28号
1实验目的及要求
1) 了解判别分析的目的和意义; 2) 熟悉R语言中有关判别分析的算法基础。 2实验设备(环境)及要求 个人计算机一台,装有R语言以及RStudio并且带有MASS包。 3实验内容 企业财务状况的判别分析 4实验主要步骤 1) 数据管理:实验对21个破产的企业收集它们在前两年的财务数据,对25个财务良好的企业也收集同一时期的数据。数据涉及四个变量:CF_TD(现金/总债务);NI_TA(净收入/总资产);CA_CL(流动资产/流动债务);CA_NS(流动资产/净销售额),一个分组变量:企业现状(1:非破产企业,2:破产企业)。 2) 调入数据:对数据复制,然后在RStudio编辑器中执行如下命令。 case5=read.table(‘clipboard’,head=T) head(case5) 3) Fisher判别效果(等方差,线性判别lda):采用Bayes方式,即先验概率为样本例数,相关的RStudio程序命令如下所示。
library(MASS)
ld=lda(G~.,data=case5);ld#线性判别 ZId=predict(ld)
addmargins(table(case5$G,ZId$class))
4) Fisher判别效果(异方差,非线性判别--二次判别qda):再次采用Bayes方式,相关的RStudio
程序命令如下所示。
library(MASS)
精心整理
qd=qda(G~.,data=case5);qd#二次判别 Zqd=predict(qd)
addmargins(table(case5$G,Zqd$class))
5实验结果
表1线性判别lda效果
新分类
原分类
12合计
1 24 1 25 2 3 18 21 合计 27 19 46 符合率 91.30% 由表1和表2可知,qda表2二次判别qda效果 别)的效果比lda(一次判原分类 新分类 6实验小结 12合计 1 24 1 25 通过本次实验了解了2 2 19 21 并熟悉R语言中有关判别合计 26 20 46
符合率 93.50%
(二次判别---非线性判别)要好。 判别分析的目的和意义,分析的算法基础。
因篇幅问题不能全部显示,请点此查看更多更全内容