搜索
您的当前位置:首页正文

分布拟合检验

来源:爱go旅游网


分布拟合检验

1.检验数据是否服从正态分布

一、图示法

1、P-P图

以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。

2、Q-Q图

以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。

以上两种方法以Q-Q图为佳,效率较高。

3、直方图

判断方法:是否以钟形分布,同时可以选择输出正态性曲线。

4、箱式图

判断方法:观测离群值和中位数。

5、茎叶图

类似与直方图,但实质不同。

二、计算法

1、偏度系数(Skewness)和峰度系数(Kurtosis)

计算公式:

g1表示偏度,g2表示峰度,通过计算g1和g2及其标准误σg1及σg2然后作U检验。两种检验同时得出U0.05的结论时,才可以认为该组资料服从正态分布。由公式可见,部分文献中所说的“偏度和峰度都接近0……可以认为……近似服从正态分布”并不严谨。

2、非参数检验方法

非参数检验方法包括Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk (W 检验)。

SAS中规定:当样本含量n ≤2000时,结果以Shapiro – Wilk(W 检验)为准,当样本含量n >2000 时,结果以Kolmogorov – Smirnov(D 检验)为准。

SPSS中则这样规定:(1)如果指定的是非整数权重,则在加权样本大小位于3和50之间时,计算 Shapiro-Wilk 统计量。对于无权重或整数权重,在加权样本大小位于3 和 5000 之间时,计算该统计量。由此可见,部分SPSS教材里面关于“Shapiro – Wilk适用于样本量3-50之间的数据”的说法是在是理解片面,误人子弟。(2)单样本 Kolmogorov-Smirnov 检验可用于检验变量(例如income)是否为正态分布。

对于此两种检验,如果P值大于0.05,表明资料服从正态分布。

Matlab做正态性检验:

小样本正态分布的检验:lillietest ; [H,P,LSTAT,CV]=lillietest(X)

大样本正态分布的检验:jbtest ; [H,P,JBSTAT,CV]=jbtest(X,0.05)

2.检验数据是否服从泊松分布-2检验法

将n个观测数据分成 r 类: A1,…,Ar,每一类的观测个数不少于5;即对该总体作了

n 次观测,r 个类出现的频数分别为:n1,…,nr 且i1关于各类元素在总体中所占比率的假设

nrin。

H0: Ai所占的比率是pi0,i =1,…,r

r其中pi0已知,满足i1pi01。

H0成立时,对每一类Ai ,频率ni /n与概率pi0应较接近,即观测频数ni 与理论频数npi0 应相差不大。

英国统计学家K.Pearson提出如下检验统计量:

(ninpi0)2npi0i1

2r在H0成立时,对充分大的n

上述检验统计量近似服从自由度为r-1的2分布

22W{(r1)}对给定 ,拒绝域。

Matlab: x=poissrnd(5,2000,1);

[H,P,KSSTAT,CV] = kstest(X,[X,poisscdf(X,5)],0.05)

3.指数分布拟合检验-K-S检验(Kolmogorov-Smirnov检验):kstest

(Matlab下)

例 从一大批相同类型的元件中随机抽取10只做寿命试验,测得他们使用寿命(单位:h)为:

420 500 920 1380 1510 1650 1760 2100 2320 2350

试问:电子元件的寿命是否服从均值为1500的指数分布?(alpha=0.05)

程序:

X=[420 500 920 1380 1510 1650 1760 2100 2320 2350]';

[H,P,KSSTAT,CV] = kstest(X,[X,expcdf(X,1500)],0.05)

运行结果:

H = 0

P = 0.2700

KSSTAT =0.3015

CV = 0.4093

因篇幅问题不能全部显示,请点此查看更多更全内容

Top