验证数据是否满⾜正态分布——Q-Q图和P-P图
Q-Q图
Q-Q图是⼀种散点图,对应于正态分布的Q-Q图,就是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图. 要利⽤QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在⼀条直线附近,⽽且该直线的斜率为标准差,截距为均值. ⽤QQ图还可获得样本偏度和峰度的粗略信息.
Q-Q图可以⽤于检验数据的分布,所不同的是,Q-Q图是⽤变量数据分布的分位数与所指定分布的分位数之间的关系曲线来进⾏检验的。P-P图和Q-Q图的⽤途完全相同,只是检验⽅法存在差异
由于P-P图和Q-Q图的⽤途完全相同,只是检验⽅法存在差异。要利⽤QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在⼀条直线附近,⽽且该直线的斜率为标准差,截距为均值. ⽤QQ图还可获得样本偏度和峰度的粗略信息.
这篇⽂章是关于Q-Q图的程序设计:
有个关于Q-Q图和P-P图的R语⾔例⼦:n=100
a=rnorm(n) #产⽣100个正态随机变量
p=pnorm(a) #求正态分布函数值(正态累积概率)t=rank(a)/n#求观察累积概率q=qnorm(t) #求分位数值plot(p,t)#画P-P图 plot(a,q) #画Q-Q图
有关分位数的概念:
分位数 quantile fractile
分位数⼜称百分位点,或者下侧分位数。
定义
设连续随机变量X的为F(X),密度函数为p(x)。那么,对任意0
若概率0
Za)=α的实数。 分位数有三种不同的称呼,即α分位数、上侧α分位数与双侧α分位数,它们的定义如下:
当随机变量X的分布函数为 F(x),实数α满⾜0 <α<1 时,α分位数是使P{X< xα}=F(xα)=α的数xα, 上侧α分位数是使P{X >λ}=1-F(λ)=α的数λ,
双侧α分位数是使P{X<λ1}=F(λ1)=0.5α的数λ1、使 P{X>λ2}=1-F(λ2)=0.5α的数λ2 如t分布的分位数表,⾃由度f=20和α=0.10时的双侧分位数为正负1.7247。