1统计量与抽样分布
1。1基本概念:统计量、样本矩、经验分布函数
总体X的样本X1,X2,…,Xn,则T(X1,X2,…,Xn)即为统计量 样本均值X
1n2样本方差Sn(XiX)
ni1修正样本方差S*2n21n(XiX) n1i121nk样本k阶原点矩AkXi,(k1,2,...)
ni11nk样本k阶中心矩Bk(XiX),(k1,2,...)
ni1经验分布函数Fn(x)vn(x),(x) 其中Vn(x)表示随机事件{Xx}出现的次n1数,显然Vn(x)~B(n,F(x)),则有E[Fn(x)]F(x) D[Fn(x)]F(x)[1F(x)]
n2ESn补充:
n1*2DX ESnDX EX2DX(EX)2 n
1n2SXiX2
ni12n 二项分布B(n,p):
EX=np DX=np(1-p) 泊松分布P():
kkP{Xk}Cnp(1p)nk,(k0,1,...,n)
P{Xk}kk!e,(k0,1,...)
EX DX
均匀分布U(a,b): f(x)1,(axb) baEXab1(ba)2 DX212f(x)ex,(x0)F(x)1ex,(x0)
指数分布:
EX1 DX12
正态分布N(,): f(x)2nSn21(x)2exp{} EX DX2 2222nSnn122(n1)4E(2)n1ES D(2)2(n1)DSn2 nn22n当0时,EX0 EX EX3 EX2244 DX(1)2
221。2统计量:充分统计量、因子分解定理、完备统计量、指数型分布族 T是θ的充分统计量f(x1,x2,...,xnTt)与θ无关 T是θ的完备统计量要使E[g(T)]=0,必有g(T)=0
L()f(xi;)h(x1,x2,...,xn)g(T(x1,x2,...,xn);)且h非负T是θ的充分统计量
i1nf(x;)C()exp{b()T(x,x,...,x)}h(x,x,...,x)T是θ的充分完备统计量
i12n12ni1nnf(x;)C()exp{b()T(x,x,...,x)b()Ti1112n2i12(x1,x2,...,xn)}h(x1,x2,...,xn)
(T1,T2)是(1,2)的充分完备统计量
1.3抽样分布:分布,t分布,F分布,分位数,正态总体样本均值和方差的分布,非正态总体样本均值的分布
2分布:XX...X~(n) f(x)2221222n21n2()2n2exx2n12(x0)
E2n D22n
T分布:TXn~t(n) 当n>2时,ET=0 DT
n2Y/nXF分布:Fn1n2Y~F(n1,n2)
1F(n2,n1) F补充:
Z=X+Y的概率密度fz(z)的联合概率密度
f(x,zx)dxf(zy,y)dy f(x,y)是X和Y
YZ的概率密度fz(z)f(x,xz)xdx
Xyg(x)的概率密度fy(y)fx(g1(y))[g1(y)]'
函数:()0x1exdx (1)() (n)(n1)!,(1)1
B函数:B(,)10x1(1x)1dx B(,)()()
()1.4次序统计量及其分布:次序统计量、样本中位数X、样本极差R X(k)的分布密度:fx(k)(x)n![F(x)]k1[1F(x)]nkf(x),(k1,2,...,n)
(k1)!(nk)!X(1)的分布密度:fx(1)(x)nf(x)[1F(x)]n1 X(n)的分布密度:fx(n)(x)nf(x)[F(x)]n1
2参数估计
2。1点估计与优良性:概念、无偏估计、均方误差准则、相合估计(一致估计)、渐近正态估计
的均方误差:MSE(,)E()2D(E)2
若是无偏估计,则MSE(,)D
对于的任意一个无偏估计量,有DD,则是的最小方差无偏估计,记MVUE 相合估计(一致估计):limEn limDn0
nn**2。2点估计量的求法:矩估计法、最大似然估计法 矩估计法:
① 求出总体的k阶原点矩:akEXkxkdF(x;1,2,...,m)
1nk② 解方程组akXi (k=1,2,.。。,m),得kk(X1,X2,...,Xn)即为所求
ni1最大似然估计法:
① 写出似然函数L()m
② 解似然方程得到i(x1,x2,...,xn),即最大似然估计i(X1,X2,...,Xn) i=1,2,。。.,
i1nf(xi;),求出lnL及似然方程
lnL0 i=1,2,。。。,
im
补充:
似然方程无解时,求出的定义域中使得似然函数最大的值,即为最大似然估计 2。3MVUE和有效估计:最小方差无偏估计、有效估计
T是的充分完备统计量,是的一个无偏估计E(|T)为的惟一的MVUE 最小方差无偏估计的求解步骤:
① 求出参数的充分完备统计量T
② 求出ETg(),则g1(T)是的一个无偏估计
或求出一个无偏估计,然后改写成用T表示的函数 ③ 综合,E[g(T)T]g(T)是的MVUE
或者:求出的矩估计或ML估计,再求效率,为1则必为MVUE
11*[g'()]2T是g()的一个无偏估计,则满足信息不等式D[T(X)],其中
nI()2lnf(X;)lnf(X;)或I()E 0,f(X;)为样本的联合分布。I()E2最小方差无偏估计达到罗-克拉姆下界有效估计量效率为1 无偏估计的效率:e()21D
nI()是的最大似然估计,且是的充分统计量是的有效估计
2。4区间估计:概念、正态总体区间估计(期望、方差、均值差、方差比)及单侧估计、非正态总体参数和区间估计 一个总体的情况:X~N(,)
22已知,求的置信区间:X00*nn~N(0,1)X00nu
2未知,求的置信区间:2
X0Sni~t(n1)X02*Snnt(n1)
2已知,求2的置信区间:
(Xi1n)2~2(n)(Xi122ni)2(n)2(Xi11ni)2
2(n)2未知,求2的置信区间:
(X
i1niX)22~2(n1)(Xi122niX)2(n1)2(Xi1niX)2
212(n1)22两个总体的情况:X~N(1,1),Y~N(2,2) 212,2均已知时,求
12的区间估计:
XY(12)
21n122~N(0,1)XY(12)12n122n2u
2n221222未知时,求12的区间估计:
XY(12)*2(n11)S1*2n1(n21)S2n2n1n2(n1n22)~t(n1n22)
n1n2121,2未知时,求2:
2
*2S2n212S*21n122~F(n21,n11)S1*n1S*22n2212S1nF(n21,n11)2*F(n21,n11) 12S2n22122*2非正态总体的区间估计:
SXL当n时,N(0,1)Xnu
Snnn2Snlim1n,故用Sn代替Sn—1
Sn1m1mm ~N(0,1)u1nnnn1mm21nnnXmn3统计决策与贝叶斯估计
3.1统计决策的基本概念:三要素、统计决策函数及风险函数
三要素:样本空间和分布族、行动空间(判决空间)、损失函数L(,d) 统计决策函数d(X):本质上是一个统计量,可用来估计未知参数 风险函数:R(,d)E[L(,d(X))]是关于的函数
3。2贝叶斯估计:先验分布与后验分布、贝叶斯风险、贝叶斯估计
① 求样本X=(X1,X2,。.。,Xn)的分布:q(x|)f(x|)
ii1n② 样本X与的联合概率分布:f(x,)h(|x)m(x)q(x|)() ③ 求f(x,)关于x的边缘密度m(x)f(x,)d
④
的后验密度为:h(|x)2f(x,)
m(x)取L(,d)(d)时
的贝叶斯估计为:E(|x)h(|x)d
R(,d)E(d)2贝叶斯风险为:
RB(d)E[R(,d)]E(d)2h(|x)d取L(,d)()(d)时,贝叶斯估计为:补充:
2E[()|x]
E[()|x]C()的贝叶斯估计:取损失函数L(,d)(C()d)2,则贝叶斯估计为
C()E[C()|x]C()h(|x)d
E(|x)h(|x)df(x,)m(x)df(x,)df(x,)d
3.3minimax估计
对决策空间中的决策函数d1(X),d2(X),.。。,分别求出在上的最大风险值maxR(,d)
在所有的最大风险值中选取相对最小值,此值对应的决策函数就是最小最大决策函数.
4假设检验
4。1基本概念:零假设(H0)与备选假设(H1)、检验规则、两类错误、势函数 零假设通常受到保护,而备选假设是当零假设被拒绝后才能被接受。
检验规则:构造一个统计量T(X1,X2,...,X3),当H0服从某一分布,当H0不成立时,T的偏大偏小特征。据此,构造拒绝域W 第一类错误(弃真错误):P{TW|H0为真} 第二类错误(存伪错误):P{TW|H0为假} 势函数:()E((X))P{XW}(X)1,XW.
0,XW.当0时,()为犯第一类错误的概率 当1时,1()为犯第二类错误的概率
4。2正态总体均值与方差的假设检验:t检验、X2检验、F检验、单边检验 一个总体的情况:X~N(,)
22已知,检验H0:0H1:0:U2未知,检验H0:0H1:0:TX00*nnn~N(0,1)
X0Sn~t(n1)
已知,检验H0:202H1:202:2(Xi1ni)22~2(n)
未知,检验H0:202H1:202:2(Xi1iX)2~2(n1)
222两个总体的情况:X~N(1,1),Y~N(2,2) 21222未知时,检验H0:12H1:12:
TXY*2(n11)S1*2n1(n21)S2n2n1n2(n1n22)~t(n1n22)
n1n2S1*n1S*22n2222H1:1221,2未知时,检验H0:122:F~F(n11,n21)
2单边检验:举例说明,已知,检验H0:0H1:0:
构造U1X~N(0,1),给定显著性水平,有P{U1u}。当H0成立
0nX0defX时U1U,因此P{Uu}P{U1u}。故拒绝域为
0n0nW{Uu}
4.3非参数假设检验方法:拟合优度检验、科尔莫戈罗夫检验、斯米尔诺夫检验
2(Ninpi0)22拟合优度检验:H0:pipi0H1:pipi0 W{(mr1)}
npi0i12m其中Ni表示样本中取值为i的个数,r表示分布中未知参数的个数
科尔莫戈罗夫检验:H0:F(x)F0(x)H1:F(x)F0(x) 实际检验的是Fn(x)F0(x)
W{limsupFn(x)F0(x)Dn,}
nx斯米尔诺夫检验:H0:F(x)G(x)H1:F(x)G(x) 实际检验的是Fn(x)Gn(x)
W{limsupFn1(x)Gn2(x)Dn1,n2,}
nx4。4似然比检验
明确零假设和备选假设:H0:0H1:1
supL(x1,...,xn;)L1(x1,...,xn)构造似然比:
L0(x1,...,xn)supL(x1,...,xn;)0拒绝域:W{(x1,...,xn)}
5方差分析
5。1单因素方差分析:数学模型、离差平方和分解、显著性检验、参数估计
Xijiij2数学模型ij~N(0,),(i=1,2,。。。,m;j=1,2,。。。,ni)
各ij相互总离差平方和QTH0:12...n
(Xi1j1mnimniijX)2
QTQEQA
组内离差平方和QE(XijXi)2 E(i1j1mQE)2 nrQA)2 r1组间离差平方和QAni(XiX)2
i1当H0成立时,E(QA构造统计量F(r1)(nr)QEQA~F(r1,nr),当H0不成立时,有偏大特征 QEXiXk~N(ik,(112Q))且E~2(nr) 2ninkTXiXk(ik)(11)QEnink~t(nr)
应用:
' 若原始数据比较大而且集中,可减去同一数值XijXijk再解题 mmni1mni1ni22 辅助量:P(Xij),Q(Xij),RXij2
ni1j1i1nij1i1j1QAQP,QERQ,QTRP
5。2两因素方差分析:数学模型、离差平方和分解、显著性检验
XijiiijH01:12...n2数学模型ij~N(0,),(i=1,2,..。,r;j=1,2,.。.,s)
H02:12...n各ij相互总离差平方和QT(Xi1j1rsijX)2
QTQEQBQA
组内离差平方和QE2(XXXX)iji••ji E(i1j1mniQE)2
(r1)(s1)因素B引起的离差平方和QBr(X•jX)2 当H0成立时,E(j1rsQB)2 s1因素A引起的离差平方和QA2s(Xi12X) 当H0成立时,E(i•QA)2 r12rsrs1rs1s1r2辅助量:PXij,QIXij,QIIXij,RXij
ni1j1i1sj1j1ri1i1j12QAQIP,QBQIIP,QERQIQIIP
QA(r1)QAF~F(r1,(r1)(s1))AQE(r1)(s1)QE构造统计量:
FQB(s1)QA~F(s1,(r1)(s1))BQ(r1)(s1)QEE6回归分析
6。1一元线性回归:回归模型、未知参数的估计(β、α、σ2)、参数估计量的分布(βα
Y0σ2σ*2)
Yixii2回归模型:i~N(0,)i=1,2,。。。,n。
各相互i的估计:(,)2)~N(,n(xx)(YY)ii(xix)2i1ni12 分布: (,)(xix)2(x)2~N(,[1i1])nnYxn(xix)2i12
的估计:21nn(Y221n2222iY)((xix))SnYSnx
i1ni1E2n22*2n E2
6。2多元线性回归:回归模型、参数估计、分布
YiXii回归模型:2i~N(0,In) i=1,2,.。。,n.
各i相互参数估计:XTY(XTX)(XTX)1XTY
7多元分析初步
7。1定义及性质:定义、性质
X~Np(,)其中为X的均值向量,为X的协方差矩阵
Y=CX+b,则Y~Np(Cb,CCT)
def若0,刚(X)1(X)~2(p)
7。2参数的估计与假设检验:μ、Σ的估计、正态总体均值向量的假设检验
样本均值向量X1nnTnXi 样本离差阵S(XkX)(XkX)
i1k1最大似然估计X Sn 最小方差无偏估计X S(n1) X~N(,1n1Tn) SYYii
i1n(X0)T1(X0)~2(p)
Fnp[n(n1)(X0)TS1(X0)]2~F(p,np) (n1)2mnmn(XY)T1(XY)~2(p) mnFmn(mnp1)(XY)TS1(XY)
p(mn)(mn2)