常用统计量:
1、样本均值:Xˉ=1n∑ni=1XiXˉ=1n∑i=1nXi.
2、样本方差:S2=1n?1∑ni=1(Xi?Xˉ)2S2=1n?1∑i=1n(Xi?Xˉ)2.
统计量的分布——四大分布:
1、正态分布:
X~N(μ,σ2)X~N(μ,σ2), 期望:EX=μEX=μ, 方差:DX=σ2DX=σ2, 标准化:X?μσ2~N(0,1)X?μσ2~N(0,1).
2、χ2χ2分布:
若X1,X2,...Xn~N(0,1)X1,X2,...Xn~N(0,1),则
X=∑i=1nX2i~χ2(n),自由度为n
X=∑i=1nXi2~χ2(n),自由度为n
EX=n,DX=2n
EX=n,DX=2n
χ2χ2分布标题
3、t分布(学生分布):
若X~N(0,1)X~N(0,1),若Y~χ2(n)Y~χ2(n),且X,YX,Y相互独立:
t=XYn√~t(n),自由度为n.
t=XYn~t(n),自由度为n.
t分布
4、F分布:
若X~χ2(n1)X~χ2(n1),若Y~χ2(n2)Y~χ2(n2),且X,YX,Y相互独立:
F=X/n1Y/n2~F(n1,n2)自由度n1,n2.
F=X/n1Y/n2~F(n1,n2)自由度n1,n2.
F分布
上αα分位数:
P(U≥uα)=αP(U≥uα)=α,uαuα为上αα分位数.
通过查表可得到αα(概率密度函数的面积)对应的uαuα(分位值)的值.
上αα分位数
置信度(置信水平)、置信区间:
P(|Xˉ?μ|<δ)=1?α,1?αP(|Xˉ?μ|<δ)=1?α,1?α为置信度, αα为显著性水平,人为选取.
大样本情况下, 由中心极限定理可知:
不论Xi~iidF(μ,σ2)(任意分布)Xi~iidF(μ,σ2)(任意分布),有
∑i=1nXi~n→∞N(nμ,nσ2)
∑i=1nXi~n→∞N(nμ,nσ2)
XˉXˉ与S2S2相互独立, 且EXˉ=μ,DXˉ=1nσ2,ES2=σ2EXˉ=μ,DXˉ=1nσ2,ES2=σ2.
下面就可以根据样本统计量得到关于被估计参数测量值的分布情况:
S2=1n?1∑i=1n(Xi?Xˉ)2
S2=1n?1∑i=1n(Xi?Xˉ)2
(n?1)S2σ2=∑i=1n(Xi?Xˉσ)2~χ2(n?1)
(n?1)S2σ2=∑i=1n(Xi?Xˉσ)2~χ2(n?1)
Xˉ?μS/n√=Xˉ?μσ/nS/σ=Xˉ?μσ/n√(n?1)S2/σ2n?1√~t(n?1).
Xˉ?μS/n=Xˉ?μσ/nS/σ=Xˉ?μσ/n(n?1)S2/σ2n?1~t(n?1).
到此, 得到了t分布, t分布为已知分布, 置信区间自然唾手可得:
P(∣∣∣Xˉ?μS/n√∣∣∣<δS/n√)=1?α
P(|Xˉ?μS/n|<δS/n)=1?α
P(|t|<tα2(n?1))=1?α
P(|t|<tα2(n?1))=1?α
δ=tα2(n?1)S/n√
δ=tα2(n?1)S/n
样本均值Xˉ=μXˉ=μ的概率为0, 但μμ落在会以置信度1?α1?α为概率落在置信区间(Xˉ?δ,Xˉ+δ)(Xˉ?δ,Xˉ+δ)上.