数理统计基础

一般地,将随机变量大写,将观测值(随机变量的取值)小写,将参数的估计量加一尖(如β^\hat\beta),统计中一般是站在抽样前的立场上看,当随机变量观测之后大写也随着变成了小写。

总体:一个问题所研究的全部元素的集合
个体:总体之中的每个元素
样本:个体的指标值(X1,X2,,Xn)(X_1,X_2,\cdots,X_n)
样本容量(Sample Size):样本中所包含的个体数n
样本观测值:对某次抽样观测得到(X1,X2,,Xn)(X_1,X_2,\cdots,X_n)的一组确定值(x1,x2,,xn)(x_1,x_2,\cdots,x_n)
样本空间:样本(X1,X2,,Xn)(X_1,X_2,\cdots,X_n)可能取值的全体,记为X\mathscr X,它可以是n维空间,也可以是其中的一个子集,样本的一次观测值(x1,x2,,xn)(x_1,x_2,\cdots,x_n)就是样本空间的一个点(x1,x2,,xn)X(x_1,x_2,\cdots,x_n)\in\mathscr X
设总体X具有分布函数F(x),(X1,X2,,Xn)F(x),(X_1,X_2,\cdots,X_n)为取自总体的大小为n的样本,则(X1,X2,,Xn)(X_1,X_2,\cdots,X_n)的联合分布函数为i=1nF(xi)\prod_{i=1}^nF(x_i)
统计量:设(X1,X2,,Xn)(X_1,X_2,\cdots,X_n)是来自总体X的一个样本,T=T(x1,x2,,xn)T=T(x_1,x_2,\cdots,x_n)是样本空间X\mathscr X上的实值函数,若T(X1,X2,,Xn)T(X_1,X_2,\cdots,X_n)也是随机变量,且不依赖于任何未知参数则T(X1,X2,,Xn)T(X_1,X_2,\cdots,X_n)为统计量(Statistics).

X¯=1ni=1nXi,S2=1n1i=1n(XiX¯)2\bar X=\frac{1}{n}\sum_{i=1}^nX_i,\quad S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar X)^2
为样本均值和样本方差,称统计量
Ak=1ni=1nXik,Bk=1n(XiX¯)kA_k=\frac{1}{n}\sum_{i=1}^nX_i^k,\quad B_k=\frac{1}{n}(X_i-\bar X)^k
为样本的k阶(原点)矩,和样本的k阶中心矩,样本的二阶中心矩B2B_2有时也记为Sn2S_n^2

常用关系:(下面将i=1n\sum_{i=1}^n简记为\sum)
(XiX¯)2=(Xi2+X¯22X¯Xi)=Xi2+nX¯22X¯Xi=Xi2nX¯2\begin{aligned} \sum(X_i-\bar X)^2=& \sum(X_i^2+\bar X^2-2\bar XX_i)\\ =& \sum X_i^2+n\bar X^2-2\bar X\sum X_i\\ =&\sum X_i^2-n\bar X^2 \end{aligned}
将总体的期望和方差记为μ,σ2\mu,\sigma^2,即:
E(X)=μ,var(X)=σ2E(X)=\mu,\quad var(X)=\sigma^2
(var是方差的现代记法)

多元正态分布

若随机向量X的联合分布密度函数为:
f(x)=1(2π)n2B12exp(12(xa)B1(xa))f(x)=\frac{1}{(2\pi)^{\frac{n}{2}}|B|^{\frac{1}{2}}}\exp{(-\frac{1}{2}(x-a)'B^{-1}(x-a))}
其中B为正定阵,则称随机向量X所服从的分布为多元正态分布,简记为XNn(a,B)X\sim N_n(\mathbf a,B)

记法:设X=(X1,X2,,Xn),Y=(Y1,Y2,,Yn)X=(X_1,X_2,\cdots,X_n)',Y=(Y_1,Y_2,\cdots,Y_n)'是两个随机向量,Z=(Zij)r×sZ=(Z_{ij})_{r\times s}为随机矩阵,记:
E(X)=(E(X1),,E(Xn)),E(Z)=(E(Zij))r×sE(X)=(E(X_1),\cdots,E(X_n)),\quad E(Z)=(E(Z_{ij}))_{r\times s}
var(X)=E((XE(X))(XE(X)))var(X)=E((X-E(X))(X-E(X))')
ρij=cov(Xi,Xj)var(Xi)var(Xj)\rho_{ij}=\frac{cov(X_i,X_j)}{\sqrt{var(X_i)var{(X_j)}}}
XiX_iXjX_j之间的线性相关系数,简称相关系数。

cov(X,Y)=(cov(Y,X))=E((XE(X))(YE(Y)))cov(X,Y)=(cov(Y,X))'=E((X-E(X))(Y-E(Y))')

E(X)称为X的数学期望(均值),var(X)或cov(X,X)称为X的协方差阵,cov(X,Y)称为X和Y的协方差阵。

n元正态分布的性质:

统计量的分布称为抽样分布(Sampling Distribution),它与样本的分布不同。

(正态总体抽样分布定理)
(X1,X2,,Xn)(X_1,X_2,\cdots,X_n)是取自正态总体N(μ,σ2)N(\mu,\sigma^2)的一个样本,则:

(总体方差未知) T=X¯μSnt(n1)T=\frac{\bar X-\mu}{S}\sqrt n\sim t(n-1)

(两个正态总体)设(X1,,Xn1)(X_1,\cdots,X_{n_1})是取自正态总体N(μ1,σ12)N(\mu_1,\sigma_1^2)的一个样本,(Y1,,Yn2)(Y_1,\cdots,Y_{n_2})是取自正态总体N(μ2,σ22)N(\mu_2,\sigma_2^2)的一个样本,且两个样本相互独立,则:

参数估计

估计量(Estimator):直接用于估计参数的统计量,记作θ^\hat\theta
估计值(Estimate):将观测值代人估计量得到的一个具体数值
估计(Estimation):将估计量和估计值的总称。
矩估计(Moment Estimation):当样本很大时,经验分布函数与总体分布函数十分近似,因而样本矩在一定程度上反映总体矩的特征。(K.Pearson,1902)
将总体的矩用相应样本的矩替换。
步骤:

  1. 将总体k阶矩写成参数的形式
  2. 将总体k阶矩用样本k阶矩代替
  3. 反解出参数

极大似然估计(Maximum Likelihood Estimator,MLE,ML估计):认为出现概率最大的事件发生(C.F.Gauss 1821,R.A.Fisher 1922)
似然(Likelihood):当某组观测值是依赖于一些参数的某一特定概率分布得到时,出现这组观测值的概率
步骤:

  1. 写出样本的联合分布--似然函数
  2. 取对数,求极值。

估计量的优良性准则

定义:设T为可估函数g(θ)g(\theta)的无偏估计量,若对于任意的θΘ\theta\in\Theta,和g(θ)g(\theta)的任意无偏估计量T,都有
var(T1)var(T)var(T_1)\le var(T)
则称T1T_1g(θ)g(\theta)的一致最小方差无偏估计量(Uniformly Minimum Variance Unbiased Estimator,UMVUE)

定理:设T(X)T(X)g(θ)g(\theta)的无偏估计,var(T(X))<,var(T(X))\lt\infty,T(X)T(X)为UMVUE的充要条件是
φ(X)U0,cov(φ(X),T(X))=0E(φT)=0\forall \varphi(X)\in U_0,cov(\varphi(X),T(X))=0\iff E(\varphi T)=0
proof.proof.
必要性:设T(X)T(X)g(θ)g(\theta)的UMVUE,φ(X)U0,λR\forall \varphi(X)\in U_0,\lambda\in R
φ(X)=λφ(X)+T(X)U,\varphi'(X)=\lambda\varphi(X)+T(X)\in U,
var(T(X))var(λφ(X)+T(X)),(T(X)isUMVUE)var(T(X))\le var(\lambda\varphi(X)+T(X)),(\because T(X) is UMVUE)
λ2var(φ(X))+2λcov(φ(X),T(X))0\therefore \lambda^2var(\varphi(X))+2\lambda cov(\varphi(X),T(X))\ge 0
λR\lambda\in R的任意性知:cov(φ(X),T(X))=0,θΘcov(\varphi(X),T(X))=0,\forall \theta\in\Theta

充分性:设φ(X)U0,cov(φ(X),T(X))=0,θΘ\forall \varphi(X)\in U_0,cov(\varphi(X),T(X))=0,\forall \theta\in\Theta,要证T(X)T(X)g(θ)g(\theta)的UMVUE,若φ(X)U,T(X)φ(X)U0\varphi'(X)\in U,T(X)-\varphi'(X)\in U_0,由假设条件得:
cov(T(X)φ(X),T(X))=0cov(X,Y)=E(XY)EXEYE(Tφ(X))T(X)=0E(T2)E(Tφ)=0\begin{aligned} & cov(T(X)-\varphi'(X),T(X))=0\\ & \because cov(X,Y)=E(XY)-EXEY\\ & E(T-\varphi'(X))T(X)=0\\ & E(T^2)-E(T\varphi')=0 \end{aligned}
由Schwarz不等式知:
E2T2=E2(Tφ)ET2Eφ2E^2T^2=E^2(T\varphi')\le ET^2E\varphi'^2
ET2Eφ2\therefore ET^2\le E\varphi'^2
ET=Eφ=g,varX=EX2E2XET=E\varphi'=g,varX=EX^2-E^2X
varTvarφvarT\le var\varphi'
φU\varphi'\in U的任意性可知,T是g的UMVUE