概统复习整理

古典概率

和事件:并集 积事件:交集 差事件:AB={x:xA & xB} 互斥事件:AB= 互逆事件:A¯=B 独立事件:Pr(AB)=Pr(A)Pr(B)

贝叶斯定理:Pr(A|B)=Pr(B|A)Pr(A)Pr(B) 有关系:Pr(A|B)Pr(B)=Pr(B|A)Pr(A)=Pr(AB)

一维随机分布

基本离散分布

 说明概率期望方差
伯努利分布0-1分布Pr(0)=1-p,Pr(1)=ppp(1-p)
二项分布 B(n,p)n个0-1分布Pr(k)=Cnkpk(1p)nknpnp(1-p)
几何分布伯努利实验几次成功Pr(k)=(1-p)k-1pp-1p-2(1-p)
泊松分布 P(λ)连续化的二项分布Pr(k)=λke/k!λλ

说明: ♤ 当n很大p很小时,二项分布能够有泊松分布近似。 X~P(λ), Y~P(μ), X+Y~P(λ+μ)

分布函数(CDF):F(x)=Pr(Xx) 性质:单调、右连续 随机变量X有分布函数F(x),则导出的随机变量F(X)~U(0,1) 概率密度函数(PDF):f(x)=F'(x)

基本连续分布

 说明CDFPDF期望方差
均匀分布 U[a,b]a,b为两个边界(x-a)/(b-a)(b-a)-1(a+b)/2(b-a)/12
指数分布泊松事件时间差,
λ概率时间比
1-e-λtλe-λtλ-1λ-2
高斯分布 N[μ,σ] 12(1+erf(xμσ2))1σ2πexp((xμ)22σ2)μσ2

多维随机分布

分布函数(CDF):FX,Y(x,y)=Pr(Xx  Yy) 有关系:Pr(x<Xx  y<Yy)=F(x,y)+F(x,y)F(x,y)F(x,y) 概率密度函数(PDF):f(x,y)=Fxy(x,y)

边缘分布:多维随机分布中单个变量的分布 有关系:

FX(x)=FX,Y(x,+),   fX(x)=fX,Y(x,y)dy

条件分布:【离散】 当 Y=y 时X的分布(就是条件概率) 【连续】 当 y-dy<Y<y+dy 时X的分布 有关系:

fY|X(y|x0)=fX,Y(x0,y)fX(x0)

变量的独立性:FX|Y(x|y)=FX(x),  fX|Y(x|y)=fX(x),  fX,Y(x,y)=fX(x)fY(y) 注意x,y的取值范围。

随机变量的变换:

fX+Y(z)=Rf(zy,y)dy,   fYX(z)=R|x|f(x,xz)dx,   fXY(z)=Rf(x,zx)dxxN(μ1,σ12), yN(μ2,σ22)  x+yN(μ1+μ2,σ12+σ22)

数字特征

期望:E(Cx+y)=CEx+Ey x,y 独立时:E(xy)=Ex Ey

方差:Dx=E((xEx)2) 有关系:Dx=E(x2)(Ex)2 D(x+C)=Dx,   D(Cx)=C2Dx    当x,y相互独立时 D(x+y)=Dx+Dy 误差(方差)传递:Df(x)D(f(Ex)+f(Ex)(xEx))=[f(Ex)]2Dx

标准化变量 x=xExDx,  Ex=0,  Dx=1

切比雪夫不等式:Pr(|xEx|ϵ)Dx/ϵ2

协方差:Cov(x,y)=E[(xEx)(yEy)] 有关系:Cov(x,y)=E(xy)Ex Ey Cov(x,y)=Cov(y,x),  Cov(x,x)=Dx,  Cov(ax,by)=abCov(x,y) Cov(x+a,y)=Cov(x,y),  Cov(x+y,z)=Cov(x,z)+Cov(y,z) 当x,y相互独立时 Cov(x,y)=0 D(x±y)=Dx+Dy±2Cov(x,y)

独立多变量误差(方差)传递:Df(x,y)=[fx(Ex,Ey)]2Dx+[fy(Ex,Ey)]2Dy

相关系数:ρx,y=Cov(x,y)Dx Dy 当(x,y)分布再一条线上时 ρx,y=±1 只反映两个变量的线性关系

矩:单变量:k阶原点矩 E(xk) k阶中心矩 E[(xEx)k] 双变量:k+m阶混合矩 E(xkym) k+m阶混合中心矩 E[(xEx)k(yEy)m]

协方差矩阵:对随机变量 x=(x1,...,xn)T   Covx={Cov(xi,xj)}n×n 有关系:Covx=E[(xEx)(xEx)T] E(Ax)=A Ex,   E(xB)=Ex B D(aTx)=aTCovx a 利用独立变量构造相关变量:Covx=E, y=Lx, Covy=C  LLT=C

大数定律与中心极限定理

弱大数定律:n 个独立同分布随机变量 xi 满足 Exi=μ, Dxi=σ2,记它们的平均为 x¯=1nxi,则对任意的 ϵ>0 有:

limn+Pr(|x¯μ|<ϵ)=1

中心极限定理:n 个独立同分布随机变量 xi 满足 Exi=μ, Dxi=σ2,记它们的平均为 x¯=1nxi,则对充分大的 n 有:

x¯˙N(μ,σn),  i.e.   xinμnσ˙N(0,1)

抽样分布

统计量:基于样本,不含任何未知参数的函数

样本均值:X¯=Xin 样本方差:S2=(XiX¯)n1

卡方分布:x1,x2,...N(0,1)  χ2=x12+x22+...+xn2χ2(n) Eχ2=n, Dχ2=2n t分布:xN(0,1),yχ2(n), T=xy/nt(n) ET=0  (n>1), DT=nn2  (n>2) F分布:xχ2(m),yχ2(n)  F=x/my/nF(m,n) EF=mm2  (m>2)

若样本正态分布,则(n1)S2σ2χ2(n1), X¯μS/nt(n1), S12/S22σ12/σ22F(n1,m1)

参数估计

大量样本:L(θ)˙12nσe12(θθ^σ)2    lnL(θ)=˙lnL(θ^)(θθ^)22σ2

正态总体区间估计:lnL(θ^)0.5 对应 θ=θ^±σ 对应 68.3% lnL(θ^)2.0 对应 θ=θ^±2σ 对应 95.4% lnL(θ^)4,5 对应 θ=θ^±3σ 对应 99.7%

XN(μ,σ2),σ 已知,估计 μ:  X¯μσ/nN(0,1) XN(μ,σ2),σ 未知,估计 μ:  X¯μS/nt(n1) XN(μ,σ2),μ 已知,估计 σ:  (Xiμ)2σ2χ2(n) XN(μ,σ2),μ 未知,估计 σ:  (n1)S2σ2χ2(n1) XN(μ1,σ1), YN(μ2,σ2), σ1,σ2 已知,估计 μ1μ2:  X¯Y¯(μ1μ2)σ12/n+σ22/mN(0,1) XN(μ1,σ1), YN(μ2,σ2), σ1=σ2 未知,估计 μ1μ2:  X¯Y¯(μ1μ2)Sw1/n+1/mt(m+n2) 其中 Sw2=(n1)S12+(m1)S22n+m2 XN(μ1,σ1), YN(μ2,σ2), μ1,μ2 未知,估计 σ1σ2:  S12/S22σ12/σ22F(n1,m1)

假设检验

第一类错误:在原假设正确的条件下排除原假设 Pr(H0|H0)=1CL=α 第二类错误:在原假设错误的条件下保留原假设 Pr(H0|H0)=β 定义:假设 H1 的测试功效 Pr(H0|H1),显然假设 H0 的测试功效 1β

最佳拒绝域的形式:L(X|H0)L(X|H1)<k

皮尔逊卡方拟合优度检验:χ2=i=1n(OiEi)2Eiχ2(n1) 拒绝 χ 过大时的情况

若利用最大似然估计得到假设分布的 s 个参数,则 χ2=i=1n(OiEi)2Eiχ2(n1s)