概统复习整理
古典概率
和事件:并集
积事件:交集
差事件:
互斥事件:
互逆事件:
独立事件:
贝叶斯定理:
有关系:
一维随机分布
基本离散分布
| 说明 | 概率 | 期望 | 方差 |
---|
伯努利分布 | 0-1分布 | Pr(0)=1-p,Pr(1)=p | p | p(1-p) |
二项分布 B(n,p) | n个0-1分布 | | np | np(1-p) |
几何分布 | 伯努利实验几次成功 | Pr(k)=(1-p)k-1p | p-1 | p-2(1-p) |
泊松分布 P(λ)♤ | 连续化的二项分布 | Pr(k)=λke-λ/k! | λ | λ |
说明:
♤ 当n很大p很小时,二项分布能够有泊松分布近似。
X~P(λ), Y~P(μ), X+Y~P(λ+μ)
分布函数(CDF):F(x)=Pr(X≤x)
性质:单调、右连续
随机变量X有分布函数F(x),则导出的随机变量F(X)~U(0,1)
概率密度函数(PDF):f(x)=F'(x)
基本连续分布
| 说明 | CDF | PDF | 期望 | 方差 |
---|
均匀分布 U[a,b] | a,b为两个边界 | (x-a)/(b-a) | (b-a)-1 | (a+b)/2 | (b-a)/12 |
指数分布 | 泊松事件时间差, λ概率时间比 | 1-e-λt | λe-λt | λ-1 | λ-2 |
高斯分布 N[μ,σ] | | | | μ | σ2 |
多维随机分布
分布函数(CDF):
有关系:。
概率密度函数(PDF):f(x,y)=Fxy(x,y)
边缘分布:多维随机分布中单个变量的分布
有关系:
条件分布:【离散】 当 Y=y 时X的分布(就是条件概率)
【连续】 当 y-dy<Y<y+dy 时X的分布
有关系:
变量的独立性:
注意x,y的取值范围。
随机变量的变换:
数字特征
期望:
x,y 独立时:
方差:
有关系:
当x,y相互独立时
误差(方差)传递:
标准化变量
切比雪夫不等式:
协方差:
有关系:
当x,y相互独立时
独立多变量误差(方差)传递:
相关系数:
当(x,y)分布再一条线上时
只反映两个变量的线性关系
矩:单变量:k阶原点矩 k阶中心矩
双变量:k+m阶混合矩 k+m阶混合中心矩
协方差矩阵:对随机变量
有关系:
利用独立变量构造相关变量:
大数定律与中心极限定理
弱大数定律: 个独立同分布随机变量 满足 ,记它们的平均为 ,则对任意的 有:
中心极限定理: 个独立同分布随机变量 满足 ,记它们的平均为 ,则对充分大的 有:
抽样分布
统计量:基于样本,不含任何未知参数的函数
样本均值:
样本方差:
卡方分布:
t分布:
F分布:
若样本正态分布,则
参数估计
大量样本:
正态总体区间估计: 对应 对应 68.3%
对应 对应 95.4%
对应 对应 99.7%
已知,估计
未知,估计
已知,估计
未知,估计
已知,估计
未知,估计 其中
未知,估计
假设检验
第一类错误:在原假设正确的条件下排除原假设
第二类错误:在原假设错误的条件下保留原假设
定义:假设 的测试功效 ,显然假设 的测试功效
最佳拒绝域的形式:
皮尔逊卡方拟合优度检验: 拒绝 过大时的情况
若利用最大似然估计得到假设分布的 个参数,则