x1时,有F(x2,y)≥F(x1,y);当y2>y1时,有F(x,y2) ≥F(x,y1); (3)F(x,y)分别对x和y是右连续的,即 F(x,y)F(x0,y),F(x,y)F(x,y0); (4)F(,)(5)对于x1F(,y)F(x,)0,F(,)1. x2,y1y2, F(x2,y2)F(x2,y1)F(x1,y2)F(x1,y1)0. (4)离散型与连续型的关系 P(Xx,Yy)P(xXxdx,yYydy)f(x,y)dxdy (5)边缘分布 离散型 X的边缘分布为 Pi•P(Xxi)pij(i,j1,2,); jY的边缘分布为 P•jP(Yyj)pij(i,j1,2,)。 i连续型 X的边缘分布密度为 fX(x)f(x,y)dy; Y的边缘分布密度为 fY(y)(6)条件分布 离散型 f(x,y)dx. 在已知X=xi的条件下,Y取值的条件分布为 P(Yyj|Xxi)pijpi• ;在已知Y=yj的条件下,X取值的条件分布为 P(Xxi|Yyj)连续型 pijp•j, 在已知Y=y的条件下,X的条件分布密度为 f(x|y)f(x,y); fY(y)在已知X=x的条件下,Y的条件分布密度为 f(y|x)(7)独立性 一般型 离散型 f(x,y) fX(x)F(X,Y)=FX(x)FY(y) pijpi•p•j 有零不独立 连续型 f(x,y)=fX(x)fY(y) 直接判断,充要条件: ①可分离变量 ②正概率密度区间为矩形 二维正态分布 f(x,y) 121212ex22(x)(y)y11222122(1)1212,=0 随机变量的函数 若X1,X2,…Xm,Xm+1,…Xn相互独立, h,g为连续函数,则: h(X1,X2,…Xm)和g(Xm+1,…Xn)相互独立。 特例:若X与Y独立,则:h(X)和g(Y)独立。 例如:若X与Y独立,则:3X+1和5Y-2独立。 (9)二维正态分布 设随机向量(X,Y)的分布密度函数为 f(x,y)其中1,2,1121212ex22(x)(y)y11222122(1)1212, 0,20,||1是5个参数,则称(X,Y)服从二维正态分布, 22,2,). 记为(X,Y)~N(1,2,1由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布, 即X~N(1,122),Y~N(2,2). 22),Y~N(2,2),(X,Y)未必是二维正态分布。 但是若X~N(1,1(10)函数分布 Z=X+Y 根据定义计算:FZ(z)P(Zz)P(XYz) 对于连续型,fZ(z)=f(x,zx)dx 两个独立的正态分布的和仍为正态分布(122,122)。 n个相互独立的正态分布的线性组合,仍服从正态分布。 Ciii, 2Ci2i2 iZ=max,min(X1,X2,…Xn) 若X1,X2Xn相互独立,其分布函数分别为Fx1(x),Fx2(x)Fxn(x),则Z=max,min(X1,X2,…Xn)的分布函数为: Fmax(x)Fx1(x)•Fx2(x)Fxn(x) Fmin(x)1[1Fx1(x)]•[1Fx2(x)][1Fxn(x)] 2分布 设n个随机变量X1,X2,,Xn相互独立,且服从标准正态分布,可以证明它们的平方和 WXi2i1的分布密度为 n nu11u2e2nnf(u)2220,u0, u0.我们称随机变量W服从自由度为n的分布,记为W~22(n),其中 nx20n1x2edx. 所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。 2分布满足可加性:设 Yi2(ni), 则 ZYi~2(n1n2nk). i1kt分布 设X,Y是两个相互独立的随机变量,且 X~N(0,1),Y~2(n), 可以证明函数 T的概率密度为 XY/n n12t2f(t)1nnn2t1(n)t(n) n12 (t). 我们称随机变量T服从自由度为n的t分布,记为T~t(n)。 F分布 设X~2(n1),Y~2(n2),且X与Y独立,可以证明FX/n1Y/n2的概率密度函数为 n1n2n12f(y)n1n2n222yn12n112n11ny2n1n22,y0 0,y0我们称随机变量F服从第一个自由度为n1,第二个自由度为n2的F分布,记为F~f(n1, n2). 1F1(n1,n2)F(n2,n1) 第四章 随机变量的数字特征 (1)一维随机变量的数字特征 (要求绝对收敛) 函数的期望 Y=g(X) Y=g(X) 期望 期望就是平均值 离散型 设X是离散型随机变量,其分布律为连续型 P(Xxk)设X是连续型随机变量,其概率密度为f(x), =pk,k=1,2,…,n, E(X)E(X)xkpkk1n xf(x)dx (要求绝对收敛) E(Y)g(xk)pkk1 n E(Y)g(x)f(x)dx 方差 D(X)=E[X-E(X)]2, 标准差 D(X)[xkE(X)]pk2k D(X)[xE(X)]2f(x)dx(X)D(X), 矩 ①对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即 xikpi, k=1,2, νk=E(Xk)= ①对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即 i…. νk=E(X)=xkf(x)dx, k=1,2, …. ②对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为k,即 k②对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为k,即 kE(XE(X)).=k kE(XE(X))k(xiiE(X))pik, k=1,2, …. .= (xE(X))kf(x)dx, k=1,2, …. 切比雪夫不等式 设随机变量X具有数学期望E(X)=μ,方差D(X)=σ2,则对于任意正数ε,有下列切比雪夫不等式 2P(X)2 切比雪夫不等式给出了在未知X的分布的情况下,对概率 P(X) 的一种估计,它在理论上有重要意义。 (2)期望的性质 (3) (4) (1) E(C)=C (2) E(CX)=CE(X) E(X+Y)=E(X)+E(Y),E(nnCXii1i)CiE(Xi) i1E(XY)=E(X) E(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 (3)方差的性质 (1) D(C)=0;E(C)=C (2) D(aX)=a2D(X); E(aX)=aE(X) (3) D(aX+b)= a2D(X); E(aX+b)=aE(X)+b (4) D(X)=E(X2)-E2(X) (5) D(X±Y)=D(X)+D(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 D(X±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))],无条件成立。 而E(X+Y)=E(X)+E(Y),无条件成立。 (4)常见分布的期望和 0-1分布B(1,二项分布B(n,期望 方差 p) p) p np p(1p) np(1p) 泊松分布P() 方差 几何分布G(p) 1p 1pp2 超几何分布H(n,M,N) 均匀分布U(a,b) nMN nMMNn1 NNN1ab 21 (ba)212 指数分布e() 正态分布N(,212 ) n 0 2 2n 2分布 t分布 (5)二维随机变量的数字特征 函数的期望 期望 n(n>2) n2E(X)xipi•i1n E(X)xfX(x)dx E(Y)yjp•jj1n E(Y)yfY(y)dy E[G(X,Y)]= E[G(X,Y)]= jG(x,yiij)pij --G(x,y)f(x,y)dxdy 方差 D(X)[xiE(X)]2pi•i D(X)[xE(X)]2fX(x)dx D(Y)[xjE(Y)]2p•jjD(Y)[yE(Y)]2fY(y)dy 协方差 对于随机变量X与Y,称它们的二阶混合中心矩11为X与Y的协方差或相关矩,记为XY或cov(X,Y),即 XY11E[(XE(X))(YE(Y))]. 与记号XY相对应,X与Y的方差D(X)与D(Y)也可分别记为XX与YY。 相关系数 对于随机变量X与Y,如果D(X)>0, D(Y)>0,则称 XYD(X)D(Y)为X与Y的相关系数,记作XY(有时可简记为)。 ||≤1,当||=1时,称X与Y完全相关:P(X aYb)1 正相关,当1时(a0),完全相关 负相关,当1时(a0),而当0时,称X与Y不相关。 以下五个命题是等价的: ①XY0; ②cov(X,Y)=0; ③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y). 协方差矩阵 XXYXXY YYk混合矩 对于随机变量X与Y,如果有E(X混合中心矩记为: Yl)存在,则称之为X与Y的k+l阶混合原点矩,记为kl;k+l阶uklE[(XE(X))k(YE(Y))l]. (6)协方差的性质 (7)独立和不相关 (ii) 若(X,Y)~N(1,2,122,2,), (i) (ii) (iii) (iv) (i) cov (X, Y)=cov (Y, X); cov(aX,bY)=ab cov(X,Y); cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y); cov(X,Y)=E(XY)-E(X)E(Y). 若随机变量X与Y相互独立,则XY0;反之不真。 则X与Y相互独立的充要条件是X和Y不相关。 第五章 大数定律和中心极限定理(1)大数定律 切比雪夫大数定律 设随机变量X1,X2,…相互独立,均具有有限方差,且被同一常数C所界:D(Xi)X与S独立。 2(1)点估计 矩估计 设总体X的分布中包含有未知数1,2,点矩vk,m,则其分布函数可以表成F(x;1,2,,m).它的k阶原E(Xk)(k1,2,,m)中也包含了未知参数1,2,,m,即vkvk(1,2,,m)。又设x1,x2,,xn为总体X的n个样本值,其样本的k阶原点矩为 1nkxini1 (k1,2,,m). 这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有 1nv1(1,2,,m)nxi,i11n2v2(1,2,,m)xi,ni1 nv(,,,)1xim.m12mni1由上面的m个方程中,解出的m个未知参数(1,2, ,m)即为参数(1,2,,m)的矩估计量。 ˆ)为g()的矩估计。 若为的矩估计,g(x)为连续函数,则g(极大似然估计 当总体X为连续型随机变量时,设其分布密度为数。又设x1,x2,f(x;1,2,,m),其中1,2,,m为未知参,xn为总体的一个样本,称 L(1,2,,m)f(xi;1,2,,m) i1n为样本的似然函数,简记为Ln. 当总体X为离型随机变量时,设其分布律为P{Xx}p(x;1,2,,m),则称 nL(x1,x2,,xn;1,2,,m)p(xi;1,2,,m) i1为样本的似然函数。 若似然函数L(x1,x2,,xn;1,2,,m)在1,,,m处取到最大值,则称1,,,m22分别为1,2,,m的最大似然估计值,相应的统计量称为最大似然估计量。 lnLni0,i1,2,,m iiˆ)为g()的极大似然估计。 若为的极大似然估计,g(x)为单调函数,则g((2)估计量的评选标准 有效性 E(无偏性 设(x1,x2,,xn)为未知参数的估计量。若E ()=,则称 为的无偏估计量。 X)=E(X), E(S2)=D(X) 设11(x1,x,2,,xn)和22(x1,x,2,,xn)是未知参数的两个无偏估计量。若D(1)D(2),则称1比2有效。 一致性 设n是的一串估计量,如果对于任意的正数,都有 nlimP(|n|)0, 则称n为的一致估计量(或相合估计量)。 ˆ)0(n),则为的一致估计。 若为的无偏估计,且D(只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。 (3)区间估计 置信区间和置信度 设总体X含有一个待估的未知参数。如果我们从样本x1,x,2,,xn出发,找出两个统计量11(x1,x,2,,xn)与22(x1,x,2,,xn)(12),使得区间[1,2]以1(01)的概率包含这个待估参数,即 P{12}1, 那么称区间[1,2]为的置信区间,1为该区间的置信度(或置信水平)。 单正态总体的期望和方差的区间估计 间[1,2]。具体步骤如下: (i)选择样本函数; (ii)由置信度1,查表找分位数; (iii)导出置信区间[1,2]。 已知方差,估计均值 (i)选择样本函数 设x1,x,2,,xn为总体X~N(,2)的一个样本,在置信度为1下,我们来确定和2的置信区u(ii) 查表找分位数 x0/n~N(0,1). xP1. 0/n(iii)导出置信区间 00x,x nn未知方差,估计均值 (i)选择样本函数 t (ii)查表找分位数 xS/n~t(n1). x1. PS/n(iii)导出置信区间 SSx,x nn方差的区间估计 (i)选择样本函数 w(ii)查表找分位数 (n1)S22~2(n1). (n1)S2P21. 21(iii)导出的置信区间 n1n1S,S 12第八章 假设检验 基本思想 假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。 为了检验一个假设H0是否成立。我们先假定H0是成立的。如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定H0是不正确的,我们拒绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称H0是相容的。与H0相对的假设称为备择假设,用H1表示。 基本步骤 这里所说的小概率事件就是事件{KR},其概率就是检验水平α,通常我们取α=,有时也取或。 假设检验的基本步骤如下: (i) (ii) (iii) (iv) 提出零假设H0; 选择统计量K; 对于检验水平α查表找分位数λ; 由样本值x1,x2,,xn计算统计量之值K; 将K与进行比较,作出判断:当|K两类错误 第一类错误 |(或K)时否定H0,否则认为H0相容。 当H0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定H0。这时,我们把客观上H0成立判为H0为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记为犯此类错误的概率,即 P{否定H0|H0为真}=; 此处的α恰好为检验水平。 第二类错误 当H1为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受H0。这时,我们把客观上H0。不成立判为H0成立(即接受了不真实的假设),称这种错误为“以假当真”的错误或第二类错误,记为犯此类错误的概率,即 P{接受H0|H1为真}=。 两类错误的关系 人们当然希望犯两类错误的概率同时都很小。但是,当容量n一定时,变小,则变大;相反地,变小,则变大。取定要想使变小,则必须增加样本容量。 在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平α。α大小的选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时,则应把α取得很小,如,甚至。反之,则应把α取得大些。单正态总体均值和方差的假设检验 对应样本 条件 零假设 统计量 函数分布 否定域 H0:0 已知 2|u|uUx0 12 H0:0 H0:0 H0:0 0/nN(0,1) uu1 uu1 |t|tTx0S/n 12(n1) 未知 2H0:0 H0:0 t(n1) tt1(n1) tt1(n1) 2w(n1)或H0:22 未知 22wH0:220 (n1)S202w 212(n1) 2(n1) w12(n1) 2w(n1) 2H0:20