You are on page 1of 12

2009-4-14

随机变量及其分布
中文版

李圣辰 072839 07B05


李圣辰 072839 07B05

随机变量及其分布

中文版

摘要
本文简单介绍了一维、二维随机变量的基本概念及其经典分布。从随
机变量概念的引入开始,逐步深化,加强对于概念和公式的解释,对于对
实际生活具有非常重要应用意义的概念及定理,选用了少量的例题,力求
做到将理论与实际进行联系。

摘要 1

随机变量 3

随机变量 3
二维随机变量 4
离散型随机变量 4
连续型随机变量 5

随机变量的分布函数与概率密度函数 5

随机变量的分布函数 5
一维随机变量分布函数的定义 5
一维随机变量分布函数的基本性质 6
一维离散型随机变量分布函数的求法 6
二维随机变量分布函数的定义 7
二维随机变量分布函数的基本性质 7
连续型随机变量的概率密度 8
一维随机变量的概率密度 8
一维随机变量的概率密度函数的性质 8
二维随机变量的概率密度 8
二维随机变量的概率密度函数的性质 8

随机变量的独立性 8

随机变量的分布 9

离散型随机变量的经典分布 9
1、0-1 分布 9
2、二次项分布 9

1
李圣辰 072839 07B05

3、负二次项分布 9
4、泊松分布 10
连续型随机变量的经典分布 10
1、 均匀分布 10
2、 指数分布 11
3、 正态分布 11
二维随机变量的边缘分布 11
随机变量的函数的分布 12
一维随机变量函数的分布 12
二维随机变量函数的分布 12
随机变量的条件分布 15
离散型随机变量的条件分布 15
连续型随机变量的条件分布 16

参考文献 16

PROBABILITY AND ITS DISTRIBUTION 16

ABSTRACT 16

随机变量
随机变量
在日程生活中,对于概率有各种各样的认识,关于概率问题,最经
典的实验就是投骰子实验和掷硬币实验。为了弄清随机变量这个概念,现
在以掷硬币这个实验作为例子:
 实验:将一枚硬币连续掷 3 次,观察可能出现的结果。
1. 此实验中会出现哪些结果?(用 H 表示正面,用 T 表示反面)
HHH, HHT, THT, THH, HTT, THT, TTH, TTT
2. 设某参量 X,表示实验中出现正面的次数,试写出 X 的取值范围:
X=0,1,2,3
3. 将所有可能出现的结果组成一个集合,记为 S,将每次得到的结果记
为 e,试将 X 表示为 e 的函数,并写出其表达式。
X=Xe=3,e=HHH 2,e=HHT, THT,THH1, e=HTT,THT,TTH0, e=TTT

2
李圣辰 072839 07B05

我们可以看到,在上题中最后得到的函数,是一种特殊的函数,其
能够在一定程度上表示某一事件的概率。一般地,我们称 S 为该事件的样
本空间,称 e 为样本空间 S 中的某一样本点。对于每一个样本点,X 都有
一个数与之对应,于是,称 X 为定义在样本空间 S 上的一个实值单值函数,
定义域为样本空间 S。类似地,在概率论中有以下的定义:
定义:设随机试验的样本空间为 S={E}。X=X(E)是定义在样本
空间 S 上的实质单值函数,称 X=X(E)为随机变量。
需要指出的是,随机变量的自变量 e,在很多时候都是一个实数,但
并不意味着其一定为一个实数,例如,有的时候,随机变量的自变量可能
是一个实数对。
 在衣袋中装有编号为 1,2,3 的 3 只球,在袋中任取一只球,放回,
再任取一只球,记录他们的号码。以 X 记两个号码之和,对于每一
个样本点 e 都有一个指定的 X 值与其对应。因此,X 可以写成:
X = X (e) = X ( ( i , j ) )= i + j
在上例中,样本点是一个实数对。
随机变量的取值随实验的结果而定,在试验之前不能预知其取值,
其取值有一定得的概率。由此可见,随机变量与普通的函数还是有一定区
别的。
一般地,我们用大写字母 X, Y, Z … 表示随机变量,用小写字母 x,
y, … 表示实数。
二维随机变量
设 E 是一个随机试验,他的样本空间是 S={e}, 设 X=X(e)与
Y=Y(e)是定义在 S 上的随机变量,由他们构成的一个向量(X,Y),叫做二
维随机向量或者二维随机变量。一般也将 X=X(e)称为一维随机变量。
在上面的例题中,如果我们将每次试验取出球的编号作为研究对象,
那么,第一次取出球的编号记为 X=X(e),第二次取出球的编号记为
Y=Y(e),则每次实验的结果(X,Y)可以被看作一个二维随机变量。
离散型随机变量
如果某些随机变量全部可能取到得值是有限多个或者可列无限多个,
则这种随机变量称为随机变量。相似的,对于一个二维的随机变量,如果
(X,Y)的全部可能取到的结果是有限对或者无限可列多对,则称(X,Y)
是离散性的随机变量。

3
李圣辰 072839 07B05

连续型随机变量
如果对于随机变量 X 的分布函数 F(x)存在非负函数 f(x),使得对于
任意实数 x 有:
Fx=-∞xf(t)dt

称 X 为连续型随机变量。F(x)成为随机变量 X 的分布函数。相似的,
对于二维随机变量,连续型的二维随机变量定义为:对于二维随机变量
(X,Y)分布函数 F(x,y),如果存在非负的函数 f(x,y)使得对于任意 x,y
有:
Fx,y=-∞y-∞xf(u,v)dudv

称(X,Y)为连续型的随机变量。

下面举一个连续型随机变量的例子:
一个靶子是半径为 2m 的圆盘,设击中靶心上的任意同心圆盘上的
点的概率与该院判的面积成正比,并设射击都能中靶,以 X 表示弹着点与
圆心的距离。
本例中由于 X 的取值不能列举,也不是有限个,则 X 是非离散变量。

随机变量的分布函数与概率密度函数
随机变量的分布函数
一维随机变量分布函数的定义
首先,我们将直接给出随机变量分布函数的定义式:
设 X 是一个随机变量,x 是任意实数,函数 F(x)=P{X≤x},-
∞<x<∞,称为 X 的分布函数。
因此,对于任意实数 x1,x2,(x1<x2)有:P{x1<X≤x2}=P{X≤x2}-
P{X≤x1}=F(x2)-F(x1)
一维随机变量分布函数的基本性质
1. F(x)是一个不减函数,即对于任意的实数 x1,x2(x1<x2)有 F(x2)-
F(x1)=P{X≤x2}-P{X≤x1}≥0
2. 0≤F(x)≤1 并且满足:
F-∞=limx→-∞F(x)=0
4
李圣辰 072839 07B05

F∞=limx→∞F(x)=1
3. F(x+0)=F(x), 即 F(x)是右连续的。
一维离散型随机变量分布函数的求法
由于离散型随机变量的特殊性,我们可以根据随机变量的分布律来
求随机变量的分布函数。应当注意的是,根据分布函数的定义,F(x)的值
是 X≦x 的累积概率,有概率的有限可加性,即分布函数值应为小于等于
xk 处的概率 pk 之和。
例题:已知 X 的分布律为:
X -1 2 3
pk 0.25 0.5 0.25
求 X 的分布函数。
根据上述方法,可得 X 的分布函数 F(x)的分布函数应当为:
Fx=0 x<-1Px=-1 -1≤x<2Px=-1+Px=2 2≤x<31 x≥3

代数得:
Fx=0 x<-114 -1≤x<234 2≤x<31 x≥3

二维随机变量分布函数的定义
设(X,Y)是二维随机变量,对于任意实数 x,y,二元函数:
Fx,y=P{(X≤x)∩(Y≤y)}≡P{X≤x,Y≤y}

成为二维随机变量(X,Y)的分布函数,或称维随机变量 X 和 Y 的联合分
布函数。
由于二维随机变量(X,Y)可以被看成是平面上随机点的坐标,则
F(x,y)所表示的函数值为随机点(X,Y)罗在以点(x,y)为顶点的位于该点左
下方无穷矩形区域内的概率。因此,与一维随机变量不相同,
Px1<X≤x2,y1<Y≤y2=Fx2,y2-Fx2,y1+Fx1,y1-F(x1,y2)

二维随机变量分布函数的基本性质
1. F(x,y)是变量 x 和 y 的不减函数,即对于任意固定的 x0,y0,
G(y)=F(x0,y), H(x)=F(x,y0) 都为不减函数。例如,当 x2>x1 时,
F(x2,y)≥F(x1,y)
2. 0≤Fx,y≤1,

5
李圣辰 072839 07B05

 且对于任意固定的 y,F-∞,y=0;
 对于任意固定的 x,Fx,-∞=0;
 F-∞,-∞=0,
 F+∞,+∞=1
3. F(x,y)关于 x 右连续,对于 y 也右连续。
连续型随机变量的概率密度
一维随机变量的概率密度
在一维连续型随机变量的定义中,我们是通过式子 Fx=-∞xf(t)dt 定义
了连续型随机变量。在这个式子中,f(t)被称为 X 的概率密度函数,简称
概率密度。
一维随机变量的概率密度函数的性质
1. fx≥0
2. -∞+∞fxdx=1
3. 对于任意的实数 x1,x2(x1<x2):
Px1<X≤x2=Fx2-Fx1=x1x2f(x)dx
4. 若 f(x)在点 x 处连续,则有 F’(x)=f(x)
二维随机变量的概率密度
与一维随机变量的概率密度函数相似,根据二维连续型随机变量的
定义 Fx,y=-∞y-∞xfu,vdudv, f(u,v)被称为随机变量 X 与 Y 的联合概率密度。
二维随机变量的概率密度函数的性质
1. f(x,y)≥0
2. -∞+∞-∞+∞fx,ydxdy=F∞,∞=1
3. 设 G 是 xOy 平面上的区域,点(X,Y)落在 G 内的概率为:
PX,Y∈G=f(x,y)dxdy
4. 若 f(x,y)在点(x,y)连续,则有:
∂2F(x,y)∂x∂y=f(x,y)

随机变量的独立性
所谓随机变量的独立性,是指当某几个随机变量的概率密度函数的
取值之间不存在任何关系。对于一个一维随机变量而言,如果随机变量
A1, A2, A3 … An 中,由 ab, ac, ad, … ax 组成的任意 m 维随机变量的概率
密度函数的取值与此 m 个随机变量的概率密度函数取值的乘积相等,则称
随机变量 A1, A2, A3 … An 相互独立。即:如果
fab,ac, ad, …, ax=FAbab∙FAcac∙FAdad∙⋯∙FAx(ax)

随机变量的分布
离散型随机变量的经典分布
1、0-1 分布
设随机变量 X 只可能取 0 与 1 两个值,即:其分布率满足
6
李圣辰 072839 07B05

PX=k=pk(1-p)1-k,k=0,1(0<p<1)

称 X 服从以 p 为参数的(0-1)分布或两点分布。
2、二次项分布
如果将只有两个可能结果 A 和 A’的某试验 E 独立重复地进行 n 次,称这一
串重复的独立试验为 n 重伯努力试验。每一次试验的 Pr(A)=p 保持不变。
N 次试验中出现 k 次 A 结果的概率为:
PX=k=Cnkpk(1-p)n-k

特别的,当 n=1 是,二次项分布将转化为 0-1 分布。


3、负二次项分布
如果要求 n 重伯努力试验的最后一次结果一定为 A,则称其概率分布满足
负二次项分布,即:
PX=k=Cnk-1pk(1-p)n-k-1

➢ 例:在一个布袋中放入 3 个红球,10 个蓝球:


 任意取出一个球,记事件 X 为取出红球的个数,则 X 服从以 p 为参数
的 0-1 分布
 任意取出 k 个球。记事件 Y 为取出红球的个数,则 Y 服从二次项分布
 取出 k 个红球后停止。记事件 Z 为取球的次数,则 Z 服从负二次项分

4、泊松分布
设随机变量 X 在自然数集中取值,且取各个值的概率为
PX=k=λke-λk!,k=0,1,2,…
其中 λ>0 是常数。则称 X 服从为 λ 的泊松分布,记为 Χ~π(λ).

➢ 泊松分布的随即变量在实际应用中的体现:
 一本书一页中的印刷错误数
 某地区在一天内邮递遗失的信件数
 某医院在一天内的急诊病人数

➢ 泊松定理
limn→∞Cnkpnk(1-pn)n-k=λke-λk!
其中 λ>0 是一个常数,n 为任意正整数,且 npn=λ,k 是非负整数。
也就是说,以 n,p 为参数的二项分布的概率值可以由参数为 λ=npn 的泊松
分布相近似,但是 n 的数值要足够大。

连续型随机变量的经典分布
1、均匀分布
7
李圣辰 072839 07B05

若连续型随机变量 X 具有概率密度
fx=1b-a a<x<b 0 其他

则称 X 在区间(a,b)上服从均匀分布,记为 X~U(a,b)

2、指数分布
若连续型随机变量 X 具有概率密度
fx=λe-λx x>00 其他

其中 θ>0 是常数,则称 X 为服从参数为 θ 的指数分布


3、正态分布
若连续型随机变量 X 具有概率密度
fx=12πσe-(x-μ)22σ2, -∞<x<+∞
其中,μ,σ 为常数,则称 X 为服从参数为 μ,σ 的正态分布,记为
X~N(μ,σ2)

 f(x)的图形具有以下性质:
➢ 曲线关于 x=μ 对称,且此时有最大值 fμ=12πσ
➢ 曲线的位置只与 μ 的取值有关,形状只与 σ 有关。
 特别的,当 μ=0,σ=1 时,称随机变量 X 服从标准正态分布,标准正态分
布的取值可由数学用表查到,所有的正态分布与标准正态分布存在以
下关系:
若 X~Nμ,σ2,则 Z=X-μσ~N(0,1)

二维随机变量的边缘分布
严格的讲,二维随机变量的边缘分布,并不能算作一种分布。根据
二维随机变量的定义,一个二维随机变量是由两个一维随机变量组成的,
这两个一维随机变量的分布,就称为这个二维随机变量的边缘分布,对于
一个离散型的二维随机变量,边缘分布被称为边缘分布律。对于一个连续
型的二维随机变量,两个一维随机变量的分布函数及概率密度函数分别被
称为二维随机变量关于 X 或 Y 的边缘分布函数和二维随机变量关于 X 或 Y
的边缘概率密度,依次记为 FX(x), FY(y), fX(x), fY(y)。
随机变量的函数的分布
在实际的生活中,我们往往在使用概率论原理时会遇到这样的情况:
已知某个随机变量的分布,需要知道与其有一定函数关系的随机变量的分
布。此时,就需要用到随机变量的函数分布。
一维随机变量函数的分布
8
李圣辰 072839 07B05

定理:令 X 为概率密度函数为 f,在(a,b)区间上概率为 1 的随机变量。


Y 为 X 的函数,Y=r(X)且 r(x)在该区间上是单调连续的。令 α,β 为
Y=r(X)在(a,b)上的取值范围,X=s(Y)是 Y=r(X)的反函数,则 Y 的概
率分布函数 g(y)有如下的关系:
gy=fsydsydy for α<y<β0 其他
或者也可以利用下列公式进行计算:
Gy={x:r(x)≤y}f(x)dx and gy=dG(y)dy
此外,利用已知的两个随机变量的分布函数,也可以求得两个随机变
量的关系 Y=r(X),只需令 G(y)=F(x)即可。
二维随机变量函数的分布
同样的情形在进行二维随机变量计算时同样存在,但是对于随机变
量的分布函数的要求更加严密:除了要求所有的概率密度函数为一一映射
之外,还要求所有的概率密度函数在所求区间存在偏导数。此外,还要求
两个随机变量是相互独立的。除此以外,还要求两个随机变量间应当存在
两个不等价的函数关系。(为了方便,将这两个关系记为 Y1, Y2)
求取具体随机变量概率分布函数的步骤为:
1. 根据两个函数关系,求取其反函数关系,即求得 X1=s1(Y1,Y2),
X2=s2(Y1,Y2)

2. 根据已经求得的函数关系,求贾克比行列式:
J=∂s1∂y1∂s1∂y2∂s2∂y1∂s2∂y2
3. 当 T 表示(Y1,Y2)存在一一映射点(X1,X2)属于定义域 S 时,有公
式:
gy1,y2=fs1,s2J (y1,y2)∈T0 其他
相同的方法,可以扩展到 N 维随机变量的函数的求法。
常用的函数关系有:
1. 当 Z=X+Y 时,
fX+Yz=+∞-∞f(z-y,y)dy or fX+Y(z)=-∞+∞f(x,z-x)dx

当 X,Y 相互独立时,
fX+Yz=-∞+∞fXz-yfYydy or fX+Yz=-∞+∞fXxfY(z-x)dx
此时,上式有被称为 fX 与 fY 的卷积公式
2. 当 Z=XY 时,
fXYz=-∞+∞1xf(x,zx)dx

9
李圣辰 072839 07B05

当 X,Y 相互独立时,
fXYz=-∞+∞1xfXxfY(zx)dx
3. 当 Z=YX 时,
fyxz=-∞+∞xf(x,xz)dx
当 X,Y 相互独立时,
fyxz=-∞+∞xfxxfY(xz)dx
4. 当 Z=max{X,Y}或 Z=min{X,Y}且 X,Y 是相互独立时,
Fmax=FXzFYz and Fmin=1-1-FXz[1-FY(z)]

例题:设系统 L 有两个相互独立的子系统 L1,L2 连接而成,求连接方式分


别为串联,并联和保险时,L 系统的寿命 Z 的概率密度。已知 L1,L2 的寿命
分别为 X,Y 且其概率密度分别为:
fXx=αe-αx,x>00, x≤0 and fYy=βe-βy,y>00 ,y≤0

解:
根据定义可以求得:
FXx=1-e-αx,x>00, x≤0 and FY=1-e-βy,y>00 ,y≤0

a) 串联时,Z=min{X,Y},根据公式得:
FZ=1-1-FXz1-FYz=1-e-α+βz,z>00 ,z≤0
fZz=dFzdz=α+βe-α+βz,z>00, z≤0

b) 并联时,Z=max{X,Y},根据公式得:
FZz=FXxFYy=1-e-αz1-e-βz,z>00 ,z≤0
fZz=dFzdz=αe-αz+βe-βz-α+βe-α+βz,z>00, ,z≤0

c) 保险时,Z=X+Y,根据公式得:
fz=-∞+∞fXz-yfYydy=0zαe-α(z-y)βe-βydy=αβe-αz0ze-(β-α)ydy=αββ-α(e-αz-e-βz)

随机变量的条件分布
在日常生活中,有的时候我们仅关心某种情况下的随机变量分布,
即当某事件 A 发生后,事件 B 发生的概率。

离散型随机变量的条件分布
条件概率公式为:
PX=xiY=yj=P{X=xi,Y=yi}P{Y=yi}

10 
李圣辰 072839 07B05

连续型随机变量的条件分布
设二维随机变量(X,Y)的概率密度为 f(x,y),(X,Y)关于 Y 的边缘
概率密度为 fY(y)。若对于固定的 y,fY 为在 Y=y 条件下的 X 的概率密度,
记为:
fX|Yxy=f(x,y)fY(y)

称-∞xfX|Yxydx=-∞xf(x,y)fY(y)dx 为在 Y=y 条件下的 X 的条件分布函数,记为


P{X≤x|Y=y}或者 FX|Y(x|y)。

参考文献
1. 高等教育出版社《概率论与数理统计》(第四版)盛骤等著,ISBN 978-7-04-
023896-9 2008 年 6 月第 4 版第 1 次印刷
2. 高等教育出版社《Probability and Statistics》(第三版)Morris H.DeGroot 等著,房
祥忠等改编,ISBN 7-04-016765-4 2005 年 11 月第 1 版第 1 次印刷

Probability and its distribution


Abstract
In this essay, we have briefly introduced the random
variable of one and two demonstration and its basic
distribution. From the beginning of random variable and step by
step, this essay go a little further and try to pursue a better
understanding of all the concepts and some explanations. For
some theorem which has specific meaning in daily life, we give
some examples in order to establish the link between theorem
and the practice cases.

11 

You might also like