首页 理论教育 离散型随机变量分布-概率论与数理统计

离散型随机变量分布-概率论与数理统计

时间:2023-10-21 理论教育 版权反馈
【摘要】:定义2.2.1 若随机变量X 所有可能的取值是有限个或无限可列个,则称X 为离散型随机变量。),X 取各个可能值的概率为称式为离散型随机变量的概率分布或分布律。例2.2.2 已知随机变量X 的分布函数为求随机变量X 的概率分布。一周所创利润使用5个工作日可以视为5次“伯努利试验”,设备停用视为“成功”,成功的概率为0.2,而随机变量X 作为伯努利试验成功的次数,服从参数为的二项分布。

离散型随机变量分布-概率论与数理统计

定义2.2.1 若随机变量X 所有可能的取值是有限个或无限可列个,则称X 为离散型随机变量。

对于一个离散型随机变量,要掌握它的统计规律,一方面要了解它可能的取值,更重要的是了解它取各个可能值的概率。

设随机变量X 的所有可能取值为xk(k=1,2,…,n,…),X 取各个可能值的概率为

称式(2.2.1)为离散型随机变量的概率分布或分布律。离散型随机变量的概率分布也可表示为

由概率的性质,概率分布满足如下的两个条件:

若一个随机变量的概率分布已知,则取值在任一区间内的概率都可以求得。例如,已知随机变量X 的概率分布为

一般地,若已知随机变量的概率分布

则对于任何实数a<b,事件{a<X≤b}发生的概率均可由概率分布求得,因为

由于诸事件{X=xk}两两互不相容,由概率的可加性得

等式右端是对X 取一切满足a<xk≤b的概率求和。由此可知,X 取值在任一区间内的概率都可以由其概率分布求出,所以说概率分布完整地描述了随机变量的统计规律。由此可得,离散型随机变量的分布函数为

例2.2.1 设随机变量X 的概率分布为

求X 的分布函数,并求

解 由概率的有限可加性,所求分布函数为

F(x)的图形是一条阶梯形曲线,在x=0,1,2处有跳跃点,跳跃值分别为

反过来,给出离散型随机变量的分布函数,可以写出其概率分布。

例2.2.2 已知随机变量X 的分布函数为

求随机变量X 的概率分布。

解 易见F(x)有0,2,5共3个间断点,故随机变量X 有3个可能值。由于

可见随机变量X 的概率分布为

要求一个离散型随机变量的概率分布,须先确定随机变量的取值,然后求出其取每一个值的概率。

例2.2.3 假设有7件一等品和3件二等品混放在一起,每次从其中任意抽取一件,直到取到一等品为止。试分别求抽取次数X 的概率分布,假设

(1)凡是取到的二等品都放回;

(2)将取到的二等品都剔除。

解 (1)引进事件:Ai={第i次取到的是二等品}(i=1,2,…,n-1);对于任意正整数{第n次取到的是一等品}(n=1,2,…)。由条件易见事件 相互独立,而且

因此

(2)由于恰好有3件二等品,易见抽取次数X 总共有1,2,3,4这4个可能值。引进事件:Ai={第i次取到的是二等品}(i=1,2,3)={第j次取到的是一等品}(j=1,2,3,4)。因此,注意到抽样是非还原的,由古典型概率的计算公式,有

于是,X 的概率分布为

例2.2.4 接连独立地进行两次射击,以X 表示命中目标的次数。假设每次射击的命中率为0.70,求X 的概率分布。

解 随机变量X 有0,1,2共3个可能值。引进事件:Ai={第i次射击命中目标}(i=1,2),由于两次射击相互独立,可见事件A1 和A2 相互独立,因此

于是,X 的概率分布为

例2.2.5 设离散型随机变量X 的概率分布为

而且X 取奇数值的概率和为试求常数a,p 的值。

解 因为于是a=1-p,又故有

可得

下面介绍几种重要的离散型随机变量的概率分布。

1.两点分布(0-1分布)

只有两个可能值的随机变量X 的概率分布称作两点分布:

特别地,若x1=0,x2=1,则称X 服从参数为p 的0-1分布,亦称伯努利分布。

只计“成功”和“失败”两种结局的试验称作伯努利试验。设X 是试验成功的次数:

则X 服从参数为p 的0-1分布。

对于一个随机试验,若其结果可以归结为A 与,那么就可以用一个服从两点分布的随机变量来描述。例如,一批产品的合格品率为0.98,随意抽取一件可以归结为两个结果:合格与不合格。设{X=0}={合格},{X=1}={不合格}。则X 的分布律为(www.xing528.com)

它描述了这一产品抽样检查的统计规律。

2.二项分布

若随机变量X 的概率分布为

其中0<p<1,q=1-p。则称X 服从参数为n,p 的二项分布。记作X~B(n,p)。

显然,

即P{X=k}满足条件(2.2.4)。

二项分布的概率恰好是二项式(p+q)n 展开的各个项:

二项分布因此得名。显然,0-1分布是n=1时的二项分布。

二项分布是非常重要的离散型分布,有极广泛的应用,它用于表示n重伯努利试验中成功的次数。例如,X 是n 次独立重复射击命中靶子的次数,p 是命中率(一次射击命中靶子的概率);X 是保险公司n 个客户中因被盗而索赔的户数,p 是索赔率;X 是某车间n 台机器在一天之内出现故障的台数,p 是每台机器的故障率;X 是在一批产品中有放回地抽取n 次抽到的次品数,p 是次品率。上述的X 都服从参数为n,p 的二项分布。

例2.2.6 假设有10台设备,每台的可靠性(无故障工作的概率)为0.90,每台出现故障时需要由一人进行调整。问为保证在95%的情况下当设备出现故障时都能及时得到调整,至少需要安排几个人值班?

解 由条件知,每台设备出故障的概率为0.10。以X 表示10台设备中同时出现故障的台数,则X 服从参数为(10,0.10)的二项分布。假设需要安排k 个人值班,则k 应该满足条件:P{X≤k}≥0.95。通过对不同的k试算,可以找出满足P{X≤k}≥0.95的k 值。设k=1,2,3,有

因此,至少需要安排3个人值班。

例2.2.7 假设一部设备在一个工作日因故停用的概率为0.2。一周使用5个工作日可创利润10万元;使用4个工作日可创利润7万元;使用3个工作日只创利润2万元;停用3个及多于3个工作日亏损2万元。求所创利润的概率分布。

解 设X 为一周5个工作日停用的天数;Y 为一周所创利润。一周所创利润

使用5个工作日可以视为5次“伯努利试验”,设备停用视为“成功”,成功的概率为0.2,而随机变量X 作为伯努利试验成功的次数,服从参数为(5,0.2)的二项分布。因此,

由此,所创利润Y 的概率分布为

例2.2.8 某生产线平均每3分钟生产一件成品,假设不合格品率为0.01。

(1)试求8小时内出现不合格品的件数X 的概率分布;

(2)试求需要多长时间,才能以不小于0.95的概率最少出现一件不合格品。

解 (1)若平均每3分钟出一件成品,则8小时内平均可以出8×60/3=160件成品,每件成品为不合格品的概率是p=0.01,在160件成品中不合格品的件数X 服从参数为(160,0.01)的二项分布。

(2)设n为至少出现一件不合格品所要生产成品的件数,则n 件成品中不合格品的件数νn 服从参数为(n,0.01)的二项分布。按题意,n应满足条件

于是,最少298.0729×3≈895分钟,将近14小时55分钟,才能以不小于0.95的概率最少出现一件不合格品。

3.超几何分布

若随机变量X 的概率分布为

其中l=max(0,n-(N-M))。这个概率分布称为超几何分布,记作X~H(N,M,n)。

刻画的代表模型是,设一堆同类产品共N 个,其中有M 个不合格品。现从中任取n 个,则这n个产品中所含的不合格品数X 是一个离散型随机变量,且X~H(N,M,n)。

与二项分布比较,超几何分布反映的是不放回抽样,二项分布反映的是有放回抽样,当n<<N 时,不放回抽样近似可看作有放回抽样,因而此时超几何分布可用二项分布近似,即

4.泊松分布

若随机变量X 所有可能取的值为0,1,2,…,而取各个值的概率为

其中λ>0是常数,则称X 服从参数为λ 的泊松分布,记为X~P(λ),易知P{X=k}≥0,k=0,1,2,…,且有

即P(X=xk)满足条件(2.2.4)。

泊松分布,是最重要的离散型分布之一,是描绘“稀有事件”计数资料统计规律的概率分布,最早是作为二项分布的近似计算提出的,后来成功地用于描绘随机质点在时间或空间上的分布,在生物学、医学、工业及公用事业的排队论等问题中,泊松分布是常见的。例如,容器内的细菌数,铸件的疵点数(布的疵点数),交换台的电话呼唤次数,等等,一般都服从泊松分布。在质量控制、排队论、可靠性理论等许多领域内都有重要应用。

泊松定理 假设X 服从二项分布,参数n充分大,而p 充分小,且np 适中,则可以利用泊松分布概率近似计算二项分布概率。泊松定理可以严格地表述为:若当n→∞时p→0,np→λ(常数),则参数为(n,p)的二项分布的极限是参数为λ的泊松分布。

实际中,当n≥100,p≤0.1且np 适中时即可用上式,不过n 应尽量地大,否则近似效果往往不佳。

例2.2.9 假设在数量很大的人群中,随机访问的一个人的生日在一年中365天是等可能的,即他的生日在一年中某一天的概率为p=1/365。随机访问的n 为500人,可以视为n次伯努利试验,一个人的“生日在元旦”为成功,而其中生日在元旦的人数X 服从二项分布B(500,1/365),np=500/365≈1.3699。由于n 充分大而p 充分小,故X 近似服从参数为λ=np≈1.3699的泊松分布。分别按二项分布和泊松分布计算概率P{X=k},相应地记作

将计算结果列入表2.2.1,可见bk≈pk

表2.2.1

5.几何分布*

若随机变量X 的概率分布为

则称X 服从几何分布,记作X~G(p)。

几何分布的典型模型:接连不断地进行的伯努利试验首次成功所需试验的次数N,服从参数为p 的几何分布,其中p 是每次试验成功的概率。

事实上,设Ai={第i次试验成功}(i=1,2,…,n,…)。对于伯努利试验这些事件相互独立,且每次试验成功的概率为p,而失败的概率为q=1-p。因此,有

在有放回抽样时,每次取一个产品,观察后即放回,再取下一个,设直至第一次出现不合格品所需抽样产品个数为X,X 所可能取的值为1,2,…,{X=k}表示前k-1次抽取都抽到合格品,而在第k次抽取才抽到不合格品,X 是服从几何分布的。还有,接连对同一目标进行射击,首次命中目标所需射击的次数等都服从几何分布。

例2.2.10 统计资料表明,男性人口中色盲患者的比率为5%。现在新生中检查辨色力,求:

(1)事件“发现首例患色盲的男生时已检查了40名男生”的概率α;

(2)为发现一例色盲患者至少要检查40名男生的概率β;

(3)以不小于0.90的概率发现一例色盲患者,至少要检查多少名男生?

解 以X 表示发现首例色盲患者所需检查的男生数,则服从参数为p=0.05的几何分布。

于是,为以不小于0.90的概率发现一例色盲患者,至少要检查45名男生。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈