首页 理论教育 随机变量和概率:抛骰子赌大小的例子

随机变量和概率:抛骰子赌大小的例子

时间:2023-06-21 理论教育 版权反馈
【摘要】:六种可能的结果分别是:ω1=1点,ω2=2点,ω3=3点,ω4=4点,ω5=5点,ω6=6点。图14.2“抛骰子赌大小”例子中的随机变量(初步)和概率。图14.2中的抽象集合Ω不是数轴,加上“虚线”只是为了美观。由于Ω中的元素没有先后顺序和大小关系,图14.2中的“虚线”也不应该有“箭头”。“随机变量”和概率只是将概率空间中的(Ω,F)分别映射到两条实数轴上。

随机变量和概率:抛骰子赌大小的例子

根据概率空间,我们可以完整地了解(随机性)实验结果的详细情况:可能的结果、可能的事件、各个事件的概率(归一化权重)。但是,这些信息还不足以支持我们做决策,因为,我们还需要知道实验结果到底意味着什么。一个极端的例子是:抛骰子来赌大小,“小”可以赢得小半瓶别人喝剩的可乐、“大”需要无偿送二十年快递,就算使用特殊的骰子,让“小”的可能性很大(概率空间提供的信息),是否就值得我们去参与这个活动?

图14.2 “抛骰子赌大小”例子中的随机变量(初步)和概率。(a)随机变量(初步)中所定义的“随机变量”将集合Ω中的六个元素映射成实数轴上的六个点:xi=X(ωi)(其中i=1,2,···,6)。(b)概率将(集合Ω的分割{ϕ,B 1,B 2}中的)两个(非空)集合B 1={ω123}和B 2={ω456}映射成实数轴上([0,1]区间中)的两个点:Pi=P(B i)(其中i=1,2)。

为了解决这一问题,我们通过(前面提到的随机变量(初步)中定义的)映射X(ωi)将(所有)可能的实验结果ωi∈Ω(全部)映射到实数轴上,来赋予(由所有实验结果所组成的)集合Ω以数的结构,从而可以对Ω中的元素进行排序和比较大小。整个想法肯定是睿智和正确的,但是,需要做进一步的完善。

我们通过一个具体的例子:“抛骰子赌大小”,来具体说明。在这个例子中,Ω={ω123456};F={ϕ,B1,B2,Ω}。六种可能的结果分别是:ω1=1点,ω2=2点,ω3=3点,ω4=4点,ω5=5点,ω6=6点。在(集合Ω的)分割(或划分){ϕ,B1,B2}中,两个非空的集合分别是:B1={ω123}和B2={ω456}。随机变量(初步)中所定义的“随机变量”将集合Ω中的六个元素映射成实数轴上的六个点[5]:xi=X(ωi)(其中i=1,2,···,6),如图14.2(a)所示。概率将(集合Ω的分割{ϕ,B1,B2}中的)两个(非空)集合B1和B2映射成实数轴上([0,1]区间中)的两个点:Pi=P(Bi)(其中i=1,2),如图14.2(b)所示。

图14.3 要将(概率空间中的)(Ω,F)整体映射到(由X轴和P轴张成的)二维空间R 2,除了将Ω和F分别映射到X轴和P轴上以外,还要建立起两组映射结果之间的对应关系!(a)在两组映射结果中,点的个数并不一致(X轴上有六个点而P轴上只有两个点),如何将这两组点匹配起来?(b)我们可以强行使得X轴上只有两个点,也就是说,强行使得X轴上的某些点重合在一起,由此产生了可测函数这个重要概念。

图14.2中的抽象集合Ω不是数轴,加上“虚线”只是为了美观。由于Ω中的元素没有先后顺序和大小关系,图14.2中的“虚线”也不应该有“箭头”。我们的进展似乎很顺利,通过(待完善“随机变量”的)和概率这两个函数[6],分别将(概率空间中的)Ω和F映射到了两条实数轴(图14.2(a)中的X轴和图14.2(b)中的P轴)上。注意,X轴和P轴这两条实数轴张成了一个二维空间,称为“PX”平面。那么,我们能否认为:“随机变量”(函数X:Ω→R)和概率(函数P:F→[0,1]∈R)将(概率空间中的)(Ω,F)整体映射到了(由X轴和P轴张成的)二维“PX”平面上?答案是否定的!“随机变量”和概率只是将概率空间中的(Ω,F)分别映射到两条实数轴(X轴和P轴)上。要将(Ω,F)映射到(由X轴和P轴张成的)二维空间R2,还需要:建立起两组映射结果之间的对应关系!

对于“抛骰子赌大小”的例子,我们需要建立X轴上六个点与P轴上两个点之间的对应关系,如图14.3(a)所示。这似乎是一个不可能实现的任务:这两组点的个数并不一致(X轴上有六个点而P轴上只有两个点),难以进一步实现匹配对应。因此,我们首先要想办法使这两组点的个数一致起来,例如:强行使得X轴上只有两个点,也就是说,强行使得X轴上的某些点重合在一起,如图14.3(b)所示。为此,我们需要进一步完善“随机变量”的定义:对函数映射X:Ω→R加以约束,使其由图14.2(a)所示的“一般形式”变为图14.3(b)所示的“特殊形式”,从而实现与概率映射结果(P轴上的点)之间的匹配对应。具备上述“特殊形式”的函数映射称为可测函数。我们将逐步探索和理解:(1)“特殊形式”的具体内涵,(2)“可测”两个字的具体含义。

图14.3(b)中,函数映射xi=X(ωi)的“特殊形式”体现在:(对集合Ω的分割中的)每一个非空Bi中的所有元素都被映射成同一个数,也就是说,x1=x2=x3和x4=x5=x6。我们将具有上述性质的映射称为可测函数[7]。注意,我们不应该继续使用X:Ω→R来描述可测函数,而应该使用:

因为可测函数在映射Ω中的元素的时候,还用到了(集合Ω的)分割{ϕ,B1,B2,···,Bk}进行“配合”:每一个非空集合Bi中的所有元素必须被映射到同一个数!正如我们前面所提到的:(集合Ω的)分割{ϕ,B1,B2,···,Bk}是(集合Ω的)σ-代数F的“只基于并运算”的(唯一的)基本生成单元,两者是一一对应的!我们并不过多地对{ϕ,B1,B2,···,Bk}和F加以区分。

注意,概率P:F→[0,1]∈R是“针对”F的函数映射,对比式(14.9),我们不难理解为什么可测函数的映射结果(图14.4中X轴上的点)能够和概率的映射结果(图14.4中P轴上的点)对应起来,F(或等价的{ϕ,B1,B2,···,Bk})在其中起到了“纽带”的作用。具体说,(非空)集合B1,B2,···,Bk被映射成P轴上的k个点,从B1,B2,···,Bk中的每一个集合里面各取一个元素,取出来的k个元素被映射成X轴上的k个点,最终,P轴上的k个点与X轴上的k个点通过B1,B2,···,Bk对应匹配在了一起,如图14.4所示。

上面的“对应匹配”四个字还是太抽象,我们需要将其进一步描述清楚。函数X将集合Ω中的元素ωi映射成实数(X轴上的点)xi=X(ωi),那么,X的逆映射将X轴上的点xi映射成什么呢?是不是集合Ω中的元素ωi?答案是否定的,集合Ω中可能有多个元素都被函数X映射成同一个实数!因此,函数X的逆映射X-1将实数轴上的点xi映射成:集合Ω的子集Ai∈Ω(包括空集ϕ),即:

图14.4 对于可测函数X,每一个非空集合B i中的所有元素必须被映射到同一个值。从(非空)集合B 1,B 2,···,B k中的每一个集合里面各取一个元素,取出来的k个元素被映射成X轴上的k个点;而B 1,B 2,···,Bk被映射成P轴上的k个点;最终,P轴上的k个点与X轴上的k个点通过B 1,B 2,···,B k对应匹配在了一起。

(www.xing528.com)

其中,G为由(集合Ω的)子集Ai∈Ω所组成的集族。于是,我们找到了这两组点(P轴上的k个点与X轴上的k个点)之间“对应匹配”的具体过程(如图14.4所示):首先,通过X的逆映射,将X轴上的k个点映射成集合Ω的一组子集B1,B2,···,Bk;然后,通过概率(函数),将B1,B2,···,Bk映射成P轴上的k个点。

上述两个过程能够“衔接”起来的关键[8]:X的逆映射结果能够继续被概率(函数)进行映射!前面关于可测函数的定义正是为了保障这一点。我们也可以直接从这个约束条件出发,给出关于可测函数的另一个(也是很多教科书所普遍采用的)定义:

•可测函数:如果函数X的逆映射X-1:R→G满足G⊆F,也就是说,对于任意ωi∈Ω,都有X-1(X(ωi))∈F,那么,我们称函数X:(Ω,F)→R为可测函数。

我们分别采用直接(即:映射X需要满足的条件)和间接(即:逆映射X-1需要满足的条件)两种方式,对可测函数进行描述,这两个定义是一致的:要使得X-1(X(ωi))∈F对于任意ωi∈Ω都成立,每一个Bj中的所有元素必须被X映射为同一个数;反之亦然。

直接描述方式启发我们将图14.4画了出来;间接描述方式便于用数学符号进行分析和推理

“过程(1)”要使得“过程(3)”能够顺利进行,也就是说,Ai∈F始终成立。最终,我们可以完善随机变量的定义:

•随机变量:从集合Ω到实数轴R上的可测函数映射X:Ω→R,记为X(ω),其中ω∈Ω,X(ω)∈R。

对比随机变量(初步)的定义,我们的修正只是加了“可测”两个字。通过上面对可测函数的分析和描述,可以看出,“可测”两个字是下面这句话的缩写,即:

•可以用概率对:通过函数逆映射找到的集合,进行测量。

正如我们前面所提到的:概率是一种对集合的(归一化)测量函数,其定义域为(集合Ω的)σ-代数F。当集合A∈F时,可以通过概率对A进行测量;否则,便不能用概率对其进行测量。

图14.4还留有一个小小的“瑕疵”需要完善,在前面关于可测函数的直接描述中,只要求:同一个Bi中的元素被随机变量X映射成同一个数,即x1=x2=x3和x4=x5=x6,但是,我们并没有强行要求:不同Bi中的元素被随机变量X映射成不同的数,也就是说,可能会出现x1=x2=x3=x4=x5=x6的情况。此时,X轴上只有一个点,而P轴上却有两个不同的点P1和P2,前面描述的“对应匹配”过程“似乎”遇到了问题。

在这种情况下,逆映射X-1的结果是B1∪B2,因此,X轴的那个点x1=x2=x3=x4=x5=x6应当与P(B1∪B2)=P1+P2进行“对应匹配”(而不是与P轴上的两个点P1和P2进行“对应匹配”)。

现在,我们应该对P(X=5)=0.3有一个正确的理解,它的意思并不是:概率P将实数X映射成另一个实数P(X),当X=5时,对应的函数值是P(5)=0.3。事实上,P(X=5)=0.3的具体形式是P(X-1(5))=0.3,它的意思是:X=5(所对应的)这个事件的概率是0.3。逆映射X-1(5)给出了对应的事件(即:集合Ω的一个子集),(集合测量函数)概率将这个事件映射成了实数0.3。

最终,通过随机变量(一个可测函数X)和概率(一个集合测量函数P),我们成功地将概率空间中的(Ω,F)映射到了一个二维空间XP平面,也就是说,

从而给(Ω,F)空间赋予了数的结构,使得后续的数学分析成为可能。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈