第二节 常见的离散型随机变量的分布
[br][br][justify][b]一、等概率分布[/b][b][/b][/justify][br][br] 顾名思义,等概率分布是指每一个可能出现情况的概率取值都是相等的。比如抛硬币、抛骰子等,一般将等概率分布称为“古典概型”。[br][br] 以抛硬币为例,将反面记为0分,正面记为1分,随机变量[math]X[/math]为抛硬币一次的分数,那么[math]x[/math]的分布可以写为:[br][br] [math]p\left(X=k\right)=\left\{\begin{matrix}\frac{1}{2},k=0\\\frac{1}{2},k=1\end{matrix}\right\}[/math][br] 设随机变量[math]X[/math]有[math]n[/math]个取值a[sub]1,[/sub]a[sub]2,...,[/sub]a[sub]n,[/sub]每个取值出现的概率相等,那么,随机变量[math]X[/math]的概率密度函数为:[math]f\left(x\right)=P\text{﹛X=a_k﹜}=1\slash n,[/math][math]k=1,2,...,n。[/math]
[b]二、伯努利分布[br][/b] [br] 伯努利分布,也叫0-1分布或两点分布。凡是随机试验只有两个可能的结果,常用伯努利分布描述,如产品是否格、人口性别统计、系统是否正常、电力消耗是否超负荷等等。其概率分布的列表式为:[table][tr][td][math]X=x_k[/math][/td][td]1[/td][td]0[/td][/tr][tr][td][math]P_k[/math][/td][td][math]P[/math][/td][td][math]1-P[/math][br][/td][/tr][/table][br] 其概率密度函数为:[br][br][justify] [math]p\text{﹛X=k﹜}=p^k\left(1-p\right)^{1-k},[/math] [math]k=0,1[/math][/justify]
[b]三、二项分布[br][br][br][/b] 二项分布,也叫[math]n[/math]重伯努利分布,是指反复多次重复伯努利实验,比如重复抛骰子计算某个点出现几次的概率问题,射击的命中次数和命中率问题,一批种子的发芽率问题,药物治疗病人是否有效的问题,产品的不合格率问题等都要用到二项分布。实际上,在现实生活中一个事件的发生能归并为两种结果,并且事件每次发生都是独立的,我们都可以尝试用二项分布来解决一些问题。[br][br] 一般设伯努利实验有两种可能的结果A和B,事件A发生的概率是[math]p[/math],事件B发生的概率是[math]1-p[/math],独立地重复进行[math]n[/math]次该实验,设随机变量[math]x[/math]表示事件A发生的次数[math]K[/math],我们称随机变量[math]x[/math]服从参数为[math]n[/math]的二项分布,记为[math]X-B\left(n,p\right)[/math],其概率密度函数为:[br] [br] [math]p\text{﹛X=k﹜}=c_n^k_{ }p^k\left(1-p\right)^{n-k}[/math][br][br] 以下四张图为[math]n=10[/math],[math]p=\frac{1}{2},\frac{1}{3},\frac{1}{5},\frac{1}{10}[/math]时的二项分布概率图,从图中可以看出,一次事件发生时的概率不同,其概率分布的图形走向也不同,但总有发生次数最大的概率呈现。比如,在[math]X\sim b\left(10,\frac{1}{2}\right)[/math]分布中,某一事件发生5次的概率最大,而在[math]X\sim b\left(10,\frac{1}{3}\right)[/math]分布中,概率值最大的发生次数是3次。见图2-1。
[img]https://www.freeimg.cn/i/2024/02/02/65bcee041a5b9.png[/img][img]https://www.freeimg.cn/i/2024/02/02/65bcee411d31a.png[/img][br][img]https://www.freeimg.cn/i/2024/02/02/65bcee9c3ab21.png[/img][img]https://www.freeimg.cn/i/2024/02/02/65bceed1c280f.png[/img]
[justify] 图2-1 四个二项分布图[/justify][justify][/justify]
在现实生活中,有时人们更关心最有可能的发生次数是多少。比如,在射击实验中最有可能击中的次数是多少,在产品检验中最有可能检出不合格数是多少等。要解决此类问题,可以应用二项分布的性质1进行计算。[br][br] 性质1: 设[math]X\sim B\left(n,p\right)[/math],则[math]X[/math]最可能的值是[math]\text{[}\left(n+1\right)p\text{]}[/math]。如[math]\left(n+1\right)p[/math]是整数,则[math]\text{[}\left(n+1\right)p\text{]}-1=np-q[/math]也是最可能的值,这里[math]\text{[\bullet}\text{]}[/math]为取整函数,例如[math]\text{[}\text{4.2]=4}[/math]。[br][br] [b]证明[/b] 考虑如下概率比,并令其大于1,这保证[math]p_k[/math]随[math]k[/math]增大而严格增大,[br][br] [math]\frac{p_{k+1}}{p_k}=\frac{c_n^{k+1}p^{k+1}q^{n-k-1}}{c_n^kp^kq^{n-k}}=\frac{\left(n-k\right)p}{\left(k+1\right)\left(1-p\right)}>1[/math],即([math]\left(n-k\right)p>\left(k+1\right)\left(1-p\right)[/math],从而[math]k<\left(n+1\right)p-1[/math],即[br][br][math]k+1<\left(n+1\right)p[/math]时[math]p_{k+1}>p_k[/math],故当[math]i\le\left[\left(n+1\right)p\right][/math]时,[math]p_i[/math]严格增加。同上,[math]k>\left(n+1\right)p-1[/math] 时 [br][br][math]p_{k+1}\text{<}p_k[/math],即当[math]i\ge\left[\left(n+1\right)p-1\right][/math]时,[math]p_i[/math]严格下降,由此可证得性质1。 [br]
设[math]n[/math]重伯努利取得概率最大值的[math]k[/math]为[math]k_{max}[/math],如果想要知道[math]k_{max}[/math]在[math]n[/math]中排名地位如何,则只需要计算[math]\frac{k_{max}}{n}[/math]。[br][br] [math]\frac{k_{max}}{n}=\frac{\left(n+1\right)p}{n}=p+\frac{p}{n}[/math],则当[math]n\rightarrow+\infty[/math]时,[math]\frac{k_{max}}{n}\rightarrow p[/math]。[br][br] 二项分布给我们的启示为:①小概率事件有存在的空间,只要[math]n[/math]足够大,就有发生的可能;②最有可能的发生次数,由[math]k_{max}=np[/math]可大体估算;③固定[math]p[/math],随着[math]n[/math]的增大,其取值的分布趋于对称。
[b]四、几何分布[br][br][/b] 几何分布也是以伯努利分布为基础的一种特殊分布,它主要解决在[math]k[/math]次重复独立实验中,某个我们关心的结果在某次([math]k[/math]值)时第一次出现的概率。主要应用场景如在已知某器件报损概率的情况下,测算其正常使用寿命。或在中奖概率一定的情况下,需要多长时间能中的大奖。[br][br] 设随机试验有且只有两种结果A和B,A出现的概率是[math]\:p[/math],B出现的概率是1-[math]p[/math],反复进行该随机试验,随机试验之间彼此独立,随机变量X表示A第一次出现时随机试验进行的次数,此时我们称随机变量X服从几何分布,记为[math]X\sim G\left(p\right)[/math],其概率密度函数为:[br][br] [math]p\left(X=k\right)=\left(1-p\right)^{k-1}p[/math][br] [br] 之所以该分布被称为“几何分布”,由其概率密度函数不难得出,其分布列各项构成等比数列,而等比数列,又称几何数列,这源于除了首项和末项之外,每一项都是前后两项的几何平均数。[br][br] 以下三幅图(见图2-2)是几何分布在不同[math]p[/math]值和[math]k[/math]值时的形态图。第一图为假设A事件发生概率[math]p=0.2[/math],随机变量X在10次重复试验中,分别在第[math]k\left(k=1,2,...,10\right)[/math]时第一次出现A的概率分布图。从图中可以看出,在第一次就出现A事件的概率最高,然后概率值逐渐降低。事实上,当我们尝试增加[math]\:k[/math]值时,就会得到近似的曲线,其概率会无限接近于0,如第二图([math]p=0.2,k=20[/math])。而如果改变事件成功概率[math]P[/math],则会影响曲线的弯曲程度,如第三图([math]\:p=0.5,k=20[/math])。[br]
[img]https://www.freeimg.cn/i/2024/02/03/65bdafa044951.png[/img]
[center]图2-2 三个几何分布图[/center]
[b]五、超几何分布[br][br][/b] 超几何分布也是非常常见的一种分布,对其模型建立一般是这样的:在[math]N[/math]个物品(如产品)中有指定商品[math]M[/math](如废品)个,不放回地抽取[math]n[/math]个,随机变量[math]X[/math]表示抽中[math]k[/math]件指定商品,此时我们称随机变量[math]X[/math]服从超几何分布,记为[math]X\sim H\left(n,N,M\right)[/math],其概率密度函数为:
[math]p\left(X=k\right)=\frac{C_M^{k_{ }}C^{n-k}_{N-M}^{ }}{C_N^n}(k=0,1...,[/math]min[math]\left(M,n\right);M,N,n[/math]为正整数且[math]M\le N,n\le N[/math])
超几何分布其实在性质上与几何分布没有关系,之所以叫这个名字,是因为它的分布列的每一项正好是某个超几何级数中的项,是几何数列的扩展,故命名为“超几何”。[br][br] 以下是[math]X\sim H\left(10,50,20\right)[/math] 的超几何分布图(见图2-3),其中[math]n\le N-M[/math],否则在达到阈值时,部分[math]k[/math]值的概率无意义。
[center] [img]https://www.freeimg.cn/i/2024/02/03/65bdb6fbdcb4c.png[/img][/center] [center] 图2-3 超几何分布图[/center]
超几何分布从图形上来看与二项分布非常相似,实际上,这两个分布有内在的紧密联系,即样本个数越大超几何分布和二项分布的对应概率相差就越小,当样本个数为无穷大时,超几何分布和二项分布的对应概率就相等,换而言之,超几何分布的极限就是二项分布。
[center][img]https://www.freeimg.cn/i/2024/02/03/65bdb83384b51.png[/img][br][/center]
两者之间的动态关系可扫描右边的二维码观看演示。演示区中的超几何分布的参数为[math]X\sim H\left(20,N,25\right)[/math],二项分布的参数为[math]X\sim B\left(20,25\slash N\right)[/math],变化参数为[math]N[/math],变化区间为[math]N=50\rightarrow350[/math]。两个分布在[math]N=50[/math]和[math]N=350[/math]时的状态比较图为参见图2-4。
[img]https://www.freeimg.cn/i/2024/04/16/661e4a6e89f21.gif[/img][br][center]图2-4 超几何分布与二项分布比较图[/center]
[justify] 超几何分布在实际生活中也有相当广泛的应用场景,比如生产企业的质量检测环节,总体个数的最大似然估计,统计假设检验问题等。 [br][/justify]
[b]六、泊松分布[br][br][/b] 泊松分布适合于描述单位时间或空间内随机事件发生的次数。比如某一个服务设施在一定时间内到达了多少人,电话交换机接到了多少次呼叫,汽车站台的候客人数,机器出现的故障次数,显微镜下单位分区内的细菌分布数等。[br][br] 泊松分布是指某个随机事件在一定的时间或空间独立发生,已知该事件发生的平均次数,且为有限值,记为[math]\lambda[/math],随机变量[math]X[/math]表示事件发生的次数[math]K[/math],如果[math]X[/math]服从参数为[math]\lambda[/math]的泊松分布,则记为[math]X\sim po\left(\lambda\right)[/math],其概率密度函数为:
[math]p\left(X=k\right)=\frac{\lambda^k}{k!}e^{-\lambda},k=0,1,2...[/math][br][br]以下是[math]X\sim po\left(\lambda=2\right)[/math]的泊松分布图(见图2-5)。
[center][img]https://www.freeimg.cn/i/2024/02/03/65bdbaa36bc6e.png[/img][/center][center]图2-5 泊松分布图[/center]
泊松分布的参数[math]\lambda[/math]是单位时间(或单位空间)内随机事件的平均发生率。比如,根据统计,2015年共发生17次航空灾难,而这一年共有3400万个航班,即这一年的全球航班失事概率为1/200万次。如果我们将这一概率视为近一段时间飞机失事的发生概率,即[math]p=\frac{1}{2\times10^6}[/math],而将1亿个航班(近三年)作为考察区段,即[math]n=1\times10^8[/math]个,则[math]\lambda=np=50[/math]。[br][center][img]https://www.freeimg.cn/i/2024/02/03/65bdbb7c58a53.png[/img][/center] 泊松分布的概率分布图形与二项分布的图形也非常相似,其实,这两个分布也有着非常密切的关系。通过证明,当[math]n[/math]很大,而[math]p[/math]很小时,可用泊松分布近似代替二项分布。一般[math]n\ge20,p\le0.05[/math]时,两个分布的近似程度更高。两者之间的动态关系可扫描右边的二维码观看演示。演示区中的泊松分布的参数按[math]\lambda=5[/math]=5设置,二项分布的参数[math]n=10\rightarrow100[/math],而[math]p=0.5\rightarrow0.05[/math]。其初始值与结束值之间的两个分布的状态见图2-6。[br][center][img]https://www.freeimg.cn/i/2024/04/16/661e46cdeb4e0.gif[/img][br]图2-6 二项分布与泊松分布比较图[/center] 综合二项分布、超几何分布及泊松分布的规律,可以得出的结论是:超几何分布的极限分布是二项分布,二项分布的极限分布是泊松分布。
以上四种离散分布的动态演示图可以用数学软件Geogebra画出,参见[url=https://www.geogebra.org/m/xfjsmv7v][u]https://www.geogebra.org/m/xfjsmv7v[/u][/url]。学习者可以调整各分布的参数查看图形变化过程,也可下载研究。如在手机端操作,请扫描右边的二维码。其图形呈现如图2-7。[br][center][img]https://www.freeimg.cn/i/2024/02/03/65bdbcf1c61c5.png[/img][/center]
[center]图2-7 四种分布在Geogebra中的呈现[/center]