二项分布题目

2024-04-27

二项分布题目(精选8篇)

篇1:二项分布题目

二项分布与其他分布的关系

摘 要:

二项分布是一种常见的离散型随机变量的概率模型,在概率教学中占有重要地位。本文从二项分布的定义入手,重点分析和阐述了二项分布和“0-1”分布、超几何分布、泊松分布、正态分布的近似关系及基于这些关系所带来的计算上的便利。以期在教学中能使学生更全面深入的理解和认识二项分布。

关键词:

二项分布 “0-1”分布 超几何分布 泊松分布 正态分布近似

1.二项分布的定义

设随机变量X示n重伯努利试验中事件A发生的次数,其概率函数为:

p(x)=P(X=x)=Cxnpxqn-x x=0,1,…,n

则称设随机变量X服从参数为n和p的二项分布,记为X~B(n,p),也称广义贝努里试验。

2.二项分布与其它分布的关系

2.1二项分布与“0-1”分布间的关系

进行一次试验,其结果要么“成功”,要么“失败”,记X=1成功0失败,即随机变量X表示一次试验中成功的次数,且p(x)=P(X=x)=pxq1-x(x=0,1)则称随机变量X~“0-1”分布,p为试验结果“成功”发生的概率。该试验也称为贝努里试验。

X~“0-1”分布,其期望、平方的期望、方差及特征函数容易得到:

E(X)=0×(1-p)+1×p=p

E(X2)=02×(1-p)+12×p=p

D(X)=E(X2)-E2(X)=p-p2=p(1-p)

φ(t)=E(eitX)=eit?o×(1-p)+eit?1×p=1-p+peit

将贝努里试验在相同条件下独立进行n次,并以随机变量Y表示n次试验中“成功”的次数,则Y~B(n,p)。若以Xi表示第i次试验中成功的次数,则X1,X2…Xn,独立同“0-1”分布(i=1,2…n)且Y=∑ni=1Xi。则二项分布的期望、方差及特征函数可由二项分布和“0-1”分布间的函数关系得到:

E(Y)=E(∑ni=1Xi)=∑ni=1E(Xi)=np

D(Y)=D(∑ni=1Xi)=∑ni=1D(Xi)=np(1-p)

φY(t)=E(eitY)=E(eit∑ni=1Xi)=∏ni=1E(eitXk)=∏ni=1(1-p+peit)=(1-p+peit)n

易见,在教学中利用二项分布和“0-1”分布的关系,使二项分布的上述特征数更容易计算和理解。

2.2二项分布与超几何分布的关系

从含有M件次品的N件产品中任取n件(每次任意取出一个,取后不放回,连续取n次),设随机变量X表示n件产品中出现的次品数,则X~H(n,M,N),概率函数为:

p(x)=P(X=x)=CxMCn-xN-MCnN=p(x,n,M,N)x=0,1,…,n

若将上述取件方式变为每次任意取出一个,取后放回,连续取n次,则易知其中所含的次品数X~B(n,p),其中p=MN。这里有放回的抽样使得每次抽取时的次品率保持不变,

且各次抽取结果相互独立。

而当产品总数N很大时,抽取样品的个数n相对于N较小时(一般来说nN≤0.1),不放回抽样可近似看成每次抽样结果是相互独立的有放回抽样。据此现实意义,可帮助我们理解二项分布与超几何分布的近似关系:

limN→∞CxMCn-xN-MCMN=Cxnpxqn-x x=0,1,…,n

其中,p=MN,q=1-MN=MN-M,一般要求nN≤0.1。证明见文献[1]。

超几何分布是一种重要的、应用广泛的概率模型。据此关系在合适的条件下可将服从超几何分布的随机变量的概率值的计算近似为服从二项分布的随机变量的.概率值进行计算。

2.3二项分布和泊松分布间的关系

若随机变量X表示某个交通路口单位时间内发生交通事故的次数,设所观察的这段时间为[0,1],取一个很大的自然数n,把这段时间分为等长的n段

l1=0,1n,l2=1n,2n,…li=in,i+1n,…ln=n-1n,1

假定:(1)在每段li内,恰好发生一次交通事故的概率与时段长度成正比,可取为λn;

(2)由于n很大,故每段时间间隔很小,认为在这么小的时段内发生两次或更多次的交通事故是不可能的。故在每个时段内不发生交通事故的概率为1-λn;

(3)li各时间段内是否发生交通事故是独立的。

因此,在[0,1]时段内要么发生一次交通事故,其概率为λn,要么不发生交通事故,其概率为1-λn,而各时间段内是否发生交通事故是独立的。故[0,1]时段内发生交通事故的次数X服从二项分布B(n,λn),其概率函数为:

P(X=x)=Cxn(λn)x(1-λn)n-x x=0,1,…,n

严格的说,上式只是近似成立,当n→∞时,limn→∞Cxnpxqn-x=λxx!e-λ其中λ=np。一般要求p≤0.1。证明见文献[1]。在教学中可利用此关系使学生自然的理解泊松分布的特性,它常用来描述大量随机试验中稀有事件出现的次数。

2.4二项分布和正态分布的关系

据棣莫弗――拉普拉斯定理[2]:设Yn~B(n,p)n=1,2,…则对z有:

limn→∞P(Yn-npnpq≤z)=12π∫z-∞e-t22dt

由此可知,当n充分大时,服从二项分布的随机变量Yn近似的服从正态分布N(np,npq).这里是用一个连续型的正态分布来近似离散型的二项分布,应用时p应满足0.1 在教学中可利用此关系说明二项分布以正态分布为极限分布,并且,当n充分大时

P(m1≤Yn≤m2)≈Φ(m2-npnpq)-Φ(m1-npnpq)

也就是说可利用标准正态分布表来解决较难计算的二项分布的概率计算问题。

3.结束语

综上所述,二项分布B(n,p)可看成n个独立同“0-1”分布的随机变量的和,从而利用和函数的关系易于计算二项分布的某些特征值;在产品抽样中,若产品总数N很大,抽取的样品个数n相对于N较小时(nN≤0.1),所抽取的次品数所服从的超几何分布可用二项分布近似;当n很大,p较小,一般要求p≤0.1,λ=np适中时可用泊松分布近似二项分布;当n充分大。

参考文献:

[1]沈恒范.概率论与数理统计教程第5版[M].北京:高等教育出版社,.6:55-63.

[2]李裕奇.概率论与数理统计[M].北京:国防工业出版社,.8:193-195.

[3]魏振军.概率论与数理统计三十三讲[M].北京:中国统计出版社,.

篇2:二项分布题目

二项分布是概率统计里面常见的分布,是指相互独立事件n次试验发生x次的概率分布,比较常见的例子。种子萌发试验,有n颗种子,每颗种子萌发的概率是p,发芽了x颗的概率就服从二项分布。

如果还是迷茫,就听我说说故事,在古代,大概明末清初的时候,瑞士有个家族,叫伯努利家族,出了很多数学家,有一位叫詹姆斯·伯努利(James Bernoulli)的,比较喜欢做试验,他的试验有特点,是一系列的试验,没发生就是失败,而且每次的成功概率都是p,若果失败了就是q=(1-p),只有这两种情况,后来人们给了这除了成功就是失败的性质一个比较抽象的名称,叫相互对立事件。在这些试验中,每次得出的结果与其他次试验都不发生关系,同样人们也给了这种不发生关系的性质一个比较抽象的名称,叫相互独立事件,同时把这种试验叫做伯努利试验。在n次伯努利试验中,发生x次的概率满足二项分布。

如果令q=(1-p),那么很容易得出发生x次的概率为C{x,n}*p^x*q^(n-x),因为决定该分布的只有n、p,所以为了简单起见,人们把x服从n,p的二项分布记做x~B(n,p)。

现在的目标是计算二项分布的期望和方差,在网上寻找二项分布的期望和方差大都给一个结果,np、npq,很难找到它是怎么来的。好不容易查到,还是花钱才能看的,就那几步过程,有必要藏着盖着吗?今天我把过程写出来,让大家都了解了解,都是原创,互相学习,希望支持。

首先,不厌其烦地说一下期望与方差的关系,以便清晰思路。期望用E表示,方差用D表示,一般把自变量记做ξ,如果对于结果为ξ的概率为Pξ那么,其期望为Eξ=∑ξ*Pξ,方差为Dξ=∑(ξ-Eξ)^2*Pξ,另外还有一个常见的量叫做标准差,一般用σ表示,σξ=√Dξ,根据方差的概念,可知: Dξ=∑(ξ-Eξ)^2*Pξ

=∑(ξ^2+Eξ^2-2*ξ*Eξ)*Pξ

=∑(ξ^2*Pξ+Eξ^2*Pξ-2*Pξ*ξ*Eξ)

=∑ξ^2*Pξ+Eξ^2*∑Pξ-2*Eξ*∑Pξ*ξ 因为∑Pξ=1而且Eξ=∑ξ*Pξ 所以Dξ=∑ξ^2*Pξ-Eξ^2 而∑ξ^2*Pξ,表示E(ξ^2)所以Dξ =E(ξ^2)-Eξ^2 下面计算数学期望, Eξ=∑{ξ =0,n}ξ*C{ξ,n}*p^ξ *q^(n-ξ)

=∑{ξ =0,n}ξ*n!/ξ!/(n-ξ)!*p^ξ *q^(n-ξ)

=∑{ξ =1,n}n!/(ξ-1)!/(n-ξ)!*p^ξ *q^(n-ξ)

=n*p*∑{ξ =1,n}C{ξ-1,n-1}*p^(ξ-1)*q^(n-ξ)

=n*p*(p+q)^(n-1)=n*p

如果要计算方差,根据公式Dξ =E(ξ^2)-Eξ^2可得出结果,过程如下,Dξ =E(ξ^2)-Eξ^2

=∑{ξ =0,n}ξ^2*C{ξ,n}*p^ξ *q^(n-ξ)- n*p*∑{ξ =0,n}ξ*C{ξ,n}*p^ξ *q^(n-ξ)

=n*p*∑{ξ =1,n}ξ*(n-1)!/(ξ-1)!/(n-ξ)!*p^(ξ-1)*q^(n-ξ)- n*p*∑{ξ =1,n}ξ*C{ξ,n}*p^ξ *q^(n-ξ)

=n*p*∑{ξ =1,n}p^(ξ-1)*q^(n-ξ)*ξ*(C{ξ-1,n-1}-C{ξ,n}+C{ξ,n}*q)

=n*p*∑{ξ =1,n}p^(ξ-1)*q^(n-ξ)*ξ*[C{ξ,n}*q-(C{ξ,n}-C{ξ-1,n-1})]

=n*p*[∑{ξ =1,n}p^(ξ-1)*q^(n-ξ)*ξ*C{ξ,n}*q-∑{ξ =1,n-1}p^(ξ-1)*q^(n-ξ)*ξ*C{ξ,n-1}]

=n*p*[∑{ξ =1,n}p^(ξ-1)*q^(n-ξ)*n!/(ξ-1)!/(n-ξ)!*q-∑{ξ =1,n-1}p^(ξ-1)*q^(n-ξ)*(n-1)!/(ξ-1)!/(n-1-ξ)!]

=n*p*[∑{ξ =1,n}n*q*C{ξ-1,n-1}*p^(ξ-1)*q^(n-ξ)- ∑{ξ =1,n-1}(n-1)*q*C{ξ-1,n-2}*p^(ξ-1)*q^(n-ξ-1)]

=n*p*[n*q*(p+q)^(n-1)-(n-1)*q*(p+q)^(n-2)]

=n*p*[n*q-(n-1)*q]

=n*p*q

篇3:例谈二项分布的应用

1 电力分配

某车间有300台车床, 任一时刻, 每台开动的概率为0.65, 一台车床开工时需要一个单位功率的电力, 各台车床相互独立地工作。问, 配电部门至少要供给这个车间多少个单位功率的电力, 才能分别以95%、99%、99.9%、99.999%的概率保证该车间不致因供电不足而影响生产?

如果时时刻刻都供300个单位功率的电力, 一定能够100%地保证所有的车床不会因电力不足而“罢工”, 但是这样会导致电力供应过剩, 从而影响经济效益。所以, 需要找到合理的供电单位数, 使车床的开工率接近100%, 基本不影响生产, 又节省电力。根据已知条件, 在某一时刻, 开工车床的数目服从n=300, p=0.65的二项分布, 恰好有k台车床工作的概率为Cknpk (1-p) n-k, k=0, 1, 2, …, n。则某时刻, 至多可以有x台车床同时开工的概率为:undefined, 经过计算得到表1。

因为一台车床需要一个单位功率的电力, 由表1可知, 配电部门供电分别为208、214、220、229个单位功率时, 能够以不低于95%、99%、99.9%、99.999%的概率保证车间生产不会因供电不足而受到影响。229÷300=0.76, 就是说, 对于该车间, 供电量为满负荷的76%时, 既能够以99.999%的概率保证车间生产正常进行, 又大大节省了电力资源。

2 人力分配

某公司研发楼有5层, 每层有100名员工, 每人一台电脑, 每层安排有一位IT服务工程师, 负责电脑及网络的维护。任一时刻, 每位员工需要IT工程师协助的概率为0.5%。有两种方案安排IT工程师的工作:1) 每位IT工程师只负责本楼层的电脑及网络的维护, 即, 1人维护100台电脑;2) 每位IT工程师优先服务于本楼层, 在某位IT工程师忙不过来的时候, 其他闲着的IT工程师要对其帮助, 即, 5人共同维护500台电脑。问, 哪种方案更加合理?

采用方案1时, 某层楼出故障的电脑台数服从n=100, p=0.005的二项分布, 某时刻恰好有k台电脑出故障的概率为Cundefined0.005k0.995100-k, k=0, 1, 2, …, 100。计算可知, 没有电脑出故障 (k=0) 、恰好有1台电脑出故障的概率分别为0.6058和0.3044, 0.6058+0.3044=0.9102, 有2台或者更多电脑出故障的概率为1-0.9102=0.0898, 就是说, 对于某一层楼的IT工程师而言, 能够忙得过来的概率为91.02%, 忙不过来的概率为8.98%。所有的IT工程师们都能够忙得过来的概率为0.91025=0.6247, 整栋研发楼里面出现至少有一位IT工程师忙不过来的情况的概率为1-0.91025=0.3753, 即, 至少有一台出故障的电脑不能及时得到维护的概率为37.53%。

采用方案2时, 整栋楼里出故障的电脑台数服从n=500, p=0.005的二项分布, 恰好有k台电脑出故障的概率为Cundefined0.005k0.995500-k, k=0, 1, 2, …, 500。计算可知, 没有电脑出故障 (k=0) , 恰好有1台、2台、3台、4台和5台电脑出故障的概率分别为0.0816、0.2050、0.2570、0.2143、0.1338和0.0667, 0.0816+0.2050+0.2570+0.2143+0.1338+0.0667=0.9584, 有6台或者更多电脑出故障的概率为1-0.9584=0.0416, 就是说, 对于整栋研发楼而言, IT工程师们能够忙得过来的概率为95.84%, 忙不过来的概率为4.16%, 即, 至少有一台出故障的电脑不能及时得到维护的概率为4.16%, 低于前面的37.53%。

通过以上结果表明, 方案2优于方案1。通俗的理解或解释是, IT工程师们互相帮助要优于“各扫自家门前雪”, 社会提倡人们友爱互助, “二项分布”也支持。

3 质量检测

某工厂生产某种部件, 有三条独立的生产线制造这种部件, 根据以往的统计数据可知, 这三条生产线制出的产品的合格率分别为0.95、0.93、0.97, 此合格率基本上能够满足客户的要求。某一天, 随机从三条生产线制造的部件中各抽取10件, 经检测, 发现有6件不合格, 问, 这是否属于正常范围?

因为, 从每条生产线制造的部件中各抽取了10件, 可以认为这30件的平均合格率应为 (0.95+0.93+0.97) ÷3=0.95, 这30件中合格的件数服从n=30, p=0.95的二项分布, 恰好有k件合格的概率为Cundefined0.95k0.0530-k, k=0, 1, 2, …, 30。有6件不合格, 即, 至多有24件合格的概率为undefined, 这个值很小, 30件中有6件不合格是个小概率事件, 然而, 在一次抽查中却发生了。由此可以认为前面检出的三条生产线的产品合格率靠不住, 很可能某条 (也可能多条) 生产线的合格率下降了, 需要重新检测。接下来, 只随机抽检某一条生产线的产品, 就可以确定是哪条生产线的问题, 然后对其进行调试或维修。

4 结语

应用二项分布模型, 能够帮助企业进行产品质量控制, 有效地运用人力、物力资源, 少投入多产出, 提高经济效益。在科技预测和经济活动的风险管理、决策等方面, 二项分布也有所应用。

参考文献

[1]魏曼莎.关于二项分布的概率计算[J].枣庄师专学报, 1996 (3) :18-20.

[2]盛骤, 谢式千, 潘承毅.概率论与数理统计 (第3版) [M].北京:高等教育出版社, 2001.

篇4:二项分布及其应用

一、二项分布的常规问题

例1 在大豆的杂交试验中,基因为[XxYy]的抗旱高杆植株自交,在后代的基因中显性基因有2个的概率是多少?

解析 有[X]或[Y]为显性基因,而自交后的基因中每个基因座上出现显性基因的概率为[p=12],因此出现隐形基因的概率为[q=12],而个体基因中有两对等位基因,于是自交后的基因中显性基因的个数为2个的概率为[P(x=2)=C24122122=616=38].

点拨 在[n]次独立重复试验中,设事件[A]发生的次数为[k],在每次试验中事件[A]发生的概率为[p],那么在[n]次独立重复试验中,事件[A]恰好发生[k]次的概率为[P(X=k)=Ckp(1-p)n-k(k=0,1,2,…,n)],实际上,它就是二项展开式[[(1-p)+p]n]的第[k+1]项. 通过以上运算我们也可以得到显性基因为0到4个的概率并且它们满足二项展开式,即:

[12+124=C04120124+C14121123+]

[C24122122+C34123121+C44124120]

[=116+416+616+416+116=1].

于是我们可以看出自交后的群体中显性基因为零的概率为[116],显性基因有一个的概率为[416],显性基因有两个的概率为[616],显性基因有三个的概率为[416],显性基因为全部的概率为[116].

例2 在一次数学考试中, 第14题和第15题为选做题. 规定每位考生必须且只需在其中选做一题. 设4名考生选做这两题的可能性均为[12].

(1)其中甲、乙两名学生选做同一道题的概率;

(2)设这4名考生中选做第15题的学生数为[X]个,求[X]的分布列及数学期望.

解析 (1)设事件[A]表示“甲选做14题”,事件[B]表示“乙选做14题”,则甲、乙两名学生选做同一道题的事件为“[AB+AB]”,且事件[A],[B]相互独立.

∴[P(AB+AB)=P(A)P(B)+P(A)P(B)]

=[12×12+(1-12)×(1-12)=12].

(2)随机变量[ξ]的可能取值为0,1,2,3,4. 且[ξ?B(4,12)].

∴[P(ξ=k)=Ck4(12)k(1-12)4-k]

[=Ck4(12)4(k=0,1,2,3,4)].

所以变量[ξ]的分布列为

[[ξ]\&0\&1\&2\&3\&4\&[P]\&[116]\&[14]\&[38]\&[14]\&[116]\&][Eξ=0×116+1×14+2×38+3×14+4×116=2]

或[Eξ=np=4×12=2.]

点拨 应用二项分布时,应注意判断是否满足以下应用条件:(1)每次实验只有两类对立的结果;(2) [n]次事件相互独立;(3)每次实验某类结果的发生的概率是一个常数. 本题中考生之间的选题是相互独立的,4个考生选做是4次独立重复实验,因此本题随机变量服从二项分布.

例3 某家具城进行促销活动,促销方案是:顾客每消费满1000元,便可以获得奖券一张,每张奖券中奖的概率为[15],若中奖,则家具城返还顾客现金1000元,某顾客购买一张价格为3400元的餐桌,得到3张奖券,设该顾客购买餐桌的实际支出为[ξ]元.

(1)求[ξ]的所有可能取值;

(2)求[ξ]的分布列;

(3)求[ξ]的期望[Eξ].

解法一 (1)[ξ]的所有可能取值为3400,2400,1400,400.

(2)[P(ξ=3400)=(45)3=64125?],

[P(ξ=2400)=C13(15)(45)2=48125],

[P(ξ=1400)=C23(15)2(45)=12125],

[P(ξ=400)=C33(15)3=1125].

[ξ]的分布列为

[[ξ]\&3400\&2400\&1400\&400\&[P]\&[64125]\&[48125]\&[12125]\&[1125]\&]

(3)[Eξ=3400×64125+2400×48125+1400×12125]

[+400×1125=2800.]

解法二 设该顾客中奖奖券[η]张,则[ξ=3400-1000η,η~B(3,15)].

(2)[P(ξ=3400)=P(η-0)=(45)3=64125],

[P(ξ=2400)=P(η=1)=C13(15)(45)2=48125,P(ξ=1400)=P(η=2)=C23(15)2(45)=12125,P(ξ=400)=P(η=3)=C33(15)3=1125.]

(3)[Eξ=3400-1000Eη=3400-1000×35=2800.]

二、二项分布与超几何分布

例4 袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球. 求:

(1)有放回抽样时,取到黑球的个数[X]的分布列;

(2)不放回抽样时,取到黑球的个数[Y]的分布列.

解析 (1)有放回抽样时,取到的黑球数[X]可能的取值为0,1,2,3. 又由于每次取到黑球的概率均为[15],3次取球可以看成3次独立重复试验,则[X~B3,15].

[∴P(X=0)=C03150×453=64125],

[P(X=1)=C13151×452=48125],

[P(X=2)=C23152×451=12125],

[P(X=3)=C33153×450=1125].

因此,[X]的分布列为

[[X]\&0\&1\&2\&3\&[P]\&[64125]\&[48125]\&[12125]\&[1125]\&]

(2)不放回抽样时,取到的黑球数[Y]可能的取值为0,1,2,且有:[P(Y=0)=C02C38C310=715];[P(Y=1)=][C12C28C310=715];[P(Y=2)=C22C18C310=115].

因此,[Y]的分布列为

[[Y]\&0\&1\&2\&[P]\&[715]\&[715]\&[115]\&]

点拨 有放回抽样时,每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,这种抽样是二项分布模型. 而不放回抽样时,取出一个则总体中就少一个,因此每次取到某物的概率是不同的,这种抽样为超几何分布模型. 因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样.

例5 零件的加工都需要一定的工序,国家规定加工某种零件的尺寸误差不得超过1.00mm. 质检人员到某厂检查,从该零件的生产加工线中随机地抽出15个零件作样本,经检测得各零件误差尺寸的茎叶图(以小数点前一位数为茎,小数点后一位数字为叶)如下:

[0

1][1 3 2 1 5 9 8 7 3 2

1 2 3 5 4][零件误差尺寸(mm)]

(1)某检查人员从这15个零件中,随机地抽出3个,求恰有1个误差超标的概率.

(2)以此15个零件的样本数据来估计这批零件的总体数据. 若从这批数量很大的零件中任选3个,记[ξ]表示抽到的零件尺寸超标的个数,求[ξ]的分布列及期望[Eξ].

(3)在这15个零件中,任取3个,记[η]表示抽到的零件尺寸超标的个数,求[η]的分布列及[Eη].

解析 (1)设“15个零件中任选3个,恰好有1个零件尺寸超标”为事件A,则[P(A)][=C15C210C315=4591.]

所以从这15个零件中任选3条恰好有1个零件尺寸超标的概率为[4591.]

(2)依题意知,这批零件中尺寸超标的概率[P=515=13],所有[ξ]的取值为0,1,2,3,其分布列如下:

[[ξ]\&[0]\&[1]\&[2]\&[3]\&[P(ξ)]\&[C03(13)0(23)3]\&[C13(13)1(23)2]\&[C23(13)2(23)1]\&[C33(13)3(23)0]\&]

即:

[[ξ]\&[0]\&[1]\&[2]\&[3]\&[P(ξ)]\&[827]\&[49]\&[29]\&[127]\&]

所以[Eξ=0×827+1×49+2×29+3×127=1.]

也可由:[ξ?B(3,13)],即[ξ?B(3,13)]服从二项式分布,所以[Eξ=1.]

(3)依条件,[η]服从超级几何分布:[N=15,][M=5,n=3], [η]的可能值为0,1,2,3. 则[η]的分布列为:[P(η=k)=Ck5C3-k10C315(k=0,1,2,3)]

[[η]\&[0]\&[1]\&[2]\&[3]\&[P(η)]\&[2491]\&[4591]\&[2091]\&[291]\&]

所以[Eη=0×2491+1×4591+2×2091+3×291=1]

或由公式[Eη=MnN,]得[Eη=1].

点拨 超几何分布和二项分布都是离散型分布,超几何分布和二项分布的区别在于:(1)超几何分布需要知道总体的容量,而二项分布不需要;(2)超几何分布是不放回抽取,而二项分布是放回抽取(独立重复). 超几何分布和二项分布的联系:当总体的容量非常大时,超几何分布近似于二项分布……即当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,且每次抽取时又只有两种试验结果,此时可以把它看作独立重复试验,利用二项分布求其分布列与期望.

1. 为拉动经济增长,某市决定新建一批重点工程,分别为基础设施工程、民生工程和产业建设工程三类,这三类工程所含项目的个数分别占总数的[12, 13, 16],现在3名工人独立地从中任选一个项目参与建设.

(1)求他们选择的项目所属类别互不相同的概率;

(2)记[ξ]为3人中选择的项目属于基础设施工程、民生工程和产业建设工程的人数,求[ξ]的分布列及其数学期望.

2. 某学生在上学路上要经过4个路口,假设在各路口是否遇到红灯是相互独立的,遇到红灯的概率都是[13],遇到红灯时停留的时间都是2min.

(1)求这名学生在上学路上到第三个路口时首次遇到红灯的概率;

(2)求这名学生在上学路上因遇到红灯停留的总时间[x]的分布列.

1. (1)[P=3!] [P(A1B2C3)=6P(A1)P(B2)P(C3)][=6×12×13×16=16]

(2)

[[ξ]\&0\&1\&2\&3\&[P]\&[127]\&[29]\&[49]\&[827]\&]

[Eξ=0×127+1×29+2×49+3×827=2]

2. (1)[P(A)=(1-13)×(1-13)×13=47]

篇5:二项分布的期望和方差的详细证明

山西大学附属中学韩永权

离散型随机变量的二项分布:

在一次随机试验中,某事件可能发生也可能不发生,在n次独立重复试验中这个事件发生的次数ξ是一个随机变量.如果在一次试验中某事件发生的概率是P,那么在n次独立重复试验中这个事件恰好发生k次的概率是Pn(k)Cnkpkqnk,(k0,1,2n q1p)

称这样的随机变量ξ服从二项分布,记作ξ~B(n,p),其中n,p为参数,并记Cnkpkqnk=b(k;n,p).求证:服从二项分布的随机变量的期望Enp.kk1证明如下:预备公式:kcnncn1

00n10n220n2k1k1(n1)(nk)n1n10(pq)n1(cnc1cn...cnq...cnq)1pqn1pq1pq1p1p

kkkknk因为p(k)cnp(1p)nkcnpq,00n1n122n2kknkn0n所以 E0cnpq1c12cnpq...kcnpq...ncnpq npq

00n110n220n2k1k1(n1)(nk)n1n10=np(cnpqcpqcpq...cpq...cq)1n1n1n1n1p

=np(pq)n1np

所以Enp

方法二:

证明:若 X~B(n,p),则X表示n重贝努里试验中的“成功” 次数,现在我们来求X的数学期望。

若设Xi1如第i次试验成功i1,2,0如第i次试验失败n

则XX1X2...Xn,因为 P(Xi1)P,P(Xi0)1Pq

所以E(Xi)0q1pp,则E(X)E[Xi]E(Xi)np

i1i1nn

可见,服从参数为n和p的二项分布的随机变量X的数学期望是np 需要指出,不是所有的随机变量都存在数学期望。求证:服从二项分布的随机变量的方差公式Dnpq(q1p)

1k2预备公式:k2CnknCnk1n(n1)Cn2

kk1k1k2CnknCn)1]Cn1n[(k11

k1k12kk1k2k1k2nCn)Cn1n(k1)Cn1nCn1n(n12 kCnnCn1n(n1)Cn2

22方法一:证明:DE(E)

iiniEi2Cnpq 2

i0

nnn

Cpq1

nn1nC

i2

ni1n1pqinii2inin(n1)Cn 2pqi2

npqn1npC

i1i1n1pqi1ninpCq0n1n1n(n1)p2Ci2ni2n2pi2qni

npqn1np(pq)n1npqn1n(n1)p2(pq)n2

npqn1npnpqn1n(n1)p2npn2p2np2np(1p)n2p2npqn2p2

22由公式D(X)E(X2)[E(X)]2知,DE(E)

npqn2p2(np)2np(1p)

方法二: 设~B(n,p), 则X表示n重贝努里试验中的“成功” 次数。

若设Xi

n1如第i次试验成功i1,2,0如第i次试验失败n 则i是n次试验中“成功”的次数,E(i)0q1pp,i1

故 D(i)E(i2)[E(i)]2pp2p(1p),i1,2,n 由于1,2,...,n相互独立,于是

篇6:二项分布题目

一、条件概率

1.事件A发生的条件下,事件B发生的概率称为“事件A发生的条件下,事件B发生的条件概率”,记为P(B|A);

2.由古典概型可得:P(B|A)n(AB)P(AB);一般情况,P(B|A); n(A)P(A)

3.条件概率具有概率的性质,即0≤P(B|A)≤1;

4.如果B,C是两个互斥事件,那么P(BC|A)P(B|A)P(C|A);如:在一副扑克牌的13张红心中,当先抽出红心A后,再抽一张恰是红心2或3的概率是多少?此题中A表示抽到的是红心A的事件,B表示抽到的是红心2的事件,C表示抽到的是红心3的事

11件,显然事件B与事件C互斥.而P(B|A),P(C|A),那么

1212111; P(B|C)A(P|B)A(|PC)A12126

二、事件的相互独立性

1.概念:

(1)若事件A的发生对事件B是否发生没有影响,事件B的发生对事件A是否发生也没有影响,则称事件A与事件B相互独立.如:抛骰子两次,第一次出现3点记为事件A,第二次出现5点记为事件B,显然,事件A与事件B相互独立.

(2)若事件A与事件B满足P(AB)P(A)P(B),则称事件A与事件B相互独立.如:某射击运动员射击一次,命中目标的概率为0.9,问他连续射击两次都命中的概率是多少?本题中,可把第一次命中目标记为事件A、第二次命中目标记为事件B,则两次都命中就是)P(B)0.90.90.81. 事件AB,由于事件A与事件B相互独立,所以P(AB)P(A·

2.相互独立事件的性质:

(1)事件的“互斥”与“相互独立”是两个不同的概念.两事件“互斥”是指两事件不可能同时发生,两事件“相互独立”是指一个事件的发生与否对另一事件发生的概率没有影响.

A与B也都相互独立.

(2)若事件A与B相互独立,则A与B,A与B,(3)P(AB)P(A)P(B)使用的前提是A,B为相互独立事件.也就是说,只有两个相互独立事件同时发生的概率,才等于每个事件发生的概率的积.一般地,如果事件A1,A2,,An相互独立,则这n个事件都发生的概率等于每个事件发生的概率的积,即P(A1A2An)P(A1)P(A2)P(An).同样,只有当A1,A2,,An相互独立时,这n个事件同

用心

爱心

专心 时发生的概率,才等于每个事件发生的概率的积.

(4)1P(A)P(B)表示两个相互独立事件A,B至少有一个不发生的概率.

三、独立重复试验与二项分布

1.一般地,在相同条件下重复做的n次试验称为n次独立重复试验.注意这里强调了三点:(1)相同条件;(2)多次重复;(3)各次之间相互独立;

2.二项分布的概念:一般地,在n次独立重复试验中,设事件A发生的次数为X,在每次试验中事件A发生的概率为p,那么在n次独立重复试验中,事件A恰好发生k次的概kknk率为P(Xk)C(k,0,1,2,n.此时称随机变量)X服从二项分布,记作np(1p),X~B(n,p),并称p为成功概率.

四、注意事项

1.求解条件概率时,必须认真分析题意,对照条件概率模式,有时的转化是隐含的、巧妙的.

2.对事件的独立性,要结合以前学习的互斥事件、对立事件,加以理解独立事件的概念.注意应用独立事件的概念,证明两个事件的独立性.

3.在求事件的概率时,有时遇到求“至少„”或“至多„”等事件概率的问题,如果从正面考查这些问题,它们是诸多事件的和或积,求解过程繁琐,但“至少„”、“至多„”这些事件的对立事件却往往很简单,其概率也易求出,此时,可逆向思考,先求其对立事件的概率,进而求得原来事件的概率.

4.二项分布指的是随机变量的概率,两点分布指的是随机变量的分布列为两点分布列,这是它们的区别.

用心

爱心

篇7:二项分布教学中的Excel演示

在医学统计学教学过程中, 二项分布是教学中的重点和难点。有人使用SAS、SPSS等通用统计软件包编写演示程序[1, 2], 也有人使用传统的方法进行统计学摸球试验来让学生理解二项分布, 这些方法要么费时费力, 同时学生理解也有一定的难度。也有人用EXCEL来进行二项分布及近似正态分布的电脑实验[3], 却是建立在样本抽样的次层。为解决这些缺陷, , 我们尝试用EXCEL编制演示程序, 进行电脑模拟摸球实验, 来进行二项分布教学展示。

实验设计

本摸球实验的设计思想是:假设在一盒子中有黑、白双色球, 其中黑色球占部的20%, 让实验者进行N次有放回的摸球实验, 计算出可能出现不同黑球个数的事件所发生的概率。如设摸球次数n为30, 根据二项分布理论, 通过EXCEL软件计算出分别出现黑球个数为0, 1, 2, 3, …, 30时的相应确切概率。同时做出黑球出现个数的概率分布柱形图。

具体操作

1.设计演示窗口及完成数据填写

首先用新建一个EXCEL文件, 命名为“摸球实验”然后在此表sheet1工作薄中完成如下工作,

A1格:“摸球个数”A2格:“黑球总体率”C1格:“最小摸球个数”;C2格:“最大摸球个数”

B1格输入欲摸球例数, 比如为“30”, B2格输入黑球总体率, 比如为“0.2”,

D1格中输入希望的最小摸球个数, 比如10, D2格输入希望最大摸球个数, 比如50

说明:此B1、B2, D1, D2四格数据在演示时可以进行改变并重新设置。

A4格:“可能摸到黑球个数”

B4格:“出现白球个数”

C4格:“可能的样本率”

D4格:“发生的概率”

下列单元格需要在相应公式栏中输入如下内容:

A5=“=IF ( (ROW () -5) <$B$1+1, ROW () -5, "") ”

B5=“=IF ( (ROW () -5) <$B$1+1, $B$1- (ROW () -5) , "") ”

C5=“=IF ( (ROW () -5) <$B$1+1, (ROW () -5) /$B$1, "") ”

D5=“=IF ( (ROW () -5) <$B$1+1, COMBIN ($B$1, A5) * ($B$2) ^A5* (1-$B$2) ^B5, "") ”

然后同时选中A5:D5单元格, 按下鼠标左健下拉进行复制, 可复制多行, 比如实验中摸球总数最大不超过2000, 则可复制到2006行即可。

2.设置动态数据区域并在图形中进行引用

前面仅是对演示窗口进行简单设置, 为了能直观观察抽到不同黑球个数时相应发生概率的变化, 需要制作柱形图并对做图数据设置成为动态引用。首先进行对动态区域名称定义。步骤是:点击“插入”菜单下“名称”项的“定义”选项, 弹出“定义名称”对话框, 在“在当前工作簿中的名称”输入框中输入“摸到黑球个数”字样, 在“引用位置”输入框中输入“=OFFSET (Sheet1!$A$5, 0, 0, Sheet1!$B$1+1, 1) ”, 点击确定。按同样方法再添加一个名称为“发生概率”, 引用位置输入“=OFFSET (Sheet1!$D$5, 0, 0, Sheet1!$B$1+1, 1) ”的动态区域的定义。

动态区域定义完成后, 还要作出柱形图并进行引用, 首先按照EXCEL制作柱形图的办法, 以A5:A31区域的“可能摸到黑球个数”的数值为横坐标, 以D5:D31区域的“发生概率”的数值为纵坐标, 作出不同黑球个数时的发生概率柱形图, 然后鼠标右键点击图出任一条线柱, 选择“源数据”, 在“源数据”窗口中, “系列”选项下, 将“值”标签中内容改为“=摸球实验.xls!发生概率”, “分类 (X) 轴标志 (T) :”标签中内容改为“=摸球实验.xls!摸到黑球个数”, 具体如下图1所示:

3.动态循环按键设置

为能让学生动态观察到当不同摸球数量变化时, 二项分布向近似正态分布的变化, 可以在此EXCEL文件窗口中加入VBA控制按钮, 以控制摸球数量的变化, 办法:选择“视图”—“工具栏”—“控件工具箱”, 在窗口中新建一命令按钮, 将按键名改为“改变摸球个数”;然后双击此按钮, 在Visual Basic编辑器中本按钮控件命令输入如下VBA程序:Private Sub Command Button1_Click ()

L=Range ("D1")

H=Range ("D2")

For i=L To H

Application.Screen Updating=False

Range ("B1") =i

tt=Timer

Do Until Timer-tt>0.1

Loop

Application.Screen Updating=True

Next

End Sub

演示与操作

按以上方法设置完成后, 还可进行相关窗口颜色、图形位置、字体大小等设置。以后教学中演示使用时, 教师只用改动B1和B2格子中的摸球个数值和总体率值, 确定输入后, 在窗口中即可引起相关链接数据的变化, 同时在概率柱形图上即可看到摸到不同黑球个数所发生的概率的变化效果。如欲演示二项分布随摸球数量变化而发生改变的动态效果, 可以更改D1和D2格中数值, 注意要让两格中数值均为正整数, 且D2格要大于D1格的值, 然后点击按键运行。效果如图2。

应用效果评价

为评价本课件在医学统计教学应用的实际效果, 比较其与传统照本宣科式讲授法的差别所在, 分别随机选中本校5年制护理专业的两个班级学生进行二项分布授课理解程度的对比效果实验, 授课由同一位老师进行, 其中一班采用本EXCEL演示法进行教学, 二班采用传统直接讲授教学法进行, 两班在性别, 年龄方面无显著性差异.以教学后对知识掌握理解情况进行评价.最终评价结果如下表:

注:▲, 与传统教学比较, χ2=16.71, P<0.01

中可以看出EXCEL教学法与传统教学法在教学效果上存在极显著性差异, 简化教学法教学效果显著优于传统教学法的教学效果 (P<0.01) , 说明应用此演示程序可以极大提高课堂理论教学效果。

注意问题

公式栏中字母输入时, 除汉字外, 其他字符均要求在英文输入状态下输入。当需要使用大样本时, 比如摸球个数超过2000时, 可以将A5到D5单元格向下方复制, 直到所需样本量大小即可。在进行宏程序时, 要注意将EXCEL文件的“宏”安全性设置为“低”。

讨论

本方法利用EXCEL进行二项分布的电脑模拟摸球实验, 具有下面这些优点:

1.EXCEL软件使用非常普及, 可随时满足教师课堂教学演示应用。

2.演示中窗口能做到图表结合, 动静结合, 达到生动直观;辅之以表格数据的计算和展示, 数值表达精确具体。

3.演示时操作简单, 更改窗口中摸球个数 (B1格) 和黑球总体率 (B2格) 的值, 即可看到不同组合下, 可能摸到黑球个数发生概率的变化情况, 教学效果非常明显。

篇8:二项分布及其应用

条件概率

例1 在某次外交谈判中,中外双方都为了自身的利益而互不相让,这时对方有个外交官提议以抛掷一颗骰子决定. 若已知出现点数不超过3的条件下再出现点数为奇数,则按对方的决议处理;否则按中方的决议处理,假如你在现场,你会如何抉择?

解析 设[A]={出现的点数不超过3}={1,2,3},[B=]{出现的点数是奇数}={1,3},由条件概率的定义得,[P(B|A)=P(AB)P(A)][=1312=23],所以对方外交官的提议不利于中方.

例2 某地区气象台统计,该地区下雨的概率为[415],刮风的概率为[215],既刮风又下雨的概率为[110]. 设[A]为下雨,[B]为刮风,求(1)[P(A|B);](2)[P(B|A).]

解析 根据题意得,

[P(A)=415],[P(B)=215],[P(AB)=110].

(1)[P(A|B)=P(AB)P(B)=110215=110×152=34].

(2)[P(B|A)=P(AB)P(A)=110415=110×154=38].

点拨 计算条件概率[P(B|A)]有两种方法:(1)利用缩小基本事件范围的方法计算,可以在缩小的基本事件的范围内,利用古典概型概率公式计算条件概率,即[P(B|A)=n(AB)n(A)],这里[n(A)]和[n(AB)]的计数是缩小了的基本事件的范围;(2)先根据条件概率定义,分别计算概率[P(AB)]和[P(A)],然后根据定义可得,[P(B|A)=P(AB)P(A)].

事件的相互独立性

例3 甲、乙两人各进行一次射击,如果两人击中目标的概率都是0.8,计算:

(1)两人都击中目标的概率;

(2)其中恰有一人击中目标的概率;

(3)至少有一人击中目标的概率.

解析 记“甲射击一次,击中目标”为事件[A],“乙射击一次,击中目标”为事件[B]. “两人都击中目标”是事件[A?B];“恰有1人击中目标”是[A?B]或[A?B];“至少有1人击中目标”是[A?B]或[A?B]或[A?B].

(1)显然,“两人各射击一次,都击中目标”就是事件[A?B],又由于事件[A]与[B]相互独立,

所以[P(A?B)=P(A)?P(B)=0.8×0.8=0.64.]

(2)“两人各射击一次,恰好有一人击中目标”包括两种情况:一种是甲击中乙未击中(即[A?B]),另一种是甲未击中乙击中(即[A?B]). 根据题意,这两种情况在各射击一次时不可能同时发生,即事件[A?B]与[A?B]是互斥的,所以所求概率为:

[P=P(A?B)+P(A?B)=P(A)?P(B)+P(A)?P(B)]

[=0.8×(1-0.8)+(1-0.8)×0.8]=0.32.

(3)法一:“两人各射击一次,至少有一人击中目标”的概率为

[P=P(A?B)+P(A?B)+P(A?B)=0.96.]

法二:“两人都未击中目标”的概率是

[P(A?B)=P(A)?P(B)=(1-0.8)×(1-0.8)=0.04.]

∴至少有一人击中目标的概率为

[P=1-P(A?B)=1-0.04=0.96].

点拨 两个事件独立与互斥的区别:两个事件互斥指两个事件不可能同时发生;两个事件独立指一个事件是否发生对另一个事件发生的概率没有影响.

独立重复试验与二项分布

例4 某单位6个员工借助互联网开展工作,每个员工上网的概率都是0.5(相互独立).

(1)求至少3人同时上网的概率;

(2)至少几人同时上网的概率小于0.3?

解析 因为6个员工上网都是相互独立的,所以该题可归结为[n]次独立重复试验与二项分布问题.

(1)法一:记“有[r]人同时上网”为事件[Ar,]则“至少3人同时上网”即为事件[A3+A4+A5+A6.] 因为[A3,][A4,A5,A6]为彼此互斥事件,所以可应用概率加法公式得,“至少3人同时上网”的概率为

[P=P(A3+A4+A5+A6)=][P(A3)+P(A4)+P(A5)+P(A6)]

=[164(C36+C46+][C56+C66)]=[2132.]

法二:“至少3人同时上网”的对立事件是“至多2人同时上网”,即事件[A0+A1+A2].因为[A0,A1,A2]是彼此互斥的事件,所以“至少3人同时上网”的概率为

[P=1-P(A0+A1+A2)=1-[P(A0)+P(A1)+P(A2)]=2132.]

(2)法一:记“至少[r]人同时上网”为事件[Br],则[Br]的概率[P(Br)]随[r]的增加而减少. 依题意是求满足[P(Br)<0.3]的整数[r]的最小值.

因为[P(B6)=P(A6)=164<0.3,]

[P(B5)=P(A5+A6)=P(A5)+P(A6)=164(C56+C66)=764<0.3,]

[P(B4)=P(A4+A5+A6)=P(A4)+P(A5)+P(A6)=132>0.3,]

所以至少5人同时上网的概率小于0.3.

法二:由(1)知至少3人同时上网的概率大于0.3,至少4人同时上网的概率为

[P(X≥4)=C46(12)2+C56(12)6+C66(12)6=2132>0.3.]

至少5人同时上网的概率为

[P(X≥5)=C56(12)6+C66(12)6=764<0.3.]

所以至少5人同时上网的概率小于0.3.

点拨 (1)独立重复试验是在同样的条件下重复地、各次之间相互独立地进行的一种试验. 在这种试验中,每一次试验只有两种结果,即某事件要么发生,要么不发生,并且任何一次试验中发生的概率都是一样的.(2)在[n]次独立重复试验中,设事件[A]发生的次数为[X],在每次试验中事件[A]发生的概率为[P],那么在[n]次独立重复试验中,事件[A]恰好发生[k]次的概率为[P(X=k)=CknPk][(1-P)n-k],[k=0],[1],[2]…,[n],此时称随机变量[X]服从二项分布. 在利用该公式时,一定要搞清是多少次试验中发生[k]次的事件,如本题中“有3人上网”可理解为6次独立重复试验恰有3次发生,即[n=6,k=3.]

练 习

1. 将两颗骰子各掷一次,设事件[A=]“两个点数不相同”,[B=]“至少出现一个6点”,则概率[P(A|B)]等于( )

A. [1011] B. [511] C. [518] D. [536]

2. 从1,2,3,4,5中任取2个不同的数,事件[A=]“取到的2个数之和为偶数”,事件[B=]“取到的2个数均为偶数”,则[P(B|A)=]( )

A. [18] B. [14] C. [25] D. [12]

3. 已知随机变量[X]服从二项分布[X~B(6,13),]则[P(X=2)=]( )

A. [316] B. [4243] C. [13243] D. [80243]

4. 甲乙两人进行羽毛球比赛,比赛采取五局三胜制,无论哪一方先胜三局则比赛结束,假定甲每局比赛获胜的概率均为[23,]则甲以[3][∶][1]的比分获胜的概率为( )

A. [827] B. [6481] C. [49] D. [89]

5. 如图,[EFGH]是以[O]为圆心,1为半径的圆的内接正方形,将一颗豆子随机地掷到圆内,用[A]表示事件“豆子落在正方形[EFGH]内”,[B]表示事件“豆子落在扇形[HOE](阴影部分)内”,则[P(B|A)]= .

1. A 2. B 3. D

本文来自 360文秘网(www.360wenmi.com),转载请保留网址和出处

【二项分布题目】相关文章:

二项分布教学设计04-22

分布式能源论文题目05-08

分布载荷04-30

故障分布05-02

分布压力05-05

气温分布教案05-06

藏族人口分布范文05-24

会计人才分布范文05-27

广东台风灾害分布06-29

股票筹码分布公式06-30

上一篇:在消费维权培训班上的发言稿下一篇:大连金石滩游记作文初中