定义:概率分布表示可以执行的实验结果表示的整个值范围。
也就是说,它描述了事件将来发生的可能性,它是预见的基本工具,因为可以考虑各种自然现象的当前趋势来设计未来事件的场景。
每个概率分布都是由一个变量生成的(因为它可以采用不同的值),随机数x(因为采用的值是完全随机的)而产生的,并且可以有两种类型:
- 离散随机变量(x)。因为它只能接受整数值和它们的有限数量。例如:
- x®变量,用于定义一组40名学生(1、2、3…或40)中在概率主题中批准的学生人数。
离散随机变量(X)的性质
- 0≤p(x i)£1与x取的每个值相关的概率必须大于或等于零且小于或等于1 Sp(x i)= 1与每个取值相关的概率之和x值之一必须等于1。
有一种硬币,扔时只能给出两个结果:正面(50%)或反面(50%)。
下表显示了两次抛硬币的可能结果:
首次发布 | 第二次发布 | 人数FACES IN 2分发布 | 4种可能结果的可能性 |
面对 | 面对 | 二 | 0.5 X 0.5 = 0.25 |
面对 | 交叉 | 之一 | 0.5 X 0.5 = 0.25 |
交叉 | 面对 | 之一 | 0.5 X 0.5 = 0.25 |
交叉 | 交叉 | 0 | 0.5 X 0.5 = 0.25 |
通过制作两次抛硬币可能产生的正面数目分布表,我们得到:
NUMBER OF FACES | 发行 | 此结果的可能性
P(脸) |
0 | (交叉,交叉) | 0.25 |
之一 | (脸,交叉)
+ (交叉,面对) |
0.50 |
二 | (面对面) | 0.25 |
注意:此表并不代表两次抛硬币的实际结果,而是理论结果,即代表两次抛硬币实验的预期行为方式。
- 连续随机变量[x]。因为它可以在相同的时间间隔内同时取整数和小数值,并且可以取无穷多个数值。
例如:
- x®变量,定义一些矿物样品中银的浓度(克)(14.8克,12.1、42.3、15.0、18.4、19.0、21.0、20.8,…,¥)
离散随机变量(X)的性质
- p(x)³0与x取每个值相关的概率必须大于或等于零。换句话说,概率密度函数只能取大于或等于零的值,概率密度函数下定义的面积应为1。
随机变量的概率分布
(最常用)
- 二项分布泊松分布正态分布
二项分布
二项分布是离散随机变量概率的特殊情况,对于它的应用,它可能是最重要的。
此分布对应于满足以下条件的随机实验的性能:
- 进行实验时,只有两个结果是可能的:事件A,称为成功;事件A,其相反的A',称为失败;重复进行实验时,获得的结果与先前获得的结果无关。事件A的概率是恒定的,也就是说,从一项实验的测试到另一项测试的变化没有变化。如果我们称pa为A的概率,则p(A)= P,则p(A')= 1-p = q
*在每个实验中,进行了相同的测试。
任何具有这些特征的实验都遵循二项分布或贝努利分布的模型。
通常,如果您有n个成功概率为p和失败概率为q的伯努利试验,则您建模的概率分布为二项式概率分布,其对应规则为:
由于这些概率的计算可能有些乏味,因此针对n和p的某些值构造了表格,以方便工作。
通过以下三种方法计算二项式概率分布:
- a)使用Minitab 15.b)使用公式c)使用二项式表
例如:
投掷同一个硬币6次时,获得2个正头的几率是多少?
哪里:
- P(X)是事件发生的概率p是事件成功的概率(一次尝试)(0.5)q是事件失败的概率(一次尝试),定义为
q = 1-p(0.50)
- X =期望事件的发生或成功= 2(就二项式表而言,取r)n =尝试次数= 6
- a)使用Minitab 15计算二项式概率分布。
标题C1列为X,第2行第1列放置数字2(代表事件的发生次数,因为您想知道恰好有两张面孔掉下来的可能性)。(请参阅图1)
选择:Ç ALC /概率d istributions / 乙 inomial
接下来,将出现“二项式分布”窗口。
- 选择发生可能性的“试验数”代替6-(N)字段在“现场È通风口概率”的地方0.50(成功在“输入栏”的地方将鼠标指针字段的概率,它会自动出现在用鼠标指针选择的左侧C1 X框中,然后按“选择”。输入数据后,按“确定”。获得结果。
2个头在硬币翻转时掉落6次的机率是0.234375。
从而:
- b)使用公式计算二项式概率分布
将值代入公式中,我们得到:
- c)使用二项式表计算二项式概率分布。
- 对于n和p的组合,该条目表示获得特定r值(事件发生)的概率。要找到该条目,当p≤0.50时,请沿着表格标题在p值中找到p的值。在相应的列中,将n和r定位在左边缘,要找到条目,则p≥0.50时,将p的值放在表格底部,将n和r的上方放在右边缘。
解决相同的示例,但使用二项式表,我们必须:
p = 0.50,n = 6,r = 2
获取表的直接结果。
注意:对于这种特殊情况,其中p = 0.50,可以通过像p≤0.50(蓝色圆圈)或p≥0.50(红色圆圈)工作来获得表的结果。
泊松分布
POISSON分布也是离散随机变量概率的一种特殊情况,这得益于法国人SiméonDenis Poisson(1781-1840)的名字,他是根据他在生命的最后阶段所做的研究开发出来的。 。
此分布用于描述某些过程。
特点:
在这种类型的实验中,所需的成功度表示为单位面积,时间,片段等:
- 每m 2的织物缺陷数量#每天,每小时,每分钟等时在机场降落的飞机数量#每2 cm 2文化的细菌数#每小时,每分钟等时切换到交换机的电话数等按天,月等得出的到达港口的船只数量。
为了确定每单位时间,面积或产品x成功发生的概率,使用的公式为:
哪里:
p(X)= x成功的概率,当它们的平均出现次数为l时。
l =每单位时间,区域或产品的成功平均值或平均值
e = 2.718(自然或对数底数)
X =表示您要发生的成功次数的变量
应当注意,在这种分布中,每单位时间,区域或乘积所发生的成功次数是完全随机的,并且每个时间间隔与另一个给定间隔无关,就像每个区域都与另一个给定区域无关,并且每个产品都与另一个给定产品无关。
泊松概率分布的三种计算方法:
- 使用Minitab 15.使用公式使用泊松表
例如:
如果一家银行每天平均收到(l =)6张不良支票,那么它收到的几率是多少:
- a)在给定的一天(x)上有四张差额支票,b)在连续的两天中有10张差额支票?
(e = 2.718281828)
a)使用Minitab 15计算泊松概率分布。
解决:
- a)x = 4; l =每天6次无底检查
标题C1列为X,第1列第1列放置数字4(代表事件的发生次数,因为您想知道银行在给定的一天收到4张不良支票的概率) 。(参见图2)
选择:ç ALC /概率d istributions / P oisson
接下来将出现“泊松分布”窗口。
- 选择“概率”在“均值”字段(平均值= l)中放置6(无资金的每日支票平均数)。在“输入列”字段中,放置鼠标指针,它将自动出现在左侧C1的框中。鼠标指针,然后按“选择”。数据输入完毕后,按“确定”。
- 因此,银行在给定日期将收到四张不良支票的概率为:
以相同的方式解决:
- X = 10;l = 6 x 2 =平均连续12天到达银行的12张无底支票。
- 从而获得结果。
- 因此,银行连续两天收到十张不良支票的可能性为:
b)使用公式计算泊松概率分布
解决:
- a)x = 4; l =每天6次无底支票,并代入公式
以相同的方式解决:
- b)X = 10;l = 6 x 2 =平均连续12天到达银行的12张无底支票。c)使用泊松表计算泊松概率分布
- 确定Poisson概率的直接值。对于给定的λ值,该条目表示获得特定X值的概率
对于同一示例,求解:
- a)银行在某一天将收到四张不良支票的概率是多少?
我们有x = 4; l =每天6张不良支票;获取表的直接结果:
对于同一示例,求解:
- b)银行连续两天收到十张不良支票的概率是多少?
我们有X = 10; l = 6 x 2 =平均连续12天到达银行的12张无底支票,从表中获得直接结果:
师范大学分布
正态分布也是连续随机变量概率的特殊情况,它首先被法国人亚伯拉罕·德·莫夫(Abraham de Moivre)(1667-1754)认可。随后,卡尔·弗里德里希·高斯(Carl Friedrich Gauss,1777-1855年)阐述了更深的发展并制定了曲线方程。因此,它也通常被称为“高斯钟”。正态变量的分布完全由两个参数确定,即均值(µ)和标准偏差(σ)。使用这种表示法时,法线的密度由以下公式给出:
正态分布在统计中占据如此突出的位置有两个基本原因:
- 它具有一些特性,使其适用于需要通过采样进行推理的大量情况,正态分布几乎适合在许多现象中观察到的实际频率分布,包括人类特征,过程结果公共部门和私营部门的管理人员感兴趣的物理和许多其他措施。
属性:
无论正态概率分布的μ和σ值是多少,曲线下的总面积始终为1,因此我们可以将曲线下的面积视为概率。从数学上讲,确实是:
- 正态分布总体中所有值的约68%处于平均值的±1标准偏差内。正态分布总体中所有值的约95.5%位于均值的±2标准偏差内。正态分布总体中所有值的大约99.7%位于平均值的±3标准偏差内。
正态概率分布曲线下的面积与到标准偏差中测得的平均距离之间的关系。
这些图显示了三种不同的方法来测量法线下的面积。但是,很少有正态概率分布的应用涉及与平均值精确(正负)1、2或3标准偏差的范围。对于这些情况,存在统计表,这些统计表指示法线下面积的一部分,该部分包含在与平均值之间的任意数量的标准偏差(正负)之内。
幸运的是,也可以使用标准正态概率分布来查找任何正态曲线下的区域。该表确定了分布随机变量通常在距均值一定距离之内的面积或概率。这些距离是根据标准偏差定义的。
对于任何正态概率分布,对于任何正态概率分布,所有包含均值相同标准偏差的间隔都将包含曲线下总面积的相同分数。这样就可以仅使用一张标准正态概率分布表。
z的值从以下公式得出:
其中:
- x =相关随机变量的值;μ=随机变量的分布平均值;σ=分布的标准偏差; z =从x到分布平均值的标准偏差数。(使用z只是改变水平轴的测量比例)
通过以下方法计算正态概率分布:
- a)使用正态分布表b)使用Minitab 15 a)使用标准正态概率分布表计算正态概率分布。
例:
有一个旨在提高生产线主管的监督技能质量的培训计划。由于该程序是自我管理的,因此主管需要不同的小时数才能完成该程序。对上述参与者的研究表明,完成该程序所需的平均时间为500小时,并且该正态分布的随机变量的标准差为100小时。
- a)随机选择的候选人需要超过500个小时来完成培训计划的概率是多少?b)随机选择的候选人需要500到650小时之间才能完成训练方案的概率是多少?培训计划?
解决:
- a)绘制正态分布图(高斯钟形图),可以看到曲线下方的一半区域位于500小时平均值的两侧。因此,可以得出结论,随机变量取大于500的值的概率是阴影区域,即0.5
现在解决:
- b)我们有:µ = 500和σ= 100并代入值以获得Z
在标准正态概率分布表中找到Z = 1.50。
发现概率为0.4332。
因此,随机选择的候选人需要500到650小时才能完成训练计划的概率为0.4332,即43.32%。
- b)使用Minitab 15计算正态分布。
解决:
- a)随机选择的候选人需要500多个小时才能完成培训计划的概率是多少?
要在minitab 15中获取正态概率分布图,请选择:
摹拍摄和/概率分布图…
接下来,将出现一个“概率分布图”窗口,其中的指针选择“查看概率”,选择后按OK。
接下来,另一个窗口将出现“概率分布图-查看概率”。
- 在分发标签:在“ d istribution:”字段中选择“正常”。在“ 中号 EAN”字段(平均= 1)的地方500(平均小时才能完成程序)在“ S tandar偏差“放置100(变量的标准偏差)”在“阴影区域”选项卡中:用指针选择“ P robability”;用指针选择“ Rear Tail”。在P r可能性字段中:放置0.5(因为在这种情况下,平均值恰好位于曲线的最高点,因此概率为0.5。
MIinitab程序将返回显示的图形
所描述的这些步骤只是为了显示如何绘制图形。
解决:
- b)随机选择的候选人需要500到650小时才能完成培训计划的概率是多少?
要在minitab中获取图形,请选择:
摹拍摄和/概率分布图…
接下来,将出现一个“概率分布图”窗口,其中的指针选择“查看概率”,选择后按OK。
接下来,另一个窗口将出现“概率分布图-查看概率”。
- 在分发标签:在“ d istribution:”字段中选择“正常的” 中号 EAN“字段(平均值= 1)的地方500在(它需要以完成程序平均小时)” 小号 tandar “字段偏差“我们把100(该变量的标准偏差)的阴影区域选项卡:使用指针选择” X值“使用指针选择”中“。在X的场v ALUE 1:500的地方(平均值)在X的场v 一个略2:一旦数据已被输入的地方650(该变量取在该点的概率的值)时,按下“OK”的MIinitab程序将返回显示的图表和所获得的值
也就是说,随机选择的候选人需要500到650小时才能完成训练计划的概率为0.433。(43.30%)
结论
由Ing。Juan Alejandro GarzaRodríguez教授讲授的统计数据应用于业务的挑战,促使我们学习和使用Minitab作为另外一种工具。
随着技术的巨大进步,我们节省了进行统计分析的时间,但是,对用于达到其分辨率的逻辑的理解促使我们进行了这项研究,这项研究得到了Eng的很好的指导加尔萨(Garza),他教我们这个问题。
随着项目的发展以及对概念的理解和Minitab程序的处理,我们知道它是一个功能强大的统计工具,可以很好地应用,可以帮助我们简化计算以解决问题。这样做的基本目的是:在我们开发的任何领域中节省成本并不断改进。我们了解到,我们的工作领域不受限制,因为无论是在工程和材料,人力资源还是我们自己的业务,商业或工业领域,或者仅仅是出于统计概率的爱好,这些工具将永远是非常有用的。
在本次演示中,我们学习了最常见的概率分布(二项式,泊松分布以及正态分布)的应用和管理。
除了Minitab 15的使用和操作以外,在Minitab本身存在之前,还对推理,手动计算和表格作为原始方法进行了研究。
我们希望与像我们一样需要研究和开展此类工作的其他人分享这种信息汇编。分析和研究打开了我们的视野,使我们能够更有效地执行工作和个人职能。
感谢您抽出宝贵的时间来审查我们的贡献。
参考书目
- 管理员统计信息。第六版。理查德·莱文(Richard I. Levin)和大卫·鲁宾(David S. Rubin)。社论学徒大厅。第5章概率II:分布,第232页-264GE照明-AEA。 Sies Sigma Initiative Week#1的绿带课程。 1997年4月.Minitab 15(测试版本从www.minitab.com获得).MeetMinitabEs.pdf(从www.minitab.com获得)概率分布(信息取自www.monografias.com,http://www.monografias.com / obras29 / distribution-probabilities / distribution-probabilities.shtml)二项式分布(信息取自www.wikipedia.com,http://es.wikipedia.org/wiki/Distribuci%C3%B3n_binomial)正态分布(取信息)来自www.wikipedia.com,http://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal泊松分布(http://www.itchihuahua.edu。MX /学术/工业/ sabaticorita / _private / 05Distr%20Poisson.htm)