二项式分布是作为二项式分布的离散随机变量的广泛使用的概率分布。它描述了管理员感兴趣的各种过程。
它描述了离散数据,该离散数据来自名为Bernoulli过程的实验,以纪念居住在17世纪的瑞士数学家Jacob Bernoulli。
使用伯努利工艺。
我们可以使用固定抛硬币的结果作为伯努利过程的例子。我们这样描述这个过程:
- 每个试验(在我们的例子中,每个试验)只有两个可能的结果:A面或B面,是或否,成功或失败。对于硬币而言,无论抛掷硬币的次数如何,每次抛掷时硬币从A面出来的概率均保持为0.5,测试在统计上是独立的,也就是说,抛掷的结果不会影响比任何其他版本。
每个伯努利过程都有其自己的特征概率。以申请某种类型工作的人中有十分之七通过测试的情况为例。那么我们将说特征概率为0.7,但是只有当我们确定被批准者的比例随时间保持不变时,才能将测试结果描述为伯努利过程。
当然,还必须满足伯努利过程的其他特征。每次测试应仅产生两个结果(成功或失败=且测试结果应在统计上独立。
在更正式的语言中,符号p表示成功的概率,符号q(1- p)表示失败的概率。为了表示一定数量的成功,我们将使用符号r并使用符号n来表示试验的总数。
因此,我们必须:
P | 成功的可能性。 |
问 | 失败的可能性。 |
[R | 期望成功的次数。 |
ñ | 进行的测试次数。 |
有一个二项式公式:
在n个试验中r成功的概率为:
N!/ R!(NR)!P R Q N-R
回想一下阶乘符号!例如,这意味着它是3!= 3 * 2 * 1 = 6
数学家定义0!= 1。
二项式分布可以用图形表示
想象一下一所小学,那里的学生经常迟到。五名学生正在上幼儿园。校长研究这个问题已有一段时间,得出的结论是学生迟到且彼此独立到达的可能性为0.4,我们如何绘制二项式概率分布来说明概率0、1、2、3、4或5个学生同时迟到?为此,我们将需要使用二项式公式,其中:
P = 0.4
Q = 0.6
N = 5
让我们计算R的每个值:
对于R = 0,我们得到:
P(0)= 5!/ 0!(5-0)!(0.4)0(0.6)5
P(0)= 0.07776
对于R = 1,我们得到:
P(1)= 5!/ 1!(5-1)!(0.4)1(0.6)4
P(1)= 0.2592
对于R = 2,我们得到:
P(2)= 5!/ 2!(5-2)!(0.4)2(0.6)3
P(2)= 0.3456
对于R = 3,我们得到:
P(3)= 5!/ 3!(5-3)!(0.4)3(0.6)2
P(3)= 0.2304
对于R = 4,我们得到:
P(4)= 5!/ 4!(5-4)!(0.4)4(0.6)1
P(4)= 0.0768
对于R = 5,我们得到:
P(5)= 5!/ 5!(5-5)!(0.4)5(0.6)0
P(5)= 0.01024
在图中表示这些结果:
二项式分布的集中趋势和离散度的度量。
二项式分布具有期望值或平均值(m)和标准差(s),我们应该能够计算这两个统计量度。
我们可以表示二项式分布的平均值,如下所示:
m = np
在哪里:
n =试验次数。
P =成功的概率。
且偏差如下:
s =Önpq
在哪里:
n =试验次数。
P =成功的概率。
Q =失败的可能性。
例:
产生20%不良包装的包装机。如果抽取10个包装的随机样本,我们可以计算出该过程的二项式分布的平均值和标准偏差,如下所示:
m = np
= 10 * 0.2
= 2平均
s =Önpq
=Ö(10)(0.2)(0.8)
=Ö1.6
= 1,265标准偏差。
通过下面的视频课程(Educatina + Khan Academy),可以非常简单地解释该概念,一定会在观看之后明确地了解二项分布。