Logo cn.artbmxmagazine.com

使用Minitab计算置信区间

Anonim

要开发的主题是“置信区间”,并参考Richard I. Levin和David S. Rubin在其“管理员统计”一书中建立的置信区间概念如下:

置信区间统计

具有指定概率的值范围,其中包括总体参数的实际值。

为了更清楚地理解此概念,有必要在开始时就与之相关的其他注释发表评论,以帮助其理解。

这些要审查的概念包括:

  • 估计。点估计。间隔估计。置信度。置信极限

估计

(Del lat。Aestimatĭo,-ōnis)。F。给予的赞赏和价值,在其中得到重视和考虑。-2.对。在某些税收中进行的操作以确定税收基础的价值。

这是我们可以在字典中找到的概念。但这也是我们经常在日常生活中应用的概念。

每个人都做估计。穿过马路,我们看到有汽车驶来,我们估算它的速度和我们与汽车之间的距离,以便决定是要等待还是要过马路。

在此示例中隐含的原因是作为管理员,经理或团队负责人进行估算的原因之一:基于计算的决策即估算。

管理员必须进行快速估计,这些结果会通过基于估计的决策影响组织。估算以:

  • 一所大学,逐年确定入学水平,在征信局中,是根据客户以前的信用习惯来确定客户是否可以在一定时间内完成偿还债务。历史记录。根据过去的信息来设置预算。

在每种情况下,我们都试图从样本中了解有关人口的信息,作为决策者,我们通常会被迫做出信任我们自己的直觉的决策,但理想情况下,每个决策他的立场是,这些决定是基于信息的可用性并应用统计知识以使其表现更好。

我们从一开始就估计概念的结论是,其应用的原因如下:

  1. 为了做出合理的决定,为了组织的利益,从样本信息中推断出一些信息,从具有合理精度的方法中,整个过程必须能够提供信息以执行决策的最佳方式。

关于人口,有两种类型的估计。

  • 估计。准时间隔估计。

最后一个概念将帮助我们理解博览会的客观概念,即置信区间。

点估计

点估计是用于估计未知总体参数(数据)的单个数字。

例子:一所大学的校长说:“根据我们当前的数据,在下一个学年,这表明在哲学和文学学科中,我们将有350名学生。”

该声明类似于扔硬币:对或错,您只有两种选择。因此,点估计通常是不够的,因为您只有两个选择:正确或错误。同样,如果告诉我们部门主管的估计错误,则会产生以下问题。估算值与实际估算值相差多远?换句话说,它有什么误差估计?不能说10个学生的估算是错误的,而不是90个学生的估算是错误的,两者之间的差异是由一个概念确定的:可靠性。

点估计示例:样本均值是可靠总体均值的估计量,尤其是当样本足够大时。但这是一个点估计,因为它只给出一个结果。

为了说明这一点,即使它已经是一个可见的话题,我们也将回顾一下公式:

其中:∑ x,是样本中所有元素的总和。

ñ是元素的数量。

让我们看一个生产一次性皮下注射器的临床供应公司的例子。每个注射器均采用无菌包装,然后包装在大瓦楞纸箱中。由于针筒包装在纸箱中的方式,它们处理的内容量不同,因为针筒是每件出售的,所以公司需要估算每盒的件数,以达到以下目的:帐单。

随机抽取35盒样品,并记录该样品中包含的注射器数量:

101 103 112 102 98 97 93
105 100 97 107 93 94 97
97 100 110 106 110 103 99
93 98 106 100 112 105 100
114 97 110 102 98 112 99

使用该公式,我们将得到以下内容。

X = ∑x = 3570 = 102个注射器

35

因此,当使用样本均值作为我们的估计量时,均值的点估计为102个注射器。

我们将通过前面的示例得出的结论是:

因此,当使用样本平均值作为估计量时,一次性皮下注射器的点估计为每盒102个注射器。制造价格相当低(约25美分),因此积分和买主都将接受该积分估算作为开票的基础,制造商可以节省时间和费用来计算每个包装盒中装有注射器。

进行抽样的目的是为了了解更多有关人口的信息,或者是进入下一学年的学生,或者是皮下注射针筒的总发货,就像前面的示例一样,其分析从35个样本开始盒子。

为此,我们可以依靠点估计值(例如样本均值),也可以依靠区间估计值作为下一个主题。

间隔估计

间隔估计值描述了一个值范围,在该范围内有可能将其作为总体参数。

在其特征中,我们发现:

  • 在“间隔估计”中,要处理一个附加概念,这意味着伴随该估计的不确定性。有关未知总体平均值可能存在的间隔的说明。要提供该说明,您需要找到错误均值标准。

为了更好地解释它,我们将依靠以下示例:

假设一家汽车配件工厂的市场研究主管需要估算贵公司生产的汽车电池的平均寿命。随机抽取200个电池样本,代表车主及其住所进行注册,就像对这些人的汽车电池寿命进行了采访一样。应用样本均值公式后,结果是:平均寿命为36个月。

如果将样本平均值的点估计值用作总体平均值μ的最佳估计值,则将报告该公司电池的平均寿命为36个月。

但是,假设主任还知道估计可能伴随的不确定性,即有关未知总体平均值可能存在的时间间隔的说明。这是通过计算平均值标准误确定的。

为此,使用标准平均误差计算公式:

假设之前已计算了200个电池的标准偏差,并确定为10个月。使用此数据和上一个框中指示的公式。事实证明是这样的。

现在可以得出的结论是,公司电池的使用寿命估计为36个月,该估计伴随的标准误差为.707。换句话说,所有电池的实际使用寿命可能在此范围的35,293到36,707个月的估计范围内。

为了理解间隔估计,我们已经采用了曝光的初始概念“置信间隔”,并用“点估计”来标记其区别。

回想一下理查德·莱文(Richard I. Levin)和大卫·鲁宾(David S. Rubin)的概念,在他们的《管理员统计》一书中,建立了置信区间的概念,如下所示:

指定概率的值范围包括总体参数的实际值

因为这样做了,为了理解间隔的置信度的概念,这是估计的真实参数在间隔估计之内的概率。

也就是说,以200个电池为例,其中有多少个电池会落在找到样本均值的区间内,而我们使用均值标准误公式所建立的极限。

置信度

在统计中,与区间估计相关或相关的概率称为置信度。

我们对区间的估计包含大部分样本(即所分析的案例)的信心如何。

让我们分析一个实际案例:

考虑例如一家电器商店的顾客的情况,该顾客询问新洗衣机交付的等待时间。该表显示了客户可以提出的问题和可能的答案。如果观察,您会发现置信度水平和任何估计的置信区间之间存在直接关系。

客户问题 员工回应。 置信度 置信区间
洗衣机一年后到货吗? 我可以肯定。 大于99% 一年。
洗衣机能在一个月内寄给我吗? 我几乎可以确定它将在一个月内到货。 至少95% 一个月
洗衣机会在一周内寄给我吗? 我很确定。 大约80% 一周
明天你能把洗衣机交给我吗? 我不确定能否做到这一点。 大约40% 一天
我回家之前洗衣机会到吗? 能够做到的机会很小。 大约1% 一小时。
  • 要注意的是,当置信区间更大或更长时间时(例如,需要一年的交付时间),尽管管理员给出的置信度为99%,但估算值却是非常不现实的值当客户确定一个较窄的间隔(交货时间)时,商店经理会同意较低的置信度,洗衣机会在我回家之前到达吗?它的水平很低(1%)。

因此,我们找到了前面示例的置信区间:

数控 间隔
大于99% 一年。
至少95% 一个月

置信限度

置信区间通常用标准误而不是数值表示。如下。

X ± 1.64 σ X,其中:

X + 1.64 σ X =上的间隔的限制。

X - 1.64 σ X =较低的间隔的限制。

这些限制称为置信区间的置信限制。(LIC)

什么是MINITAB?

Minitab是一种计算机程序,旨在执行基本和高级统计功能。它结合了使用Microsoft Excel的友好性和运行统计分析的功能。1972年,宾夕法尼亚州立大学统计分析计划的讲师将MINITAB开发为OMNITAB的轻量级版本,这是美国国家标准技术研究院(NIST)的统计分析计划。作为2006年的完整版本,它的价格为1,195美元,但还提供了学生和学术版本,作为一些教科书的补充。

Minitab的工作环境分为:

  • 菜单栏,工具栏,“会话”区域,“工作表”区域。

Minitab环境

置信区间

一袋薯条的重量示例

问题

假设您要计算100袋薯条的置信区间,设定重量为40克,并且您需要确保平均值的过程在目标值2.5克以内。

输入数据的一种方法是使用一列来捕获一百个油炸包的总数,这被称为数据收集。

为了处理Minitab中的另一个选项,我们将随机生成数据序列,如下所示:

1.-Calc菜单>随机数据>普通

将打开一个对话框,询问诸如行数,平均值和标准偏差之类的问题。

当我们使用特定重量的包装时,可以通过在框中键入以下内容来表示:平均40,偏差2.5克,行数:100,通过双击该列位于“ 存储在列中”,在左侧框中的列表中。

点击确定

如下所示,将随机生成一系列100个数字。

一旦我们建立了100袋薯条(数字序列)的关系,我们便开始建立置信区间。

但在继续之前。

什么是置信区间?

置信区间是基于样本数据的总体周长(例如μ)的可能值范围。例如,很多时候您将使用样本来计算µ。机密间隔将告诉您等待该计算的时间。何时使用置信区间?

使用置信区间从一个或多个样本数据集中进行推断。

  1. -菜单统计>基本统计> 1-样本t。

(请参见下图,以查看单击顺序)

然后将出现一个对话框,指示所需区间的置信度和要使用的变量(对于更多列,双击要使用的列,移至该部分的变量)。

点击图表

选择数据的箱线图。

点击确定

解释结果

置信区间

置信区间是μ的可能值范围。图形显示为红线,并且在箱线图下方有两个正方形。

这是95%的置信区间,因为我们从同一总体中抽取了100个样本,样本的95个区间将包含µ。因此,对于任何可以95%确保μ在置信区间内的示例。

在下一页上,将图形最大化以易于欣赏。

会话区域还为您提供了根据初始数据处理的信息:

解释:

N(数据数)。

M(平均)。

圣开发(标准差)

95%CI(95%置信区间)。

(39,426 40,428)(置信区间。

如果要保留生成的项目:

单击菜单文件>将项目另存为。

命名并保存在所需的位置。

手册综合。

  • 已生成一系列随机数据。(代替此选项,数据收集是从网格或数据文件中给出的。)赋予它特定的特征。(均值和标准差)已经对所述数据进行了分析和处理。(置信区间)从上一个信息过程中获得,我们知道置信区间,其可靠性为95%。

参考书目

理查德·莱文(Richard I. Levin)和戴维·鲁宾(David S. Rubin)撰写的“管理员统计”。社论学徒大厅。

下载原始文件

使用Minitab计算置信区间