Logo cn.artbmxmagazine.com

统计工作样本理论

Anonim

进行任何形式的统计研究的基本部分是获得可靠和适用的结果。

如前所述,对整个人群进行某些研究几乎是不可能或不切实际的,因此解决方案是基于此称为样本的子集进行研究。

工作理论样本

但是,为了使研究具有有效性和可靠性,有必要使这种数据子集或样本具有一些特定的特征,以便最终将结果推广到整个人群。这些特征主要与样本的大小和获取方式有关。

我们将在本单元的以下部分中讨论它。

单元1.样本理论

本章总结了统计样本理论,该理论涉及通过采样来研究未知人口的概念,并通过对样本的研究来推断整个人口。首先,分析了简单分层随机抽样的情况,显示了处理随机数表的情况。然后在采样中看到了非随机类型,并讨论了每种方法的优缺点。解释了生物化学中用于实现从患者身上采集的样品满足随机性要求甚至近似要求的方法。制药业和一般商业中使用的营销样本模拟也是如此。以某种方式稍后应用需要此要求的统计模型。在表的分册的表3中,提供了随机表,通常称为:“随机数”。

2.抽样的重要性

在整个课程中,使用两种类型的推理:演绎法归纳法。第一个与概率论直接相关,在第4单元中讨论了概率论,并从总体特征中获得了样本的可能特征。第二种类型的推理与所谓的统计推断有关:使用总体子集(样本)的特征来做出总体上的陈述(推断)。本机就是这种情况。

正如已经提到的,样本意味着进行这项工作必须接受一些不确定性,因为除了研究人口有时会变得过大这一事实外,Wonnacott和Wonnacott还提供了以下额外原因:

  • 资源有限。换句话说,没有人力,物力或经济资源来进行总人口的研究。就像在购买设备(例如二手车)时,您测试了几分钟(点火,小跑等),以查看其是否正常运行,然后再购买,但您不必等一生都对其进行测试(通过打开或关闭它或直接将其保持打开状态)进行购买。短缺。在只有一个样本可用的情况下。例如,对于恐龙的古生物学研究(例如霸王龙),最好至少保留许多化石,然后进行此类研究;但是,在世界上,这些生物只有十几个化石骨架(几乎全部是不完整的)。破坏性测试。在这种情况下,对整个人口进行研究会导致人口本身遭到破坏。例如,如果您想知道一个人的确切血红蛋白计数,则必须抽取所有血液。采样可以更准确。在这种情况下,对总人口的研究可能因其规模而导致错误,或者在普查的情况下,必须使用训练有素的人员;另一方面,对样本的研究可以用更少但训练有素的人员来进行。

既然我们已经提到了进行样本的必要性,那么我们将继续这些样本必须具备的一些特征,以便可以对总人口进行推断(归纳)。

3.样本大小

要计算样本的大小,必须考虑三个因素:

  1. 您希望将样本中的数据归纳到总人口中的置信度的百分比进行归纳时要接受的误差的百分比为检验假设而计算的可变性水平。
    • 信心信心百分比是存在概括得到的结果确定性的百分比。这意味着100%的百分比等于说毫无疑问地可以归纳出这种结果,但这也意味着要研究人群中的所有病例。

为了避免很高的研究成本,或者由于有时几乎不可能研究所有案例,因此寻求较低的置信度。在社会研究中通常寻求95%。

  • 错误错误的百分比是相当于选择接受的假设是错误的,如果它是真实的,或逆的概率:拒绝真正的假设,因为它被认为是假的。与置信度一样,如果要消除错误的风险并将其视为0%,则样本与总体的大小相同,因此您应该冒犯错的风险。

考虑到信任和错误不是互补的,通常将4%到6%的错误视为错误。

  • 变化是与它被接受的概率(或百分比),并假设在先前的调查或初步测试,以目前的研究进行调查遭到拒绝。接受该假设的百分比称为正变异性,用p表示,而拒绝该假设的百分比为负变异性,用q表示。

考虑p和q是互补的,也就是说,它们的和等于1:p + q = 1。此外,在谈到最大变异性时,如果研究没有先例(没有其他条件或无法应用先前的测试),则变异性值为p = q = 0.5。

一旦确定了这三个因素,就可以如下计算样本量。

说到大约10,000个病例,或者说最小的数量,我们可以考虑如何通过以下公式计算样本量。应当指出的是,考虑到不包括公开问题且总数约为30的工具,可以以可接受的方式应用这些公式。

我们将提出两个公式,第一个是在人口数量未知时使用的公式,它是:

哪里:

4.5系统的

它类似于上一个,尽管元素的选择更加舒适。如果我们必须从600个组中选择40个元素,我们首先要计算商600/40,该商告诉我们600中有40组15个元素。在前15个中选择一个输出元素,并假设它是第k个元素,其余元素将是每个组的第k个。具体来说,如果起始元素是数字6,则其余元素将是具有以下数字的元素:15 + 6、2×15 + 6,……,39×15 + 6

此过程极大地简化了元素的选择,但是当元素已按某些特定标准编号并且第k个元素都具有一定的特性时,它可能会破坏样本的代表性,这使样本形式具有非代表性。 。

4.6分层

有时,当人口很大时,我们有兴趣将其分为亚群或阶层,没有共同的元素,并且覆盖整个人口。

完成此操作后,我们可以通过简单的随机抽样从每个层中选择数量相等或成比例的元素。

此过程的巨大优势是可以在非均匀种群中获得更高的精度(尽管在此过程中,我们将不研究必要的方法)

如果我们决定对我们中心的烟草发生率进行调查,我们可以得出以下理由:

我们的中心有2000名学生,ESO 3年级720名,ESO 4年级700名,学士学位1年级340名,高中2年级240名。

如果我们要抽取100名学生作为样本,以分析青少年时期的烟草发生率,那么从每个阶层中抽取相等数量的学生即25名就足够了。

但是,如果您要进行调查以了解学生对学校理事会采取的措施的意见,则从每个层次中进行选择更具代表性,并且在与层次大小成比例的数量中选择将要构成的要素样本。如果ESO第三年代表了36%的学生,则将通过简单的随机抽样从该层次中选择36%的样本(即36名学生),ESO第四年选择35个样本,依此类推,直到完成样本的100个元素。

  1. 带有和没有放置的样品

如果我们从an中提取数字,则可以在下一次提取之前将其返回或不返回。在第一种情况下,该数字可以再出现一次,而在第二种情况下,每个数字可以出现一次。这两种类型的样本分别称为带替换的样本和不带替换的样本。

总体是有限的或无限的。例如,如果我们从一个装有100个球的骨灰盒中连续抽出10个球而不进行替换,那我们就是在抽取一个有限的样本。而如果我们掷硬币50次,我们计算的是正面数,那么我们将面临无限的人口样本。

从理论上讲,其中可以替换样本的有限总体是无限的,因为它可以提取任意数量的样本而不用尽它。出于许多实际目的,非常大的人口可以看作是无限的。

  1. 抽样中的概率分布

也称为通过样本获得的任何统计信息的样本分布。想法如下:如果抽取了k个样本,则从NP大小的总体中获取所有可能大小为n的样本(有或没有替换),并为每个样本计算e统计量(均值,中位数,方差等)。 ,获得了一系列k值:e1,e2,e3,…,ek

可以使用频率直方图对这些值进行分组,以欣赏其分布的形状。图10.1概述了这种情况:

图6.1样本分布。

人口

从任何总体中抽取k个样本。每一个都可以计算k个地层图,通过这些地层图可以制作出如图10.1右侧的直方图。可以看出,如果减小间隔,则如果平滑台阶,则该直方图将呈钟形。

通过采样观察到的从样本数据获得的该曲线随着k的增加而渐近趋向于另一条理论曲线,并且间隔变得无穷小。

根据中央极限定理,该理论曲线是高斯函数,这是统计学中的主要定理。

中心极限定理使得可以确定,在非常普遍的条件下,如果样本足够大,则获得的k值的理论分布近似为高斯函数。这是大样本理论的基础。主要样本分布是由两个参数μ和SE唯一标识的高斯函数。在表10.1中,为每个最常见的统计数据提供了这两个值。在表格的第一栏中,显示了每个统计人员,在第二栏中,给出了计算估计标准误差SE的公式。最后,第三列显示获得μe统计量的期望值的点估计,并澄清了可以被认为可以接受的估计所需的样本量。

  1. 平均样本分配

如果选择的统计量是平均值,我们将获得.X1,.X2,.X 3,…,.Xk样本均值;如果k很大,则这些分布为正态分布。实际上,30个或更多的值就足够了。

从理论上讲,当k→∞时,均值的采样分布是渐近正态的,并且将与高斯函数一致。该分布将具有期望值和方差,从而可以估计相应的总体值。那是,

μx =μσ2x =σ2 / n = SE2(x)= VAR(x)

表7.1。一些抽样分布的标准误

即:获得的k个样本平均值的算术平均值近似等于总体平均值(或真实值)。但是,该近似值存在一个估计误差,称为平均值的估计误差或标准误差,在均值的情况下

是:σx。在临床文献中,最常用的命名法是SE(x)。表10.1显示了算术平均值情况下的先前值。

仅当总体为无穷大或为有限时,先前的关系才有效,但采样是替换的。否则,当总体是有限的并且在没有替换的情况下抽取样本时,则必须使用以下条件调整这些关系:

μx =μσ2x =(σ2 / n)= SE2(x)= VAR(x)

在下面的表10.1中,给出了一个已知整个种群的情况的应用问题,通过应用在主题4中看到的公式直接计算种群参数,得出:μ= 4.5和σ2 = 1.25 。可以以两种方式验证以上关系。首先,采集六个可能的大小为2的样本,以进行不替换的采样。计算每个样本各自的平均值,然后使用这6个平均值可以计算:这六个样本的平均值和方差。现在,如果对有限大小的样本应用了校正因子,则所有样本均值的平均值恰好等于总体平均值,并且样本均值的方差将验证先前的关系。第二种方法(Bootstrap程序)是替换样本,首先用大小2替换所有16个可能样本。然后,使用16个样本,计算出16个均值。最后,计算这16个值的平均值和方差,对于替换样本,再次检查上述关系。对于另一个问题,假设人口值已知,并且要获取50个大小为3的样本,则需要确定结果落入一个区间(6; 7,796)的案例数。进行方法是首先计算获得这些极限结果的概率,然后通过差异计算利用16个样本,计算出16个均值。最后,计算这16个值的平均值和方差,对于替换样本,再次检查上述关系。对于另一个问题,假设人口值已知,并且要获取50个大小为3的样本,则需要确定结果落入一个区间(6; 7,796)的案例数。进行方法是首先计算获得这些极限结果的概率,然后通过差异计算利用16个样本,计算出16个均值。最后,计算这16个值的平均值和方差,对于替换样本,再次检查上述关系。对于另一个问题,假设人口值已知,并且要获取50个大小为3的样本,则需要确定结果落入一个区间(6; 7,796)的案例数。进行方法是首先计算获得这些极限结果的概率,然后通过差异计算并取50个大小为3的样本,有必要确定结果落入一个间隔(6; 7,796)内的情况数。进行方法是首先计算获得这些极限结果的概率,然后通过差异计算并取50个大小为3的样本,有必要确定结果落入一个间隔(6; 7,796)内的情况数。进行方法是首先计算获得这些极限结果的概率,然后通过差异计算

将高斯概率与区间相关联,然后将该概率乘以样本大小,即可回答所提问题。

表7.2:均值的样本分布

如果其中任何一个不满足,则得出的结论无效。假设可以总结如下:要使用Student,您必须具有正常,随机和独立的样本。注意,估计的标准误差为SE(e)=σe。

实际上,最常见的情况是:

  • 学生样本

在这种情况下,e =.x,则:μe=μ,SE(e)=σe= DS / n。因此,比较值的计算公式为:

随机样本和独立样本均来自两个正常群体。这样做的目的是找出两个样本是来自同一种群还是来自不同种群。这样一来,可以看出应用于样品的“处理”效果是否明显,在这种情况下,样品似乎来自不同人群。它用于将一组患者的药物效果与另一组接受安慰剂的药物相比较的情况。还可以比较两种临床技术并检测是否存在差异,例如:两个商业品牌的广场,两种测量仪器,两个人,两种不同的技术(新旧对照),两种规程等。通过这些比较,可以在实验室中执行许多内部控制以进行校准,衡量有效性等有一个限制:一次只能将两个样本相互比较,不能再进行比较。如果有两个以上的样本,则使用ANOVA模型。

  • 均值比较

对于这些情况,均值验证的学生值可通过以下公式计算:

与tα相反;υ其中υ= n1 + n2-2个自由度。在某些特殊情况下,例如(a)样本大小相等,(b)它们是等规的(它们具有相同的方差)。在两种情况下,都简化了计算公式。

参考书目

  • A.(1998)1Var 25. Oviedoreskog,KG和S.rbom,D.(1993)。PRELIS 2用户参考指南。Chicagoiz,J。(1997年),对.tems响应理论的介绍。Ediciones Pir.mide.MadridSamejima,F.(1.969)使用分级分数的响应模式估算潜在能力。心理计量学专着,编号17 Van der Linden,WJ和Hambleton,RK(eds。)(1997)现代物品反应理论手册,Springer-Velac,纽约Spigel,Munrray。“行政统计”。麦格劳·希尔出版社。第十版。1,998。

附件

工作样本理论

下载原始文件

统计工作样本理论