Logo cn.artbmxmagazine.com

应用统计学实验设计

Anonim

设计实验意味着计划 实验,以便收集与所研究问题相关的信息。实验的设计是预先采取的完整步骤序列,以确保将以允许进行客观分析的方式获得适当的数据,从而得出有关所述问题的有效推论。

从需求到答案问题的实验设计的兴起:

如何测量效果?要分析哪些特征?哪些因素影响要分析的特征?

这项研究将研究哪些因素?实验应运行多少次?分析的形式是什么?从什么值看效果重要?

实验统计数据应用于企业

实验设计的目的

提供与正在调查的问题相关的最大信息量。

设计,计划或程序应尽可能简单。

调查必须尽可能有效地进行;节省时间,金钱,人员和实验材料。«以最低的成本提供最大的信息量”

实验设计基本原理

1.-复制。提供实验误差的估计值。它允许获得任何因素的平均影响的更精确估计。

2.-随机化。将治疗随机分配到实验单位。统计实验设计模型中的一个常见假设是,观察值或错误值是独立分布的。随机化验证了这一假设

3.-本地控制。调整后的统计设计中使用的实验单元的平衡,封闭和分组的数量。

实验设计阶段

  • 问题陈述或陈述,假设的表述,实验技术和设计的主张,可能作为询问原因的事件和参考的检查,以确保实验将在适当的程度上提供所需的信息。从将要应用的统计程序的角度来确定可能的结果,并确保满足使这些程序有效的必要条件。

统计技术在实验结果中的应用。

  • 得出结论并用所产生的估计值的可靠性进行度量;应仔细考虑结论对所适用对象或事件的总体的有效性;评估完整调查并与其他调查进行对比问题之类的。

计划测试计划的清单。

明确说明问题。

确定重要的新问题区域。

在通常的限制范围内强调特定问题。

定义测试程序的确切目的。

确定特定问题与程序的整体研究或开发之间的关系。

收集基本信息。

  • 调查所有可能的信息源,并列出相关数据以计划新问题。

设计测试程序

  1. 举行一次有关所有当事方的会议,陈述要证明的主张,具体说明您认为值得的差异的大小,概述事件的可能替代方案,选择要研究的因素,确定实际范围。这些因素以及进行测试的具体水平;选择要进行的最终测量;考虑抽样变异性和测试方法准确性的影响;考虑可能的相互关系(或相互作用)确定时间,成本,材料,人力,仪器和其他因素以及异常条件(例如天气条件)。考虑程序的人际关系方面。

以初步形式设计程序

  • 准备一个系统的,完整的时间表,必要时提供时间表的执行或调整阶段,消除未研究变量的影响,减少实验次数,选择统计分析方法。谨慎地指导有序地收集数据。

全面审查设计。

  • 根据注释调整程序;详细说明要遵循的精确步骤;计划并进行实验工作;开发方法,材料和设备;应用方法或技术;监督并检查必要的细节,以修改方法。必需;记录对程序设计的任何修改;在收集数据时要小心;记录程序的进度。

分析数据。

如有必要,以数字方式减少记录的数据。

应用适当的数学统计技术。

解释结果

  • 考虑所有观察到的数据,将结论限制在严格的推论基础上,通过独立实验测试由数据引起的任何争议,从结果的技术意义和统计学意义上得出结论。结果对您的应用程序和后续工作意味着什么?请注意所使用方法的局限性,并以可验证的概率陈述结果。

准备报告。

清楚地描述工作的背景,问题的相关澄清以及结果的含义。

使用图形和表格方法可以有效地呈现数据,以备将来使用。

为读者提供足够的信息以验证结果并得出自己的结论。

将结论限制在一个客观的摘要中,以便该工作证明其可用于快速考虑和采取果断行动。

统计设计的实验的优点和缺点。

  1. 统计人员与研究人员或科学家之间需要紧密合作,因此在分析和解释程序阶段时具有优势。重点放在预期的替代方案和系统的预先计划上,甚至允许分阶段执行和独特地生成有用的数据,以便在以后的组合中进行分析。应将重点放在结果之间的相互关系以及对变异性来源的估计和量化上。可以确定确定的测试次数,并且通常可以减少测试次数。由于对结果进行了分组,因此更改效果的比较更加准确。结论的准确度以数学定义的精确度已知。

统计设计实验的缺点。

这种设计及其分析通常伴随着基于统计学家的技术语言的陈述。这对人们的普遍性很重要,此外,统计学家不应低估以图形形式呈现结果的价值。实际上,您应该始终将图形表示视为更多分析过程的初步步骤。

许多统计设计,尤其是在最初制定统计设计时,都被批评为过于昂贵,复杂且耗时。这种批评在有效时必须被真诚接受,并且必须做出诚实的尝试来改善这种情况,只要这不会损害解决问题。

  • 为了进行实验设计,我们建议对因子(输入)进行更改以观察与响应(输出)相对应的变化,从良好的实验设计中获得的信息可用于开发改进特性,从而降低成本与产品开发,设计和生产相关的时间,以及建立能够近似因素与结果之间真实性的数学模型。减少了与产品开发,生产设计相关的成本和时间,并建立了数学模型来近似因素和结果之间的真实性。这些优化流程,改进了用于公差评估的分析,并减少了变化以及避免了不敏感响应(即可能失控)的可能性,过程具有四类变量,必须在图表中充分记录在案因果:

过程中的关键变量。-这些是我们将在实验过程中尝试更改的变量,以实现产品的改进响应。

  • 使用4类变量,可以表示更完整的流程图,如下图所示:

工厂设计

  • 它允许同时研究可能在响应中的各种因素的影响。改进实验后,它可以同时指导所有因素的水平,一次允许一个因素进行研究或因素之间的相互作用,在图中可以看到每个点如何代表因素水平的独特组合。完整的因子设计运行(属于实验因子水平的所有组合)或因子设计的一小部分(它们是对实验因子水平的所有组合的子群分数做出响应的措施)

2级工厂设计

在这里,每个因子只有两个层次,而没有中心点。

两级因子设计用于指导将来的实验,例如,当您需要探索应该存在一个更好的组的新区域时。

两级因子设计可以是:

Full Factorial是实验运行,包括因子水平的所有组合。

小数阶乘或小数经历的运行仅包括所有可能运行的一小部分。

分形工厂设计

  • 在全因子设计中,此设计仅对运行的一个子部分或部分进行了改进;当资源有限或设计中的因素数量较长时,这种部分设计是很好的资源,因为它使用的运行次数少于两(2)级完全因式分解所需的运行次数为2k,其中“ k”为因数。如果2k设计中的因素数量众多,则改进完整的因数设计所需的运行数量会迅速增加。例如:具有6个因数的完整2级因数设计将需要运行64次,而具有9个因数的设计则需要512次运行。分数乘半设计只需要运行一半就可以了。一些效果是混乱的,无法与其他效果分开。通常,不考虑大于2次(双向)迭代的项,因为可以假定对较大项的影响,因为差异确实很小,因此无需估算。分数阶乘设计使用完整阶乘的子集来获取有关运行次数较少的低阶交互作用的主要影响的信息。 ***全因子设计的设计点数是分数设计的一半,答案是设计或因子部分可能的八个角中的四个。可以将这种做法与2方式(双向)迭代相混淆通常,不考虑大于2次(双向)迭代的项,因为可以假定对较大项的影响,因为差异确实很小,因此无需估算。分数阶乘设计使用完整阶乘的子集来获取有关运行次数较少的低阶交互作用的主要影响的信息。 ***全因子设计的设计点数是分数设计的一半,答案是设计或因子部分可能的八个角中的四个。可以将这种做法与2方式(双向)迭代相混淆通常,不考虑大于2次(双向)迭代的项,因为可以假定对较大项的影响,因为差异确实很小,因此无需估算。分数阶乘设计使用完整阶乘的子集来获取有关运行次数较少的低阶交互作用的主要影响的信息。 ***全因子设计的设计点数是分数设计的一半,答案是设计或因子部分可能的八个角中的四个。可以将这种做法与2方式(双向)迭代相混淆因为可以假定对差异最大的影响,因为差异实际上很小,因此不必估算它们。分数阶乘设计使用完整阶乘的子集来获取有关运行次数较少的低阶交互作用的主要影响的信息。 ***全因子设计的设计点数是分数设计的一半,答案是设计或因子部分可能的八个角中的四个。可以将这种做法与2方式(双向)迭代相混淆因为可以假定对差异最大的影响,因为差异实际上很小,因此不必估算它们。分数阶乘设计使用完整阶乘的子集来获取有关运行次数较少的低阶交互作用的主要影响的信息。 ***全因子设计的设计点数是分数设计的一半,答案是设计或因子部分可能的八个角中的四个。可以将这种做法与2方式(双向)迭代相混淆***全因子设计的设计点数是分数设计的一半,答案是设计或因子部分可能的八个角中的四个。可以将这种做法与2方式(双向)迭代相混淆***全因子设计的设计点数是分数设计的一半,答案是设计或因子部分可能的八个角中的四个。可以将这种做法与2方式(双向)迭代相混淆

完整的工厂设计(一般)

  • 在其中因子可以具有X个数量级的设计中。例如,工程师进行了一项实验,研究了水分,温度和铜含量对同一材料板上的涂层量的影响,因子A的湿度有两个等级,因子B的温度有三个等级,因子C的含量。铜有5个水平,实验运行包括这些因子水平的所有30种组合。

表面响应设计

  • 一组DOE技术是可以帮助您更好地理解和优化响应的技术。在使用阶乘设计确定悬垂系数后,通常使用表面响应方法来定义模型,尤其是在怀疑弯曲响应表面的情况下。析因设计是添加平方项,这些平方项允许模型响应中出现曲率,从而使其可用于:了解和绘制表面响应区域。方程表面模型的响应,以查看变量影响输入对我们感兴趣的响应的变化,满足优化响应的变量输入水平。选择符合规格的工作条件-例如,如果要确定模制燃油喷射塑料部件的最佳条件。首先将使用阶乘实验来确定重要因素(温度,压力,冷却速率)。使用表面响应设计实验来找到每个因素的理想组,在表面设计中主要有两种响应类型:使用表面响应设计实验来找到每个因素的理想组,在表面设计中主要有两种响应类型:使用表面响应设计实验来找到每个因素的理想组,在表面设计中主要有两种响应类型:

Composite Central Design。-您可以调整完整的二次模型。当设计计划要求进行顺序实验时,通常会使用它们,因为这些设计可以合并来自适当计划的阶乘实验的信息。

盒子设计-贝肯。通常,它在设计中具有较少的点,因此与具有相同数量的因素的复合中央设计相比,运行次数更少。它可以有效地估计一阶和二阶系数。但是,不能将阶乘实验的结果合并

组件(DOE)

  • 正是构成混合物的成分,改善了实验设计(DOE),可以确定将优化混合物的每种成分的相对比例(即响应)。通常在食品,加工和精炼以及化学制造中进行混合实验,假设您想研究自制草药混合除臭剂中3种成分的比例如何影响基于香气的产品的接受度。这三个成分分别是:玫瑰油,橘子油和橙花油,创建了混合物设计,并在绘图中分析了结果,在垂直方向上具有很高的值,代表了最方便的香气。 。

组件效果

  • 随着蜜桔香精(绿线)相对于混合物的比例的增加,第一种香精的便利性增加,然后开始降低;随着玫瑰(红线)香精的比例相对于混合物的降低,其便利性开始降低。混合物,增加了香气的便利性。随着橙花油(白线)相对于混合物的比例增加,香气的便利性下降。3条线到“ 0”的交点表示混合物(1/3的比例)。玫瑰的本质,橘子的1/3和橙花的1/3)移至“ 0”的右侧表示增加的一种成分的相对比例,移至“ 0”的左侧则表示一种减少的相对比例。一种成分与其他成分一样,要保持相同的比例。尺寸,重量,体积或任何其他单位均遵循通用标准。也就是说,每种风味混合物中所有成分的比例之和必须为100%,在尝试改进实验设计时,可以为每种成分指定上限或下限。例如,如果普通话是最昂贵的成分,则可以将其置于上限以控制混合物的总成本。 Minitab本身会生成不一定存在的设计组。也就是说,如果所有组件的下限为零而最高为1,则在设计混合实验时,设计中的点数取决于组件数。例如,一个简单的含有q个成分的混合体的centoride设计由2个** q-1点组成。在简单框架设计中,该设计中的点数取决于零部件的数量。 (q)和度(m)。

混合设计

一类表面响应实验研究产品包含一些组件。混合设计用于研究与组分,工艺条件或混合量成比例变化相关的产品特性。Minitab提供了三种设计(简单质心,简单屏幕和极限顶点),并分析了三种类型的实验:

混合-假设答案仅取决于混合中各成分的比例。例如,油漆的颜色仅取决于所用的颜料。

过程-可变混合物。-当答案假定组分的相对比例和变量的过程相关时,这些因素是实验中不属于混合物的因素,但在搅拌过程中会影响性能混合物。例如,涂料的粘合性能取决于其施加的温度。

混合量。-答案假定各成分的比例和混合物的量有关。例如,可食用植物中施用的量和成分的比例会影响家庭植物的生长。

混合量实验

根据组分的比例和混合物的量来假定答案。例如,可食用植物中的施用量和成分的比例会影响家庭植物的生长。当混合实验提高到总混合的两个或更多水平时,称为数量混合实验。

可变混合过程的设计

混合设计在实验中包括可变的过程因素,这不是混合的一部分,但会影响响应。例如,涂料粘合剂的性能可能取决于其施加的温度。

在Minitab中,混合设计中最多可以包含7个2级流程。混合设计将生成过程变量级别的每种组合或组合级别的一部分。

田口功能实验设计

之所以这样命名是因为日本工程师田口健一(Genichi Taguchi)根据任务值而不是规格说明过程中的变量开发了一种新的质量理念。田口象限在目标处近似偏差损失项。如果损失是浪费,返工,性能不佳,客户流失,满意度等综合结果,

可以使用L = k(yT)2来估计产品损失的度量,其中:

这就是答案的价值

T是期望值

k是一个常数

为了确定k,估计y的特定值的损失。例如,如果估计损失为:

y = 130是$ 100.00

k = 100 /(130-120)2 = 1.0

损失函数为:

L = 1.0(y-T)2

现在可以使用与他人和价值相关的损失估计

  • 允许您选择可以持续改进操作的产品或过程。它认识到,并非所有导致可变性的因素都可以在实践中得到控制。这些不可控制的因素。这些因素称为噪声因素,田口设计可确定可控制的因素,以将噪声因素降至最低。在实验过程中,您可以操纵噪声因子或强迫变量出现,然后找到对噪声因子的最大控制,以对噪声因子的变化进行鲁棒或抗性处理。田口是Ina Tile(50年代的日本公司)的。这产生了许多尺寸不合规格的地板。质量团队发现,烤箱在各个地板上使用的温度导致尺寸不均匀。他们无法消除温度变化,因为建造新烤箱非常昂贵,因此成为噪音变量。利用田口的设计,研究小组发现粘土的增加可能是一个控制因素,地板变得更坚固或更结实,从而使炉内的温度变化,从而使地板更加均匀。地板变得更坚固或更坚固,因此烤箱中的温度会发生变化,从而使地板更均匀。地板变得更坚固或更坚固,因此烤箱中的温度会发生变化,从而使地板更均匀。

田口的静态和动态设计

  • 两种Taguchi设计可让您选择可改善操作的产品或工艺。与动态系统一样,可变响应不仅取决于噪声和控制因素,还取决于其他可变概念(输入),即信号因素。Taguchi动态设计的目的是在各种输入信号范围内放置可优化系统质量特性的控制因素。

例如,加速量是制动器改进的量度。信号因子是制动踏板的下压程度;当驾驶员踩下制动踏板时,减速度增加。

踏板上的压力程度对减速有很大影响。因为没有达到最佳踏板压力,所以没有理由将其作为控制因素进行测试。相反,工程师们希望设计一种制动系统,使制动踏板上的最小压力变量更有效。

结论

在这项工作中,我们可以实现实验设计的应用,或者换句话说,逐步计划操作,以获得对我们的问题满意的结果。

在设计实验时,我们必须考虑要解决的问题的影响和特征。如您所见,设计应该尽可能简单,从而节省时间,投资和人员,但不应忘记考虑设计的基本原理。

我们还观察了研究人员与统计学家的共同工作,这使我们获得了更好的实验计划,尽管这样做有其缺点,但可以注意到,正确地采取行动可以改变看待高成本所代表的缺点的方式。你和统计学家在一起。

我们可以确定,如果执行清单中的所有元素,我们将对实验进行有效的规划,从而获得预期的结果。

实验设计的术语和示例

  • 实验设计:

六西格玛方法的开发的关键部分是确定影响某个过程的重要因素并找到其最佳组合以提高性能和派生产品。

  • 因素:

实验者几乎完全控制了影响反应变量(不包括治疗方法)的任何影响;对于这个变量,我们想研究一个或多个响应的影响。它可以定量或定性显示。这些因素是过程的组成部分,发现这些因素的程度决定了要改进或优化的最终响应变量。

  • 一个因素的水平:

它们是实验中检查的因素的值。对于定量因素,每个值都是一个级别。在定性方面,例如,清洁或脏污有2个等级。

  • 治疗方法:

一个术语,指的是一个因素的水平(或各种因素的水平的组合),该水平直接影响实验者感兴趣的事物。实验中将比较各种因素水平的影响。

  • 实验设计的处理结构:

这是已选择要研究和/或比较的一组治疗方法;处理结构的形状将取决于要进行的实验以及实验者要分析的内容。

  • 试点:

进行治疗的最小单位。

  • 响应变量:

应用处理后的单位的定量度量,其值取决于所使用的处理。被调查的变量也称为响应。

  • 主要作用:

在测量变量中所产生的变化后,它是每个因素对响应变量的贡献(该变化取决于每个因素的水平)。

  • 相互作用:

当两个或多个因素之间存在关系或依赖性时,即一个因素的影响取决于另一个因素的水平。

  • 伴随变量:

在进行处理之前,对设备进行定量测量。

  • 块:

实验单元组,相对于形成块的因素而言是均匀的。

  • 实验错误:

由于没有人能够明确考虑影响该实验的所有潜在变量,因此不会考虑这些变量,因此将其称为“噪音水平”,因为尽管在实验中已尽一切努力将其降低了,随机数),因此总会出现比实际情况少的变化。

  • 混乱

当一种因素或治疗的效果无法与另一因素或治疗的效果分开或区分时,就会发生这种情况。

为了更好地说明实验设计的操作,我们将处理一个示例,该示例研究哪种类型的球杆和球将改善新手高尔夫球手的高尔夫比赛。

  1. 实验标题:

评估两套球杆和两种类型的高尔夫球

2.目标:

为了举例说明DOE的使用和操作,您想参考两个品牌的球杆和两个品牌的球,来了解如何实现更好的高尔夫比赛。

应该提到的是,通常一个人玩2道菜,每一种都有不同的风况。路线A永远不会刮风,因为它被群山环绕。由于路线B位于平原,因此总是有强风。

你有设备。

两种课程都有时间。

您如何知道该如何改进游戏?

让我们尝试一个设计实验...

3.与目标有关的支持:

没有来自先前实验的信息。

4.关于响应变量的注意事项:

Response变量将测量孔的分数。

5.因素考虑:

控制因素:

*俱乐部类型(a。平; b。卡拉威)

*球的类型(a。Titlest; b。Pinnacle)

*天气情况(a。有风; b。无风)

噪音因素:

*此对照实验无。

6.关于交互的注意事项:

实验进行之前,没有明显的相互作用。

7.实验限制:

没有,有时间玩这两个课程。

8.结构(选择变量的级别):

该实验将在两种天气条件下进行,因此天气因素,球杆和球的类型具有2个“级别”。所以这是2 3的全因式

1级 1级
棍棒类型 转移,叫走
球的类型 标题主义者 巅峰
气候条件 有风 没有风

9.数据分析和表示:

因子水平和实验以下面的标准形式显示。

有哪些可能的组合?

之一 坚持平 Titleist球 没有风
帕洛·卡拉威 Titleist球 没有风
3 坚持平 顶峰球 没有风
4 帕洛·卡拉威 顶峰球 没有风
5 坚持平 Titleist球 有风
6 帕洛·卡拉威 Titleist球 有风
7 坚持平 顶峰球 有风
8 帕洛·卡拉威 顶峰球 有风

让我们以不同的方式在下表中查看它…。

(请参阅PDF)

这是一个完整的阶乘。让我们看看结果!

(请参阅PDF)

结论

由Ing。Juan Alejandro GarzaRodríguez教授讲授的统计数据应用于业务的挑战,促使我们学习和使用Minitab作为另外一种工具。

随着技术的巨大进步,我们节省了进行统计分析的时间,但是,对用于达到其分辨率的逻辑的理解促使我们进行了这项研究,这项研究得到了Eng的很好的指导加尔萨(Garza),他教我们这个问题。

随着项目的发展以及对概念的理解和Minitab程序的处理,我们知道它是一个功能强大的统计工具,可以很好地应用,可以帮助我们简化计算以解决问题。这样做的基本目的是:在我们开发的任何领域中节省成本并不断改进。我们了解到,我们的工作领域不受限制,因为无论是在工程和材料,人力资源还是我们自己的业务,商业或工业领域,或者仅仅是出于统计概率的爱好,这些工具将永远是非常有用的。

在本次演示中,我们了解了DOE的管理,实验设计。

我们希望与像我们一样需要研究和开展此类工作的其他人分享这种信息汇编。分析和研究打开了我们的视野,使我们能够更有效地执行工作和个人职能。

感谢您抽出宝贵的时间来审查我们的贡献。

参考书目

  • 马克·J·基梅勒,史蒂芬·R·施密特,罗纳德·J·伯丁。基本统计资料第四版。教科书1。第8章,管理员统计信息。第六版。理查德·莱文(Richard I. Levin)和大卫·鲁宾(David S. Rubin)。社论学徒大厅。第6章.3实验设计,第pp。323-327GE照明-AEA。Sies Sigma Initiative Week#1的绿带课程。1997年4月。实验。monographs.com
下载原始文件

应用统计学实验设计