Logo cn.artbmxmagazine.com

市场研究中的错误

Anonim

支持决策的信息的基本特征必须是其相关性,及时性,可靠性和准确性。

相关性是指信息能够减少决策者在选择一个或另一种行动替代方案的可能结果方面的不确定性的程度。

信息应有助于预测将要发生的事情,预期决策的结果。此要求导致寻求有关影响结果(效果)的变量(原因)的信息。如果没有这种关系,则该信息无关紧要。

机会是指必须提供信息的时刻。也就是说,在做出决定之前。这个功能看似太明显了,它在需要信息时比在需要传递信息时更多。

就是说,您必须在做出决定之前被告知,但是期望建立什么样的相关信息来支持它的预期却或多或少地导致了获得它的压力。时间的差异直接影响信息的质量和成本。有时,必须在没有信息的情况下做出决定。

做出决定类似于下注。为了预测拳击比赛的结果,投注者会尝试使用可在比赛前获得的相关信息来减少不确定性。例如,选手的体重,身高和伸手可及的距离,以及他们先前打架的结果。知道诸如他的兄弟的名字或他们使用的肥皂品牌之类的数据是没有用的。他们只是不能减少战斗结果的不确定性。

随着不确定性的降低,信息具有价值。而且,在直接关系中,尽管不是成比例的关系,获得它的成本也会增加。用非常实际的话说,可以用硬币将它扔向空中,然后选择一个拳击手在上面下注。或者,您可以使用硬币购买报纸,并在体育部分找到一些详细信息。

这意味着可以在有或没有信息的情况下做出决策,尤其是在那些信息不会改变决策者先前职位的情况下。

如果信息没有机会更改决策,则不值得获取。如果成本太高或将不确定性降低到一定程度,以致于无法以足够的确定性预测决策的预期结果,那么这样做也不值得。

就市场研究而言,信息的成本通常比决策增加的价值要少得多。即使信息不是完美的信息,也最好用信息做决定。

准确性和可靠性带来了准确而真实的信息,这使其可信。这两个特征主要与确定来源以及从中获取信息的方式有关。

在人与人之间进行研究的情况下,他们必须与成为样本一部分的人员的选择过程以及从中获取信息的工具的设计有关。

样本数量的确定和样本的选择过程是市场研究过程中仅有的两个可以量化误差的方面。对于其他方面,只能建立程序和标准,如果遵循这些程序和标准,则可以减少发生错误的可能性。

减少市场研究错误的一个很好的例子是墨西哥市场研究机构协会(AMAI)自2000年以来建立的墨西哥市场研究服务标准(ESIMM)。

该标准定义了市场研究公司必须拥有的质量基本要素,并执行了成文的程序,以确保质量可重复并提高客户满意度。这项举世无双的重要工作,是使活动专业化和自我调节,在很大程度上有助于提高研究结果的可信度。

它的实现主要转化为更高的可靠性和准确性,尽管对于更大的相关性和机会而言并没有那么重要。这两个特征并非仅由进行研究的机构做出贡献,因为它们在很大程度上需要提出请求的客户的参与。

信息的相关性和获得信息的机会主要取决于请求信息的用户,因此,要确保实现这两个特征,最重要的要素是用户对研究请求和研究建议的充分制定。由信息提供商提供。

信息的质量以及客户与代理商之间关系的质量都取决于市场研究开始时双方的协作。

没有神奇的公式,更不用说标准化的程序了,只是努力工作。如果客户希望从研究部门或机构获得更多价值,或者该机构希望为客户提供更高的质量,则他们必须在项目开始时进行深入合作。当然,这是更多的工作。但是附加值令人惊讶。

研究过程的另一个有价值的方面是提高信息与决策的相关性,这是对研究结果的分析和解释。除了准备报告来传达发现的结果,它不仅需要适当处理适当的统计技术,而且应该从项目开始就预见其使用方法,还需要敏锐的观点,以找出这些统计方法的真正含义。结果代表您要做出的决定。

ESIMM鼓励从市场研究中获取信息的准确性和可靠性,但是与其提供相关性和及时性的程序相比,它需要付出不同的努力。

如果客户希望从其代理机构或市场研究部门获得更多价值,并且该代理机构希望为他们的客户提供更多质量,则双方都应在研究开始时进行深入合作。

最好的出发点是客户的良好“研究请求”,从而使代理机构获得更好的“研究建议”。并且不要忘记,价格协商必须与时间协商保持平衡,因为这两个因素极大地影响了信息质量。

墨西哥市场研究机构协会(AMAI)自2000年以来建立了ESIMM(墨西哥市场研究服务标准),这是对这些机构进行的研究进行标准化的努力。

但是,该举措的重点更多是研究客户的满意程度,而不是研究质量,而且也忽略了机构本身必须对客户施加的质量要求。

确实,供应商必须满足其客户的质量要求。最重要的两个方面是提供完整的信息以及及时公平地付款。

客户与代理商之间的初步合作会导致研究获得真正相关的信息,并且该信息将在必要的时间以适当的价格进行。这是使用诸如申请和学习计划之类的工具的真正实用工具。

因此,客户满意度要求和研究方法学强度之间的可能差异也得到了纠正。纠正机构认为应该是客户需要的信息与客户认为与他的决定真正相关的信息之间可能存在的差异。

换句话说,由于客户既不一定是市场研究专家,也不一定是代理公司业务决策专家,所以两者都必须在项目开始时就进行深入的协作。

合作有时会超出项目设计范围,因为有时必须就样品,测量工具,分析和结果表示做出共同决策。

在程序上,ESIMM预见了这种可能性,并确立了以证据证明此类决定并由任何一方,客户或代理机构授权的要求。奇怪的是,这种做法通常在客户和广告代理商之间的关系中被接受,而在市场研究机构中则不被接受。

在严格执行ESIMM的过程中,必须注意官僚主义会抑制创造力的风险,以及要比市场研究的方法和学术上的要求更满足客户满意度的风险。

由于客户和代理商在研究开始时的共同参与,研究信息的相关性和及时性大大提高。

另一方面,信息的可靠性和准确性可能会受到研究过程中所犯错误的影响,这些错误主要与问卷的设计,抽样程序以及结果分析及其解释有关。

在定量研究中,一个好的问卷设计更多地是运用常识而不是其他任何技术的结果。减少错误的唯一可行的方法是,与与要抽样的人具有相同背景的人测试问卷。

在此之前,需要与同一个人的人保持密切联系,以了解他们使用的语言,他们表达自己的方式,甚至更重要的是,他们对所提出的问题给出答案。姿势

可以预见并因此可以通过良好的程序控制来避免调查表周围可能发生的许多错误。唯一无法避免的错误是那些拒绝回答调查问卷的人所导致的错误。此外,这是一个无价的错误,因为永远不可能知道这些人会回答什么。

抽样程序充其量是可疑的,因此受到无数批评。这在外行之间和专家之间都会发生,因为后者有时缺乏正确的基础。

怀疑通常与确定样本量有关,因为实际上实践中的错误主要来自选择受访者的方法。

在大多数需要概率抽样的研究中,样本量通常大于推断研究人群特征所需的最小样本量。这是由于需要包括一定数量的受访者配额,以使他们可以在以后进行交叉信息分析。

当没有系统和客观的程序来选择要包括哪些受访者时,就会发生真正的抽样错误。保持学习成本低廉的愿望导致在没有抽样框架的情况下,为了方便而使用受访者选择程序。

抽样不是概率性的仅意味着研究结果不能从样本推算到总体。该信息可能是相关且及时的,因此足以做出决定。但是,无法确定其可靠性和准确性。

最后,在对结果及其解释进行分析时,由于对研究中获得的信息的形式和实质的处理均产生了错误。有时这是信息的数字统计处理不充分,而在其他情况下,结果的解释会导致错误并得出不适当的结论。

样本数量的确定和样本的选择过程是市场研究过程中仅有的两个可以量化误差的方面。所述量化扩展到描述性研究结果的分析。

从描述性研究中获得的信息的准确性和可靠性主要取决于抽样程序,其中包括确定样本量和选择受访者的方法。

从经验上讲,抽样程序是基于这样的直觉,即基于该群体中只有一部分元素的知识,得出关于该群体所有元素的一般结论是有效的。

在日常生活中,由于我们根据对夜总会出勤情况的简单了解,对人,产品,服务,天气条件和无数情况的判断进行了概括,因此这种做法已扩展到许多领域(非常大气)或一次事件的观察(这里的食物非常美味)。

从理论上讲,抽样是基于归纳法,对这些猜想进行概率评估,以确定它们与现实的近似程度。换句话说,它使我们能够知道或估计从采样过程中得出的误差的大小。

假设以下5个家庭的Internet连接小时数:

F1 F2 F3 F4 F5
6 5 7 6 9

平均连接小时数为6.60,标准偏差为1.52,这是衡量其变化性的指标。换句话说,尽管每个家庭的平均时间相差大约一个半小时,但人口平均平均连接了六个半小时以上。

尽管实际上我们仅处理一个样本,但如果考虑所有可能的大小为2的样本,则有可能看到9个可能样本中的每个样本都将允许我们估计不同的平均连接小时数,因此估计将取决于从哪个样本中选择:

F1

F2

F1

F3

F1

F4

F1

F5

F2

F3

F2

F4

F2

F5

F3

F4

F3

F5

5.5

6.5

6.0

7.5

6.0

5.5

7.0

6.5

8.0

因为所有可能样本的平均值也是6.60,所以可以相信采样过程。

从采样中得出的误差来自样本的选择,因为如前面的示例所示,对连接时间平均值的估计取决于哪些元素成为样本的一部分。

所有这些可能的大小为2的样本的标准偏差(现在称为标准误差)为0.88连接小时,并且可以解释为例如66%的可能样本显示的平均小时数在5.72到7.48之间,即在一个或多或少的标准误差范围内。

换句话说,9个可能样本中的6个在等于真实均值附近的标准误差的范围内。

因此,我们必须以任何样本将在特定间隔内获得结果的概率来表示采样的可靠性。

随着样本数量的增加,每个样本更好地表示总体,在此示例中,如果样本的大小为4,则在获取样本的情况下,估计平均值为6.5个连接小时。由F1,F2,F3和F5组成。并且所有可能样本的估计间隔将大大缩短。

样本数量主要与要研究的人群特征的变异性有关。

因此,只要其特征是同质的,就可以用一个非常小的样本完美地表示一个无限大小的种群。

以游泳池为例,在游泳池中,要知道水温,一个人只能将脚尖放在岸上。采取这个微小的样本,可以对整个池做出决定。实际上,如果水温对您来说不错,则可能邀请其他人群充分自我介绍,而不仅仅是脚趾,而不仅仅是在岸上。

因此,用于确定样本数量的两个相关组件是代表总体的样本的可靠性(以标准误差单位表示)和要进行估计的精度。

研究人群的大小与确定样本量无关。这证明了确定样本数量的公式不包括总体数量。

但是,主要关注分析要求,它倾向于使用比理论上确定的更大的样本大小。即,期望在信息分析的每个单元中具有足够数量的观察(调查),这些观察(调查)是根据受访者的分类数据或研究过程中获得的其他响应来比较受访者组之间的信息时得出的。

由于对研究中获得的信息的形式和实质进行数字化管理而导致出现错误。也就是说,有时它的解释是导致错误并导致得出不适当结论的原因。

以一种非常特殊的方式,在提出比较手段时会出现错误,或者不同受访者群体对以相同术语提出的相同问题给出的回应率很高。

无需急于就复杂的公式进行详细的讨论,就有可能建立一些概念来阐明统计比较背后的原因。

比较两组或更多组受试者之间数值变量均值的适当方法是方差分析,该变量又由名义变量或序数变量的值确定。

它涉及费舍尔F值的计算,该值定义为将样本均值内的方差除以样本均值之间的方差的结果。F值,或者更确切地说,它的出现概率,通知我们两种均值之间的差异是否显着,因此,元素集的均值在统计上是否相等。

从概念上讲,通过一个简单的示例更容易理解它。假设来自两个不同NSE的两组家庭的平均Internet连接时间分别为每周8小时和10小时。从统计学上讲,这两个数字可以不同也可以相同。

为什么?主要是由于各组内反应的差异。让我们看一下以下假设可能性。

案例1。如果第一组家庭的平均值仅来自每个组的8个连接小时,而第二组家庭的平均值仅来自每个组的10个连接小时,则很可能出现平均数彼此不同。第一组的每个家庭连接8小时,而第二组的每个家庭则连接均匀。

每个家庭组中都没有可变性,这使我们认为,“连接时间”的平均值可以很好地(均匀地)代表该组。另外,由于两组的均值不同,因此认为第一组的8小时不同于第二组的10小时。

情况2。如果第一组中的平均值等于8,而这些响应是在3到16个小时之间变化的;并且平均值等于10的范围是2到18小时,最可能的是统计上8和10这两个数字应该相等。

换句话说,每组家庭的变异性使我们相信,其平均数不足以代表组成他们的家庭。因此,平均8小时的连接时间实际上可以低至3或高至16;而10个连接小时数实际上在相同范围内变化。

如果这些数字不能很好地代表该组,则结果是,几乎不能认为平均8和10个连接小时实际上是不同的数字。

情况3。另外,可以将两种算术相同的方法视为统计上不同。在同一示例中,如果两组的平均变异性不同,则平均八个连接小时可被认为是显着不同的。

假设其中一个是每个家庭分别消耗7、8或9个小时(响应分布非常均匀)的结果,另一个是每周消耗2至20杯软饮料的结果;尽管其平均值也为8,但答复的差异如此之大,以至于很难说8足以代表第二组家庭。因此,前8个(异构)不同于后8个(异构)。

考虑到每个组内的方差和组之间的方差来计算F值。相关的不是值本身,而是获得它的可能性。因此,具有统计意义的概念。

在随机分布中获得F的最终值的可能性使我们考虑该值是否足够大,可以得出结论它不是随机发生的,而是从比较组之间的实际差异得出的。

由于结果值还受采样过程特征的影响,因此将其出现的可能性与确定样本量的可靠性百分比进行比较。

因此,对于具有95%可靠性的样本,具有显着相关性的F值将是最多在5%的情况下随机出现的F值。

如果不是以数字形式给出问题的答案,而是基于名义或顺序的答案,那么就不能也不应计算均值,而必须管理回答的发生率。

为了评估两组受访者之间两种反应的发生率是相同还是不同,使用卡方值计算,根据定义,卡方值是具有观察频率之间差异平方的分数之和。和期望频率,并通过分母期望频率。

当观测频率和预期频率之间的差为零(即它们一致)时,卡方值为零。

随着频率之间差异的数量和重要性增加,卡方值也将增加,以衡量它们之间的差异。

可以随机获得高卡方值(由于与样本大小和选择有关的特性),或者由于两组元素彼此不同而获得高卡方值。同样,重要意义的概念与样本的可靠性百分比结合在一起。

相互比较两个数字时,非常重要的一点是要考虑它们的算术差异与它们的统计差异不相似,因为后者是由其方差的分布确定的。

市场研究中的错误