概率抽样:这是一个抽样过程,其中通过随机方法选择元素,即,通过随机程序以已知的选择概率进行样本元素的选择。
应用统计指标管理采样
样本选择方法
概率抽样:这是一个抽样过程,其中通过随机方法选择元素,即,通过随机程序以已知的选择概率进行样本元素的选择。
采样
样本选择方法
1-简单随机抽样:这是对样本的选择,其中元素或单位是通过随机过程直接选择的,每个未选择的元素与所有其他元素都有相同的机会被选择每个样品提取中的元素。因此,总体中的每个项目都必须具有相同的被选择概率。
采样
样本选择方法
2-系统抽样:以有序方式选择元素,具体取决于总体中包含的元素或单位的数量以及样本的大小。它要求使用人口所有要素的清单。
采样
样本选择方法
3-分层抽样:将总体分为一定数量的子组或层,每个子组或层均独立抽样。总体分为子组或分层的过程称为分层。分层的目的是在每个子组或层中分别进行选择。
采样
样本选择方法
非概率抽样:包括所有未通过随机或随机程序或已知选择概率选择样本元素的方法。非概率采样的一些选择程序是:
- 判断抽样:配额抽样:决策抽样:因果分组抽样:
统计数据
定量特征的数据:它们是可以数字表示并通过测量和计数获得的数据。可以在任何学科中找到定量数据。心理学,会计,经济学,
广告等
统计数据
定量和定性特征数据依次分类为:
1-连续变量:
2个离散变量:
统计数据
具有定性特征的数据:具有定性特征的数据是不能用数字表示的数据。在使用它们之前,必须将这些数据转换为数值。
统计数据
定性特征数据分为:
1-名义数据:它们包括类别,例如性别,学习职业,地板材料,学历等。
2层级数据:根据偏好或成就对概念进行排名时的主观评估
统计数据
频率分布:当您拥有大量或大量数据时,有时很难对它们进行分组。
这种组织信息的方式称为频率分布,包括通过类别和频率对数据进行排序。
统计数据
当数据以频率分布表示时,它们称为分组数据。当所有观察到的变量数据以杂乱无章的方式列出时,我们将其称为未分组数据。
分布的
频率
介绍
任何统计研究的初步阶段都基于数据的收集和排序;这是借助数字和图形摘要完成的。
位置测量
这些措施可帮助我们了解数据的位置,但无需指明数据的分布方式。
建立频率分布的步骤:已经知道构建和理解频率分布所必需的所有理论要素,我们将继续展示其实现所需的步骤。
3°计算班级数量,前提是班级间隔已知。
NC = R
词
从第二步和第三步可以看出,通过简单的数学方法很难求解这些方程,因为它们每个都有两个未知数。
在统计数据中,直方图是条形形式的变量的图形表示,其中每个条形的表面都与代表值的频率成比例。
它在研究连续变量(例如年龄范围或样本高度)时使用,并且为方便起见,将其值分组为类,即连续值。如果数据是定性的(非数字的),例如第六级协议或教育水平,则最好使用扇区图。
频率多边形
通过将频率直方图的列顶部的中点连接起来而制成的图形。
条状图
它是一组彼此分开的矩形或条形,因为它用于表示离散变量。钢筋必须具有相同的底宽或宽度,并且间距相同。它们可以垂直和水平排列。
线性图
折线图用于表示在特定时间收集的数据系列。数据以时间间隔绘制在图形上,并绘制一条连接结果点的线。
圆形图:
100%条形图和圆形图 -特别用于表示将总量划分为的部分。
弹头:
弹头:该图由频率分布的累积频率表示组成。它可以通过两种不同的方式来构建:在“少于”或“或更多”的基础上。您可以确定分布的中值。
讨论示例
算术平均位置的测量
表征分布的一种度量是算术平均值,通过将输入的x i值相加并除以总数N得到。
统计媒体
一旦变量被排序,该变量的值将在数据前后保留相同数量的数据。根据此定义,小于或等于中位数的数据集将代表数据的50%,大于中位数的数据集将代表总样本数据的其他50%。
统计媒体
为了理解这个概念,我们将假设我们具有一系列有序的值(2、5、8、10和13),中位数的位置为:
统计媒体
如果有序序列为(2、5、8、10、13和15),则中位数为:
也就是说,位置三个半。由于不可能突出显示三个半位置,因此有必要对第三和第四位置的两个值进行平均以产生等效的中位数,在这种情况下,这相当于(8 + 10)/ 2 = 9。这表明值的一半低于值9,另一半高于该值。
时尚
时尚
模态度量表示数据中最经常重复的值;也就是说,如果我们有序的序列(2、2、5和7),则最常重复的值是2,即数据的模式。有可能在某些情况下出现频率最高的两个值,称为双峰,在其他情况下则出现两个以上的值,称为多峰。
集中趋势的度量
集中趋势的度量
它们使我们能够根据数据倾向于集中的方式来识别数据中最具代表性的值。
平均值表示数据的平均值;也就是说,它告诉我们如果将价值平均分配的话每个人都会获得的价值。
集中趋势的度量
的中值,相反,通知该数据分离成两个相等的部分,其中的每一个具有数据的百分之五十的值的我们。
最后,Fashion指示数据中最重复的值
位置测量位置测量
位置测量将数据集划分为具有相同个体数的组。
要计算位置测量值,必须按从最小到最大的顺序对数据进行排序。
位置测量
四分位数
四分位数是变量的三个值,将有序数据集分为四个相等的部分。
Q1,Q2和Q3确定与数据的25%,50%和75%相对应的值。
Q2与中位数重合。
位置测量
十分位
十分位数是将数据序列分为十个相等部分的九个值。
十分位给出对应于数据的10%,20%…和90%的值。
D5与中位数重合。
位置测量
百分位数
百分位数是将数据序列分为100个相等部分的99个值。
百分位数给出对应于数据的1%,2%…和99%的值。
P50与中位数重合。
测量
的
分散
分散措施
分散措施
范围是分布中最大和最小数据之间的差
统计
分散措施
与平均值的偏差是统计变量的每个值与算术平均值之间的差。
D i = x-x
分散措施
平均偏差是与平均值的偏差的绝对值的算术平均值
平均偏差表示为
分散措施
方差属性
- 的方差将始终是一个正的值或零,在事件分数iguales.Si所有值的变量被加入一个数的方差不改变。
分散措施
方差属性
3如果所有的值的变量的被乘以由一个数,该方差是乘以由正方形那个的数目。
分散措施
方差属性
4如果我们有多个均值相同的分布,并且知道它们各自的方差,则可以计算总方差。
分散措施
差异观察
- 该方差,等于平均,是extremas.En案件非常敏感的指标得分无法找到媒体这将是不可能的 ,以找到差异。
分散措施
差异观察
3的方差不会在相同的单位数据表示,由于偏差的平方。
分散措施
标准偏差
标准偏差(σ)衡量数据分离的距离。
公式很简单:它是方差的平方根。那么“什么是方差?”
分散措施
标准偏差方差
方差(其为标准偏差的平方:σ 2)被定义为:
它是均值差平方的均值。
分散措施
标准偏差
换句话说,请按照下列步骤操作:
计算平均值(数字的平均值)
分散措施
标准偏差
现在,对于每个数字,减去均值并平方结果(平方差)。
分散措施
标准偏差
现在计算这些差异的均方根。(为什么平方?)
分散措施
标准偏差
(为什么平方?)
对每个差求平方将使所有数字均为正(以防止负数减少方差)
分散措施
标准偏差
它们也使巨大的差异脱颖而出。例如100 2 = 10,000远大于50 2 = 2500。
但是对它们进行平方运算会使答案非常大,因此我们将其撤消(使用平方根),因此标准差更为有用。
分散措施
下载原始文件