Logo cn.artbmxmagazine.com

使用minitab自动执行时间序列的操作

目录:

Anonim

您是否发现自己必须多次进行某些测试?如果是这样,您想休息一下吗?使用MINITAB,您可以轻松地自动化操作以节省时间。有多种方法可以执行此操作,从快速简便的剪切/粘贴方法到使用局部宏的更强大的方法。

这是如何运作的?MINITAB中几乎所有的操作都可以使用命令会话来完成。实际上,当您完成一个对话框并单击“确定”时,MINITAB会生成一个命令会话,其中包含您在其中选择的所有信息。您可以按原样使用这些命令会话。或根据需要修改它们,将它们加载一步,MINITAB将运行整个分析。

假设您每周收集一次数据,并从该数据生成三个不同的图。当然,每周您都应该为所有三个图表填写对话框,这将意味着大量鼠标单击。取而代之的是,您可以一步一步加载生成这些图表的脚本。

本文包含一些简单的示例,说明如何在MINITAB中自动化时间序列操作。

Minitab时间序列。

本手册包含Minitab系统版本15中有关时间序列的主题的概念,应用和执行

时间序列的基本概念

1.1引言

为了生存和进步,每个机构,无论是家庭,公司还是政府,都必须制定未来计划。如今,各种机构都需要了解某些现象的未来行为,以便进行计划,预期或预防。

合理的计划要求预期将来可能发生的事件。反过来,预测通常是基于过去发生的事情。因此,有一种新型统计推断的是由有关的一些变量或化合物的未来变数基于过去的事件。基于过去发生的事情来推断未来的最重要技术是时间序列分析。

在不同的知识领域可以引用无数的应用程序,例如经济学,物理学,地球物理,化学,电力,人口统计学,市场营销,电信,交通运输等。

时间序列

例子

1.经济系列: -物品价格-失业率-通货膨胀率

-价格指数等

2.物理系列: -气象-滴水量-每日最高温度

-风速(风能)

-太阳能等

3.地球物理学: -地震学系列
4.人口统计系列: -人口增长率-出生率,死亡率-人口普查结果
5.营销系列: -需求系列,费用,报价
6.电信系列: -信号分析
7.运输系列: -交通系列

时间序列试图解决的问题之一是预测问题。给定一个序列{x(t1),…,x(tn)},我们感兴趣的目标是描述该序列的行为,研究时间序列的生成机制,寻找可能的时间模式,以使我们克服未来的不确定性。

从现在开始,我们将研究如何建立一个模型来解释结构并预测随时间推移观察到的变量的演变。感兴趣的变量可以是宏观经济(消费者价格指数,电力需求,一系列进出口)等,宏观经济(公司的销售,仓库的存货,部门的广告费用),实物(风力发电站中的风速,过程中的温度,河流的流量,污染物在大气中的浓度)或社会(出生,结婚,死亡或投给政党的票数)。

1.2时间序列的定义

在许多知识领域中,感兴趣的观察是在连续的瞬时时刻获得的,例如每小时,每24小时,每月,每季度,每半年一次,或者由某些团队连续记录下来。

我们将时间序列称为对某种现象或实验的一组测量值,这些测量值或实验按时间顺序记录下来。这些观测值将由{x(t1),x(t2),…,x(tn)} = {x(t):tÎTÍR}与x(ti)表示变量x的值您。如果T = Z,则时间序列被认为是离散的;如果T = R,则时间序列被认为是连续的。当对于所有i = 1,…,n-1的ti +1-ti = k时,该序列被认为是等距的,否则它将是非等距的。

从现在开始,我们将使用等距的离散时间序列,在这种情况下,我们将假设并且不失一般性地表示:{x(t1),x(t2),…,x(tn)} = {x(1),x(2 ),…,x(n)}。

1.3分析任何时间序列的第一步

时间序列分析的第一步是绘制序列。这使我们能够检测到该系列的基本组成部分。

该系列的图表将允许:

a)检测异常值:指序列中超出正常值的点。离群值是对序列的观察,对应于现象的异常行为(没有将来的事件)或测量误差。

必须从外部确定给定点是否异常。如果找到它,则在解析该序列之前必须将其省略或替换为另一个值。

例如,在工厂的日常生产研究中,发生了以下情况,见图1.1:

圈出的两个点似乎对应于该系列的异常行为。在调查这两点时,发现它们对应于两天的失业,这自然影响了那几天的生产。通过删除观测值并进行插值解决了问题。

b)它可以检测趋势:趋势代表该系列的主要行为。可以将其大致定义为一段时间内的平均值变化(见图1.2)。

c)季节性变化:季节性变化表示时间序列的周期性运动。周期的单位长度通常小于一年。它可以是一个季度,一个月或一天等(请参见图1.3)。

从数学上讲,如果存在一个数s使得x(t)= x(t + k×s),则该序列表示季节变化。

导致季节变化的主要因素是天气条件,例如:

  1. 冬季冰淇淋销售,夏季羊毛销售,3月水果出口。

所有这些现象都显示出季节性行为(每年,每周等)

d)不规则变化(随机成分):不规则(随机)运动表示时间序列中除趋势,季节性变化和周期性波动之外的所有类型的运动。

2.经典时间序列模型

2.1分解模型

时间序列的经典模型假设序列x(1),…,x(n)可以表示为三个分量的总和或乘积:趋势,季节性和随机误差项。

存在三个时间序列模型,它们通常被视为观测数据各组成部分之间真实关系的良好近似。这些是:

  1. 加法器:X(t)= T(t)+ E(t)+ A(t)乘法:X(t)= T(t)•E(t)•A(t)混合:X(t)= T (t)•E(t)+ A(t)

哪里:

  • 在时间tT观察到的X(t)系列T(t)趋势分量E(t)季节性分量A(t)随机(偶然)分量

通常的假设是A(t)是随机成分或均值为零且方差恒定的白噪声。

加性模型(1)是适用的,例如,当E(t)不依赖于其他成分(例如T(t))时,如果相反季节性随趋势变化,则最合适的模型是乘法模型(二)。显然,可以采用对数将模型2转换为加法器。出现的问题是正确建模该系列的组件。

图2.1说明了可能的模式,随后可能会出现由模型(1),(2)和(3)表示的系列。

2.2估计趋势

在这里,我们假设不存在季节性成分E(t),并且附加模型足够,即:

X(t)= T(t)+ A(t),其中A(t)是白噪声。

有几种估算T(t)的方法。使用最广泛的包括:

  1. 拟合时间函数,例如t的多项式,指数函数或其他平滑函数。软化(或过滤)序列中的值。使用差异。

2.2.1设置功能

下图说明了这些曲线的一些形状。

注意:

  1. 趋势曲线必须涵盖相对较长的时间段才能很好地表示长期趋势,因为长期的S曲线可能会在有限的时间段内显示为一条直线,因此直线和指数趋势在短期内适用。时间(例如)。

在图2.2中,两条曲线(直线和Gompertz)拟合得很好,但从长远来看,预测差异很大。

示例1:表2.1列出了从1964年第三季度到1972年第二季度在美国开始的住房单元的季度数据。(必须注意,对于趋势分析,考虑的时间段应更长。但是,由于主要目的是说明分解方法和从如此分解的元素推断出的技术,因此功能不足的数据不必引起兴趣。)

表2.1:从1964年第三季度到1972年第二季度在美国开始的新住房单位(以数千为单位)。

一世 II 三级 IV 年度总计
1964年 398 352
1965年 283 454 392 3. 4. 5 1,474
1966年 274 392 290 210 1,166
1967年 218 382 382 340 1,322
1968年 298 452 423 372 1,545
1969年 336 468 387 309 1,500
1970年 264 399 408 396 1,467
1971年 389 604 579 513 2,085
1972年 510 661

令t为1964年至1972年的32个季度中的每个季度,即1964年第三季度t = 1,第四季度t = 2,依此类推。因此,t的定义域是1到32之间(含1和32)的整数集。令T(t)为季度开始的房屋。t和T(t)的值在表2.2中给出。计算趋势线上的a和b的值

T(t)= a + bt

下图是从表2.1中的数据获得的。

表2.2:从1964年第三季度到1972年第二季度在美国开始的住房趋势的计算

季度年

Ť

趋势
1964年:3

之一

398

291.73

4

352

298.07

1965:1

3

283

304.41

4

454

310.75

3

5

392

317.09

4

6

3. 4. 5

323.43

1966年:1

7

274

329.77

8

392

336.11

3

9

290

342.45

4

10

210

348.79

1967年:1

十一

218

355.13

12

382

361.47

3

13

382

367.81

4

14

340

374.15

1968年:1

十五

298

380.49

16

452

386.83

3

17

423

393.17

4

18

372

399.51

1969:1

19

336

405.85

二十

468

412.19

3

二十一

387

418.53

4

22

309

424.87

1970:1

2. 3

264

431.21

24

399

437.55

3

25

408

443.89

4

26

396

450.23

1971年:1

27

389

456.57

28

604

462.91

3

29

579

469.25

4

30

513

475.59

1972年:1

31

510

481.93

32

661

488.27

所以趋势线是

T(t)= 285.39 + 6.34×t

图2.3以图形方式显示了针对表2.2中的季度数据进行调整的趋势线。1972年后的虚线代表预测值(请参阅第3节“预测”)。

Minitab中的开发:

  1. 打开Minitab,将数据复制到Minitab工作表中,选择:统计à时间序列à趋势分析。

  1. 在“趋势分析”窗口中,单击选择变量,将“模型类型”保留为“线性”,然后单击“确定”。

  1. Minitab将显示以下图形,我们可以看到它类似于练习过程中显示的图形。

  1. 如果要在一个窗口中获取4个图,请选择选项Graphs…。

单击四合一。

点击确定

Minitab将显示以下图形。

2.2.2软化。线性滤波器

可视化趋势的一种方法是使序列平滑。中心思想是从观察到的序列中定义一个新序列,以平滑非趋势影响(季节性,随机影响),以便我们可以确定趋势的方向(见图2.4)。

我们要做的是使用一个线性表达式,该线性表达式将序列X(t)转换为平滑的序列Z(t):Z(t)= F(X(t)),t = 1,…,n

这样F(X(t))= T(t)。函数F称为线性滤波器。最常用的线性滤波器是移动平均值。

2.2.2.1移动平均

目标是从该系列中删除季节性和意外性因素。对于具有年度季节性(s = 12)的每月序列,将获得平滑序列,

对于具有年度季节性(s = 4)的季度序列,平滑序列由下式给出:

此过程称为:有限对称滤波器。

注意:当有许多突然变化,不规则运动时,它会变软。

例2:从例1的数据中计算出移动平均值,方法是将一定数量的连续周期的值相加,然后将所得的总和除以所覆盖的周期数。在这种情况下,它是一个季度序列,为此使用公式(2)。

表2.3:1964年第三季度至1972年第二季度在美国住房启动的四季度居中移动平均计算(千单位)

按季度

原始数据与

四个季度的移动总计

四季度移动平均线

四季度居中移动平均线

(之一)

(二)

(3)

(4)

(5)

1964年:3

398

4

352

1965:1

283

1,487

372

371

454

1,481

370

369

3

392

1,474

369

367

4

3. 4. 5

1,465

366

359

1966年:1

274

1,403

351

338

392

1,301

325

308

3

290

1,166

292

285

4

210

1,110

278

276

1967年:1

218

1,100

275

287

382

1,192

298

314

3

382

1,322

331

341

4

340

1,402

351

359

1968年:1

298

1,472

368

373

452

1,513

378

382

3

423

1,545

386

391

4

372

1,583

396

398

1969:1

336

1,599

400

395

468

1,563

391

383

3

387

1,500

375

366

4

309

1,428

357

348

1970:1

264

1,359

340

342

399

1,380

3. 4. 5

356

3

408

1,467

367

382

4

396

1,592

398

424

1971年:1

389

1,797

449

471

604

1,968

492

507

3

579

2,085

521

536

4

513

2,206

552

559

1972年:1

510

2,263

566

661

例如,在表2.3中,通过将1964年第三季度和第四季度以及1965年第一季度和第二季度的值相加,然后将总和除以4.得到1965年第一季度的四季度移动平均值。对于1965年第二季度,可以通过将1964年第四季度的值与1965年第一季度,第二季度和第三季度的值相加,然后将总和除以4得到。并且添加了最后一个。

表2.3的第4列显示了根据1964年至1972年房屋开工数据得出的四个季度的移动平均值。移动平均值并不能消除该系列中非常明显的波动,但会大大减小变化幅度。原始数据。

如果输入的周期数为奇数,则移动平均值将比较容易,因为计算平均值的周期之前和之后的周期数相同。如果周期数为偶数(如本例所示),则不能在指定周期之前和之后使用相同的周期数。因此,移动平均线必须位于两个连续周期的值之间的一半,并且与任何周期都不相关。该问题可以通过计算以序列为中心的移动平均值来解决,这是通过首先获得已经获得的移动平均值的四分之二的中心移动平均值来实现的。第一个居中移动平均值是前两个四分之四移动平均值的平均值,第二个居中移动平均值是四个第二和第三季度等的移动平均值的平均值,依此类推。这样,在计算中心移动平均值的指定时间段之前和之后,将有相等数量的时间段。中心移动平均值在表2.3的第5列中显示。

根据公式2,计算如下:

此值对应于第5列中显示的居中移动平均值。

图2.5以图形方式显示了根据表2.3进行的移动平均线调整,其中黑色部分表示原始序列,蓝色部分表示平滑序列。

Minitab中的开发:

  1. 打开Minitab,将数据复制到Minitab工作表中:

  1. 选择:统计à时间序列à移动平均…

  1. 单击选择具有时间序列的变量,然后放置MA长度。

在这种情况下,它等于4(每年4个季度)。点击确定

  1. Minitab将显示带有移动平均值的图形。

摘要

时间序列称为对某种现象或实验的一组测量值,这些时间序列按时间顺序记录,例如,每小时,每月,每季度,每半年一次等。在本说明中,我们使用了离散时间序列,在这种情况下,假定:{x(t1),x(t2),…,x(tn)} = {x(1),x(2),…,x(n)}。由于介绍性,它仅限于单变量时间序列的情况。

分析时间序列时,首先要做的是绘制时间序列图。这使我们能够检测到该系列的基本组成部分。该系列的图形将允许:检测异常值,检测趋势,季节性变化,不规则变化(或随机分量)。

经典的时间序列模型可以表示为三个组成部分的总和或乘积:趋势,季节和随机误差项。有三种时间序列模型。这些是:

  1. 加法器:X(t)= T(t)+ E(t)+ A(t)乘法:X(t)= T(t)•E(t)•A(t)混合:X(t)= T (t)•E(t)+ A(t)

为了获得模型,有必要估计趋势和季节性。为了估计趋势,假定不存在季节性成分。通过移动平均值将序列的多项式或平滑度拟合为时间函数,可以实现估算。要估计季节,必须确定要使用的模型(混合模型或添加模型)。一旦估计了趋势和季节性,我们就可以预测。

本注释中回顾的方法本质上是描述性的,因此对现象的判断和知识在模型选择中起着重要的作用。

经典方法的缺点是它们会随着时间的流逝而适应,这意味着必须面对新数据的知识重新启动估算过程。

团队组成:

Ing。Gerardo Valdes Fuentes

Ing。Rosa IselaMeléndezLópez

里克·何塞·路易斯·查韦斯·达维拉

Ing。Renato ElmerVázquezGarcía

掌握行政和领导才能。

东北自治大学。

参考书目:

管理员统计信息,

理查德·莱文(Richard I. Levin)和大卫·鲁宾(David S. Rubin)。

社论学徒大厅

使用minitab自动执行时间序列的操作