使用多元统计工具进行财务分析

介绍

旅游业公司的经济和财务分析在国内外文学中显示出越来越高的相关性和重要性，传统技术的使用更加频繁，其结果的评估使我们能够在正确的时间做出正确的决定。本文揭示并建议了多元统计工具的使用，除其他外，该工具可用于商业领域，尤其是旅游业。该作品展示了一个案例研究中的一个示例，该案例试图激发旅游区的专家和研究人员对其进行使用。

关于多元技术的评论

多元统计的应用存在于科学的不同领域或分支中，例如：市场研究（确定个人特征以确定哪种类型的人购买某种产品）；在任何类型的专业的教育体系中（了解成功完成学业的学生）；在农业中（通过研究某些农作物对害虫和干旱的抵抗力）；在运动中（从人体测量学中了解在特定运动中获得良好成绩的可能性）；在心理学上（通过研究青少年行为与父母态度之间的关系）；经济（了解一个地区相对于其他地区的发展水平，并从其他基本经济变量中进行推断）。

当同一个人被测量的特征不止一个时，就会产生多变量数据。个人可以是可以衡量的对象或概念。通常，个体称为实验单位。对象的示例：人，动物，土地，公司，国家等。概念的示例：爱情，友谊，约会等。变量是针对个人的特征或属性。

多元技术的目标：

简化：多变量方法是一组技术，允许研究人员根据其简化或简化来解释和可视化大数据集（包括个体和变量）关系：查找变量之间，个体之间以及两者之间的关系。。

变量之间的关系

当变量测量共同特征时，它们之间存在关系。示例：假设在该国的旅游实体中选择的12年级学生参加了西班牙语，数学和历史考试，从而获得了旅游学学士学位。如果每个学生在所有三个测试中的得分都高，中或低，则这些测试将相互关联。在这种情况下，这些考试可能要衡量的共同特征可能是使他们能够开始大学生涯的“一般情报”。

个人之间的关系

如果个人之间彼此相似，则存在个人之间的关系。示例：假设根据啤酒的接受程度对不同类型的啤酒进行了评估，例如，针对不同年龄组的消费量进行了测量，那么浅色和深色啤酒可能具有某种关系，或者啤酒的类型完全不同。

在多变量方法中，假定变量是相关的，但是对个体的观察是独立的。通常还假定分析中涉及的变量集具有多元正态分布。该假设允许多变量分析与基于正态分布的相应单变量分析并行运行。

多元方法的分类：

受变量指导或激发的：它们关注变量之间的关系。示例：相关矩阵，主成分分析，因子分析和回归分析个体驱动或动机-专注于个体之间的关系。示例：判别分析，聚类分析和方差的多元分析。

多元探索性分析

顾名思义，描述性（多元）统计信息用于描述数据集的行为，其中最重要的是：

样本均值样本方差样本相关散点图主要成分

统计推断

统计推断的问题在于，通过根据从总体获得的样本中包含的信息生成的摘要（称为统计），近似某些总体特征（称为参数）的值。

点估计：点估计问题包括提供一个近似感兴趣参数的点值。参数的经典点估计方法是：矩量法和最大似然法。

假设检验：统计中的假设检验问题决定了两个假设中的哪一个是正确的。根据样本信息做出决定。

对多元数据最重要的假设检验是检验两个变量之间的相关性是否显着不同于零。

置信区间：计算置信区间是一个区间估计问题，其中提供了一组高度可能的值作为参数的近似值。

与假设检验的情况一样，最受关注的置信区间是两个变量之间的相关性。

使用相关性对变量进行分组。当您拥有大量变量时，某些变量之间可能存在一定的关系。变量对之间的相关系数允许对变量进行分组，以使同一组中的变量具有较高的相关性，而不同组中的变量具有较低的相关性。

多元分析的精选技术

多元回归分析

回归是一种用于研究和建模影响某种现实现象的变量之间现有关系的技术。例如，经济分析师可能会对建立公司财务指标所呈现的状况与可能的不平衡状况之间存在的关系感兴趣。

从广义上讲，回归是旨在使模型适合一组数据或观察值的过程。实际上，回归方程只是变量之间关系的近似值。回归可以用作描述性工具或推理性工具。

在第一种情况下，研究人员可能会对寻找最佳线性预测方程感兴趣。您还可以控制现象中存在的一组因素进行评估。在第二种情况下，即推论，研究人员有兴趣通过检查观察样本并验证一些假设检验（例如自变量之间是否确实存在线性关系）来估计总体参数。也就是说，如果一个特定的自变量对因变量没有线性影响。

主成分分析

主成分分析（PCA）是一种统计技术，由卡尔·皮尔森（Karl Pearson）于19世纪初提出，是因子分析的一部分。但是，计算的复杂性推迟了它的发展，直到计算机的出现及其在20世纪下半叶的使用。

ACP追求的主要目标是在维数有限的空间中表示各种变量的数值度量，在这些维数中我们的感官可以感知到否则将隐藏在较高维中的关系。所述表示必须是这样的，以致当丢弃更高的尺寸时（通常从第三或第四开始），信息的损失最小。尽管这表明ACP是一种描述性技术，但它并不否认它也可以用于推理目的的可能性。

ACP允许减少数据的维数，将p个原始变量的集合转换为q个不相关的变量的另一个集合，称为主成分。对n个个体中的每个个体测量p个变量，以获得np阶的数据矩阵（p <n）。在ACP中，可以选择使用相关矩阵或协方差矩阵。在第一种选择中，对每个变量都给予同等的重视；当研究人员认为所有变量都具有同等相关性时，这可能很方便。当所有变量都具有相同的度量单位时，以及当研究人员认为方便根据变量的可变性突出显示每个变量时，可以使用第二个选项。

以原始变量的线性组合形式获得q个新变量（主要成分）。根据解释的差异百分比对组件进行排序。从这个意义上讲，第一个成分将是最重要的，因为它是解释数据差异最大百分比的成分。由研究者决定要在研究中选择多少个成分。ACP的优点是不需要诸如正常性之类的假设。

应用领域

ACP最常见的用途是：

作为一种探索性分析技术，可以发现数据之间的相互关系，并根据结果，提出最合适的统计分析方法；减小数据矩阵的维数，以避免冗余并突出显示关系。在大多数情况下，仅采用第一个成分，就可以解释原始数据中包含的大多数总变化，然后根据可观察变量构造不可观察变量（成分）。例如，一个人的智力不是直接可观察到的，而是可以使用心理测验来测量其不同方面。衡量智力不同方面的变量往往是协变量。这表明它们表现出相同的特征，但方式不同，并且只有很少一部分无法直接测量的特征，这些特征被称为综合指标，并且是由组件估算的。在某些情况下，使用这些不相关的组件非常有用，作为其他分析的输入数据。例如，在自变量显示高共线性的情况下进行多元回归时，最好对主成分进行回归，而不要使用原始变量。例如，在自变量显示高共线性的情况下进行多元回归时，最好对主成分进行回归，而不要使用原始变量。例如，在自变量显示高共线性的情况下进行多元回归时，最好对主成分进行回归，而不要使用原始变量。

判别分析

允许通过自变量（也称为预测变量，特征或参数）的线性组合来预测因变量名义行为的技术和统计工具，该自变量在此组合中对因变量类别进行平均评分。线性尽可能地微分。

例如，用在市场研究中，基于对按地区，人口密度对个人可支配收入的某些评估，来预测在给定市场区域内的潜在销售是“好”还是“坏”，因变量和零售量，预测变量。其他应用示例是在金融机构中，其中定义了“问题”或“严重”帐户，每个帐户都描述了一些参数，例如信贷利率，拖欠次数，债务资本比率，债权存在，随后，获得那些可以最好地区分的预测变量，其中某个分析单位，个人，对象或帐户在这种情况下可能变得“严重”或“有问题”。判别分析有两个主要目标：

预测分析单元或对象或个人的类别，确定哪些预测变量具有最高的区分能力，可以对分析单元进行分类，以使它们具有因变量的一个或另一个属性。

实现目标的方法是通过获得判别函数：

FD =ß1X1 +ß2X2 +……………+ßmXm

其中xm是第m个独立变量。由systat，BMD-07M或statgrafics等计算机程序获得的判别函数确定ß的每个独立变量的值，这些值称为判别系数，判别beta或判别权重。每个计算出的判别式beta都有一定的数量或系数，以及其相应的正负号。 β的系数决定了每个独立变量在判别中的权重，正负符号表示它们在因变量定义的一个或另一个子组中的分配。目的是用其自变量替换目标人群的分析单位，对象或个体，获得的函数中的参数或特征，并先验计算其类别。代数函数用判别函数表示原始数据的线性组合，该组合使组之间（一方面是有问题的帐户，另一方面是严重帐户）之间的可变性与组内可变性的比率最大化。用来确定组变异性何时最大的标准是方差分析F或也称为Snedecor's F的分析，已知该分析可发现方差之间的差异。因此，以以下方式得出判别系数：代数函数用判别函数表示原始数据的线性组合，该组合使组之间（一方面是有问题的帐户，另一方面是严重帐户）之间的可变性与组内可变性的比率最大化。用来确定组变异性何时最大的标准是方差分析F或也称为Snedecor's F的分析，已知该分析可发现方差之间的差异。因此，以以下方式得出判别系数：代数函数用判别函数表示原始数据的线性组合，该组合使组之间（一方面是有问题的帐户，另一方面是严重帐户）之间的可变性与组内可变性的比率最大化。用来确定组变异性何时最大的标准是方差分析F或也称为Snedecor's F的分析，已知该分析可发现方差之间的差异。因此，以以下方式得出判别系数：判别系数的推导方式为：判别系数的推导方式为：

组之间的差异

F = -----------最大

组内变异

任何判别分析的出发点都是确定名义性质的因变量数据矩阵，该矩阵可以通过主成分计算或给定。

案例研究。美丽华酒店

拥有10年经营历史的Miramar SA Hotel Chain已巩固了其在加勒比海地区的地位，并在该地区几乎所有国家/地区设有设施。股东大会已根据经济活动的结果要求对酒店进行分类，目的是为那些落后于目标的人做出决定。

为了开展这项工作，董事会聘请了一位专门负责经济和审计问题的顾问，并要求在连锁酒店拥有的30家酒店中的每家酒店中检查以下变量：销售增长，经济获利能力和重量成本。

顾问认为，为了实现所提出的目标，他们应该采用多元技术，尤其是主成分分析和判别分析。在信息处理中使用了广泛使用的统计系统。以下提供的结果来自该系统提供的结果。

主成分分析

摘要

分析变量：

销售增长

经济利润率

重量成本

案例数：30

标准化：是

卸下的组件数：1

主成分分析

-------------------------– 方差

百分比

成分百分比

解释的拥有价值

1 2,7729800 92,433 92,433

2 0 ，1507870 5,026 97,459

3 0.0762356 2,541 100,000

--------------------------

注释

--------------------------

目的是获得所研究的3个变量的线性组合，这解释了变量的大多数变异性。在这种情况下，数据的第一部分解释了原始数据变异的92,433％。

零件重量表

组件1

------------------------------------------

销售增长0.584118

经济回报0.577760

重量成本0.570088

--------------------------

上表显示了第一个主要成分的变量的系数，其等式由下式给出：

0.584118 *销售增长+ 0.57776 *经济回报+ 0.570088 *重量成本

在方程中变量的值已标准化的情况下，即已减去它们的平均值并除以标准偏差。

判别分析

摘要

分类变量：Col_7自

变量：

销售增长

经济利润率

重量成本

案件数：30

团体数目：2

函数百分比

判别相关典范相对拥有值

-------------------------–

1 3.14232 100.00 0.87097

函数Wilks卡方平方DF P值

导出的Lambda

-------------------------–

1 0.241411 37.6633 3 0.0000

--------------------------

--------------------------

此过程旨在获取一组判别函数，这些判别函数可基于自变量的定量值来帮助预测因变量。两组共使用约30例判别模型。介绍了三个预测变量。第一个判别函数在统计学上的显着性水平为95％。

因变量的判别函数

标准化系数

-----------

经济收益0.736324

销售增长0.171982

重量成本0.196148

------------------- ----–

非标准化系数

-------------

经济收益0.1371040

销售增长0.0454077

重量成本0.0629418

恒定-25.5891

--------------------------

--------------------------

上表显示了用于区分因变量的不同级别的函数系数。特别感兴趣的是标准化系数。第一个标准化的判别函数是：

0.736324 *经济收益+ 0.171982 *销售增长+ 0.196148 *重量成本

根据先前方程式的系数的相对大小，可以确定如何使用因变量来区分组。

分类表

大小组

第1组的组2

---------------------

1 15 15 0

（100.0％）（0.0％）

2 15 0 15

（0.0％）（100.0％）

----------------------

正确分类的百分比：100.0％

组统计摘要

------------------------------–因

变量1 2总

金额15 15 30

---------- ---------------------

媒体

盈利能力115.227 106.303 97.38

销售经济增长104.893 99.4767 94.06单位

重量成本99.3667 103.23 107.093

-------------------------------

标准偏差

经济回报率4.29737 6.26241 10.4986

销售增长4， 47386 2.94533 6.6485

重量成本2.37296 3.71377 4.98163

-------------------------------

因变量的分类函数系数

--------------------------

1 2

，经济效益-0.738405 -0.268809

销售增长2.299696 2.45449

每成本重量9,06632 9,28191

常数-523,306 -610,951

结果

-523,306-0,738405 *经济回报+ 2,29896 *销售增长+ 9,06632 *重量成本

此函数用作新观测值的因变量的预测变量。

统计

协方差矩阵

经济利润率销售增长重量成本

经济利润率28.8426 14.6768 9.36831

销售增长14.6768 14.3452 7.93248

重量成本9.36831 7.93248 9.71152

相关矩阵

经济获利能力销售增长重量成本

经济获利1.0 0.721541 0.559758

销售增长0.721541 1.0 0.672066

重量成本0.559758 0.672066 1.0

该表显示了每个组中独立变量之间的估计相关性。

咨询实体将获得的结果总结如下：

美丽华连锁酒店中有一半的运营存在问题。

所使用的方法和找到的方程式可以区分酒店是否在运营中出现问题。

这项研究应在旅游旺季和低旅游时期都进行。

销售增长指标在酒店运营结果中具有基本的权重，其次是销售的盈利能力，最后是按重量计的成本。

最好对那些未能取得满意结果的酒店进行严格的审查。

参考书目

Linares Fintes，Gladys；利亚姆·阿科斯塔·拉米雷斯（AcostaRamírez）； Sintache Vega，Vivian。 ¨多元统计数据¨ENDES，古巴戈德。古巴1986.htpp：//www.emagister.com//Comunidad_Emagister_quiebra_2001htpp：//www.google.es//主要成分分析。 ¨统计的主要组成部分¨。 2005htpp：//www.google.es//多元分析。多变量分析。 2005htpp：//www.google.es.//判别分析。 ¨公司的财务状况。新兴市场的奥特曼模型¨。 2006htpp：//www.google.es//判别分析。 ¨判别分析¨。 2006年