Logo cn.artbmxmagazine.com

Olap和多维数据集设计

Anonim

多维数据集是OLAP(在线分析处理)中的关键元素,该技术可快速访问数据仓库中的数据。多维数据集提供了一种机制,可以以快速且一致的响应时间搜索数据,而不管多维数据集中的数据量或搜索过程的复杂性如何。

多维数据集是数据仓库中数据的子集,在多维结构中进行组织和汇总。根据选择的业务因素汇总数据,为复杂查询的快速统一响应时间提供了机制。

定义多维数据集是创建多维数据集的三个步骤中的第一步。其他步骤是通过设计聚合(预先计算的数据元素)来指定汇总策略,并加载多维数据集以对其进行处理。要定义多维数据集,请选择一个目标表,然后在该表中选择度量(多维数据集用户感兴趣的数字列)。然后选择维,每个维由另一个表中的一列或多列组成。维度提供了分类描述,多维数据集用户通过这些分类来分离度量以进行分析。

外型尺寸

维度是描述性类别,多维数据集中的数字数据(度量)通过这些类别进行分离以进行分析。例如,如果一个多维数据集的度量是生产数量,而尺寸是时间,工厂和产品的位置,则该多维数据集的用户将能够在几个时间类别内分离生产数量,工厂和产品的位置。

可以创建一个尺寸以在单个多维数据集中或在多个多维数据集中使用。为单个多维数据集创建的维度称为私有维度。相反,如果可以被多个多维数据集使用,则称为共享维度。这些可以在数据库的任何多维数据集中使用,从而优化时间并避免重复私有维度。

共享维度还可以实现多维数据集之间的业务指标的标准化。例如,对时间和地理位置的共享维度进行标准化,可以确保对来自不同多维数据集的分析数据进行类似的组织。

测量

度量是多维数据集用户最感兴趣的数值数据。一些常见的度量是单位销售,比索销售,销售成本,费用,生产数量,预算等。这些由OLAP服务聚合过程使用,并存储下来以快速响应用户请求。

您可以创建计算的度量并计算维成员,将多维表达式(MDX),数学公式和用户定义的函数(UDF)组合在一起。此功能使您可以基于简单的公式语法定义新的度量和维成员。可以注册其他UDF库,以用于定义计算所得的成员。

会员属性

您可以定义维成员的属性,并将数据用于多维数据集中的这些属性。例如,如果产品维度的成员是其零件号,则执行与此零件号相关的各种属性(例如大小,颜色等)是相同的。您可以将此类属性指定为成员属性,并将其用于分析搜索中。

虚拟立方体

您可以在虚拟多维数据集中连接多维数据集,就像在关系数据库中将表与视图连接在一起的过程一样。如果需要构建新的多维数据集,则虚拟多维数据集提供对组合多维数据集中的数据的访问,同时允许在每个单独的多维数据集中维护最佳设计。

可以更新多维数据集,仅处理已添加的数据,而不是对整个多维数据集进行处理,可以使用增量更新来在使用多维数据集时对其进行更新。

集合体

这就是所谓的预先计算数据总和的过程,以帮助减少信息搜索过程中的响应时间。

安全

使用Microsoft SQL Server OLAP服务管理的安全设施,您可以控制谁访问数据以及用户可以对数据执行的操作类型。OLAP服务支持Windows NT操作系统提供的集成安全系统,并允许您向数据库和多维数据集(包括虚拟多维数据集)分配访问权限。

通过角色管理的访问控制权限来管理安全性,这些权限决定了对数据的访问类型。角色定义具有相同访问控制的用户类别。

储存方式

对于多维数据集,有三种存储信息的方式:

1.- MOLAP-多维OLAP。

2.- ROLAP-关系OLAP。

3.- HOLAP-混合OLAP。

莫拉普

多维数据集的源数据及其聚合(汇总)一起存储在高性能多维结构中。MOLAP存储提供出色的性能和数据压缩。正如他们所说,一切都在桶中。

它具有最佳的响应时间,仅取决于多维数据集聚合的百分比和布局。通常,由于此方法反应迅速,因此非常适合经常使用的存储桶。

罗拉普

多维数据集中的所有信息,其数据,其聚合,总和等,都存储在关系数据库中。ROLAP不存储数据库的副本,它在需要回答问题时访问原始表,通常比其他两种存储策略要慢得多。

通常,ROLAP用于不经常搜索的大型数据集,例如最近几年的历史数据。

霍拉普

HOLAP结合了MOLAP和ROLAP的属性,数据聚合存储在MOLAP使用的多维结构中,而源数据库存储在关系数据库中。对于访问摘要数据的搜索过程,HOLAP等效于MOLAP,相反,如果这些过程将访问诸如向下钻取之类的源数据,则它们必须在关系数据库中搜索数据,而这与数据存储在MOLAP结构中。

作为HOLAP存储的多维数据集小于MOLAP,并且响应速度比ROLAP快。

HOLAP通常用于需要快速响应的多维数据集,基于大量数据的汇总。

Olap和多维数据集设计