Logo cn.artbmxmagazine.com

设置公司数据仓库的10个错误

目录:

Anonim

摘要

生活中有许多事情是正确面对的,但是值得拥有更多经验的事情中,有一些是由于犯了错误而产生的,因为人们知道所获得的负面结果,影响错误的背景因素以及尽量不要重复太多。

公司数据仓库构建中的错误列表是第一篇文章之一,该文章旨在从信息技术项目(在这种情况下,是公司数据仓库开发项目)中汲取的经验教训来建立知识库和经验。

创建该列表的目的是为所有参与数据仓库开发工作的人们提供实用工具,并可以评估他们前进的道路和最终成功的机会,但是可以从中提取最综合的建议它是为了在参与级别和组织领域保持联合工作,并在所涉及技术的坚实理论-实践基础上进行工作。

此列表的目的是提供从该技术在各种公司中的应用中汲取的教训的咨询资源,并提供理论和实践基础,该基础基于计算机科学领域,更准确地说,取决于计算机科学领域。数据仓库技术,它将最终导致公司的公司数据仓库项目的未来成功。

关键字:数据仓库,数据集市,数据挖掘,公司数据仓库的构建,常见错误,数据仓库项目的管理,建立数据仓库的风险,数据仓库的前景,数据仓库投资的获利指标

指数

1.简介

2.公司数据仓库建设中最常见的10个错误清单

3.结论

4.参考书目

1.简介

如今,大多数金融和商业公司的技术领域,直到最近才将其大部分精力投入到提供交易信息系统中,从而支撑了价值链中大多数活动的负担-他们专注于实现对存储数据的一致利用:历史和交易,围绕它的现实,是从交易系统的日常操作中获得的巨大数据量,以及分析和提取所有这些知识的问题。保留在自身内部的信息。

有一系列计算技术可以将交易,运营和日常信息转换为具有不同聚合级别的信息,这些信息可以按主题进行汇总,精确和专门化,并且可以对其进行分析,从而有助于管理决策,该技术称为数据存储库或数据仓库。

但是,基于专业实践,数据仓库的建设不能幸免于阻碍其成功和实现其最终目标(支持管理决策)的问题。

本文试图超越理论,提出有问题的问题来阻止企业数据仓库的成功开发。

因此,应该明确指出,以下列表-企业数据仓库开发中最常见的错误-来自属于秘鲁金融和商业领域的代表公司中该技术的开发。

假设一个项目必须通过代表客户的投资回报来满足客户-我们知道在计算机技术项目中估算这种收益并不总是那么容易,但是-数据仓库开发项目的成功与通过分析客户获得的效用成正比。在这一点上,制定正确的决策以使公司受益的信息:基于通过数据仓库对数据进行的分析,做出的决策会产生更大的收入和/或储蓄,这是最重要的适当的估计,为此,我们必须考虑获取报告的难易程度及其配置的灵活性。考虑到-从每次决策中学习到-存储随时间推移使用的汇总和报表的形式和信息的重要性,以此证明它们对公司的价值。

正确使用此清单后,项目管理人员,所有者和客户可以更准确地制定决策,知道一种或另一种确定的策略或措施可能产生的后果,并防止出现频繁的错误,从而节省成本,无论是在项目的制定,开发还是实施中。

2.公司数据仓库建设中最常见的10个错误清单

第一个错误:假设解决的问题可能是纯技术性的问题

数据仓库需要管理决策者的积极参与。

第二个错误:没有为整个项目分配足够的预算。

在将其视为项目时,必须首先分配资金和资源以支持和操作公司数据仓库所需的技术平台和基础结构。

第三个错误:高级管理层缺乏承诺。

企业数据仓库的成功需要基于对项目管理及其开发团队提供的安全性和信任度的最高管理层的全面支持,以使工作能够在项目所涉及的所有组织领域中顺利进行。

第四个错误:没有足够的基础架构来支持它。

公司数据仓库需要足够的技术和组织基础架构。数据仓库的系统架构包括专有的数据库服务器,数据转换和清理服务器,遍布整个组织的前端管理用户节点。软件需要服务器,客户端和业务层应用程序,这些应用程序必须在n维查询环境和并行处理中有效地工作。

第五错误:冗余,非透明和未记录的数据库。

在初始时间估计中通常不考虑事务数据库的状态,从该数据库中提取将转换并存储在数据仓库中的信息,但是,这可能代表着严重的延迟,理想情况下是实体的状态,例如帐户,客户,债务,付款等。根据平均变化频率(每月,每两周,每天)以标准格式在历史表格中存储重要的时间段,

但是在实践中,此信息是作为用于管理报告的表的一部分而发现的,这些表已经过了过滤过程,因此在所有级别上,历史数据的一致性以及其状态随时间的变化都失去了一致性。这生意。

在某些情况下,建议在事务级别上对数据库进行独立的重新设计,在这种情况下,可以考虑以干净的方式存储实体状态的变化,这是考虑从原始数据提取数据的前一步。

第六个错误:未能建立DBA与数据仓库团队之间完全合作的环境。

在公司中启动数据仓库项目时,通常已经存在DBA数据库管理员区域,因此建议在与DBA相同的级别创建数据仓库区域-而不是在DBA的控制之下。许多DBA负责维护数据库以支持日常事务。创建一个足以开发数据仓库的替代平台,可以直接访问数据仓库域的信息源,而不是作为DBA的中介,这是促成项目更快开发的重要因素之一,并且追求成功。

第七个错误:无法使用适合管理的需求规格说明方法。

在管理用户进行的需求规范活动中,不使用允许用户轻松表达其需求并为后续反馈做好准备的方法是常见错误之一。

建议使用原型,并按管理领域准备需求的功能说明文件。

第八个错误:价值链的无知,业务活动中的信息流动。

识别关键的成功因素的活动,并观察中心竞争力的活动流程,以使所提供的产品或服务能够为客户提供价值,这是业务知识的一项任务,数据仓库的设计者不得通过绕过此步骤以选择项目开发策略-基于按流程或组织领域开发数据集市的通用模型-允许根据公司的战略计划确定优先级。

第9个错误:与其他相关技术没有集成观点。

扎实的信息技术理论基础以及广泛的现有趋势和解决方案将使开发具有远景的数据仓库成为可能。从这个角度来看,相关技术包括:OLAP,它可以分析历史信息以确定行为模式,另一方面,数据挖掘可以发现行为模式,但可以自动使用模型和算法(决策树,群集,网络神经网络,模糊逻辑,线性回归等),

公司平衡计分卡的实施还遥遥无期,其中数据仓库可提供来自历史时期的指标信息。

第十个错误:不良的项目管理和项目开发计划的终止。

项目经理的能力在技术和人员培训以及类似项目的经验结果中,都暴露于其所有实际方面。数据仓库的开发必须是周期性且分阶段的,并具有分析,设计,开发,测试的活动;重复的里程碑,试图避免重复的工作。

3.结论

本文是作者就信息技术发表的一系列文章的一部分,特别是在本文中,列出了在开发企业数据仓库的项目开发中发生的10个最常见的错误。 。

此类项目所基于的理论基础是从多维信息数据库(本体,概念数据模型,语义解释,集合和关系理论)的概念开始的,希望可以从中获得确切的信息。 ,准确和汇总,以分析和支持管理决策。

笔者参与了秘鲁重要的商业和金融公司的各种数据仓库项目,从而获得了实践基础,本文的经验在此得到了充实,并为读者提供了咨询和理论实践的工具。 ,以期在开发公司数据仓库方面取得成功。

4.参考书目

1.建立数据仓库作者WH Inmon编辑约翰

Wiley&Sons,Inc.美国纽约,1996年

2.数据仓库生命周期工具包:设计,开发和部署数据仓库的专家方法作者Ralph Kimball,Laura Reeves,Warren Thornthwaite,Margy Ross,Warren Thornwaite编辑John Wiley&Sons,Inc.美国纽约,纽约1998

3.数据中物化视图选择的遗传算法

仓库环境社论Springer Berlin / Heidelberg

1999年

4.数据仓库建模和质量问题作者:Panos Vassiliadis-知识和数据库系统实验室计算机科学系-电气和计算机工程系-雅典国立技术大学-Zographou 157 73,雅典,希腊phd.pdf

5.使用标准化维护数据仓库视图

作者:Mukesh Mohania,Kamal Karlapalem,D Millist Vincent In。

Ram,数据管理编辑,第32–50页。施普林格出版社,1997年。

6.数据仓库设计的方法:概念建模作者:何塞·玛丽亚·卡韦罗雷伊·胡安·卡洛斯大学,西班牙,埃斯佩兰萨·马科斯·雷伊·胡安·卡洛斯,西班牙,西班牙马里奥·皮亚蒂尼·卡斯蒂利亚-拉曼恰大学,西班牙阿道夫·桑切斯·克罗诺斯·伊贝里卡。出版商IR​​M Press Hershey,宾夕法尼亚州,美国2002

7.管理数据仓库系统中数据质量的策略

1 / IQ01HelfertMaur.pdf

设置公司数据仓库的10个错误