首页 理论教育 数据仓库实施的关键要素与技巧

数据仓库实施的关键要素与技巧

时间:2023-05-23 理论教育 版权反馈
【摘要】:建立开发数据仓库工程的目标及制订工程计划。④数据仓库的物理库设计。⑦数据仓库的管理。数据仓库的设计实施也宜逐个击破,每个阶段都能满足一部分用户的需求,最后获得全面的成功。由于数据仓库是独立于业务系统的,数据仓库的实施将以管理层需要的分析决策为主线,在设计中可以为不确定数据预留空间。因此,以解决报表问题作为建立数据仓库的目的一般都会以用户的失望告终。

数据仓库实施的关键要素与技巧

数据仓库是一个解决方案,而不是一个可以买到的产品。不同企业会有不同的数据仓库,企业人员往往不懂如何利用数据仓库,不能发挥其决策支持的作用,而数据仓库公司人员又不懂业务,不知道建立哪些决策主题,从数据源中抽取哪些数据,因此需要双方互相沟通,共同协商开发数据仓库。

1)数据仓库的开发流程

①启动工程。建立开发数据仓库工程的目标及制订工程计划。计划包括数据范围、提供者、技术设备、资源、技能、组员培训、责任、方式方法、工程跟踪及详细工程调度。

②建立技术环境。选择实现数据仓库的软硬件资源,包括开发平台、DBMS、网络通信、开发工具、终端访问工具及建立服务水平目标(可用性、装载、维护及查询性能)等。

③确定主题进行仓库结构设计。由于数据仓库是面向决策支持的,它具有数据量大但更新不频繁等特点,因此必须对数据仓库进行精心设计,才能满足数据量快速增加而查询性能并不下降的要求。

④数据仓库的物理库设计。基于用户的需求,着眼于某个主题,开发数据仓库中数据的物理存储结构。

⑤数据抽取、精练、分布。根据数据仓库的设计,实现从源数据抽取数据、清理数据、综合数据和装载数据。

⑥对数据仓库的OLAP 访问。建立数据仓库的目的是要为决策支持服务,因此需要各种能对数据仓库进行访问分析的工具集,包括优化查询工具、统计分析工具、C/S 工具及数据挖掘工具,通过分析工具实现决策支持需要。

⑦数据仓库的管理。数据仓库必须像其他系统一样进行管理,使数据仓库正常运行。(www.xing528.com)

2)实施数据仓库应注意的问题

①与传统业务系统不同,数据仓库是面向管理决策层应用的,必须有系统自身的最终用户——企业决策层的参与。数据仓库应用本身并不是业务流程的再现,而是基于数据分析的管理模式的体现。在这个层次上,数据仓库对于企业决策层的意义首先不是信息技术和产品上的,而是企业经营管理模式上的。数据仓库的实施者需要在商业智能化如何能够帮助企业获得市场竞争力上下工夫,提供切实有效的系统实施目标和规划,使得企业决策层充分认识到数据仓库是他们自己所需要的系统,在投入和配合上给予充分的支持。

②由于数据仓库的访问和查询往往能够通过工具来提供,因此数据仓库的功能取决于系统的规划和设计。在了解数据仓库应用需求的时候,主要对象应该是企业的决策部门和管理部门,而不是信息系统部门。了解应用的需求必须从企业如何利用信息进行管理的角度出发,需要有丰富的行业经验。在这个阶段,对于国内数据仓库应用来说,可以将复杂的数据分析需求分解成若干专题,这些专题在行业内往往具有一定的普遍性,有现成的设计模式可以借鉴。数据仓库的设计实施也宜逐个击破,每个阶段都能满足一部分用户的需求,最后获得全面的成功。

③在对待原始数据的问题上,需要坚持一个原则,就是不拘泥于业务系统的现状。由于数据仓库是独立于业务系统的,数据仓库的实施将以管理层需要的分析决策为主线,在设计中可以为不确定数据预留空间。对于数据的完整性和质量问题可通过如下方式处理:利用多种方式加载数据,可以设计专门的输入接口收集数据,如获取客户的个人资料;放宽数据的时效性,在分析中标明个别数据的有效时间;在系统中标识出低质量的数据,规范业务系统。

④数据的抽取、转换和装载是一项技术含量不高但却非常烦琐的工作,在系统实施过程中建议由专门小组或人员负责数据抽取的工作,将其纳入统一的管理和设计,不仅考虑原始数据源的类型,还必须考虑抽取的时间和方式。一个数据仓库系统往往同时存在多种数据抽取方式以适应原始数据的多样性,因此讨论单一抽取工具的选型是没有意义的,原则只能有一个:简便、快捷、易维护。

⑤用户对数据仓库的认识常常从报表起步,但数据仓库并不是为业务报表而设计的。需要指出的是,数据仓库的分析工具在固定格式的报表再现上有时不如专门定制的程序。因此,以解决报表问题作为建立数据仓库的目的一般都会以用户的失望告终。数据仓库的强项在于提供联机的业务分析手段,正是数据仓库的使用,才使管理人员逐步摆脱对固定报表的依赖,取而代之地以丰富、动态的联机查询和分析来了解企业和市场的动态。

⑥系统的实施需要明确的计划和时间表,新的技术和产品可以分阶段加入,但要避免无休止的测试和选型。因为数据仓库的价值在于使用,如果让一些没有必要的信息去指导决策,那么数据仓库将永远停留在投资阶段。在定义实施计划时,需要明确系统的使用范围、用户的应用模式等与选择具体产品相关的重要问题。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈