首页 理论教育 数据集市与数据仓库的关系

数据集市与数据仓库的关系

时间:2023-06-02 理论教育 版权反馈
【摘要】:数据集市是一组特定的、针对某个主题域、某个部门或者某些特殊用户而进行分类的数据集合,也可以说是小型的数据仓库。在数据仓库项目中,数据集市通常按照地区、日期等维度对数据进行组织和汇总,因此数据仓库转化成数据集市也是按照轻量级汇总或者中度汇总和计算所完成的。数据集市和数据仓库的关系如图3-27所示。

数据集市与数据仓库的关系

数据集市是一组特定的、针对某个主题域、某个部门或者某些特殊用户而进行分类的数据集合,也可以说是小型的数据仓库。用户可以在数据集市中快速地对数据进行访问和对报表进行展示,同时在数据结构的内部对数据进行必要的汇总和优化。数据集市的存储通常按照划分主题的形式进行存放,其模型一般是星型结构或者雪花型结构。而数据仓库除了按照主题的形式进行存放外,其模型一般按照第三范式的形式进行设计。数据仓库到数据集市的过程是从数据规范化到多维建模的过程,包括数据仓库内的实体表转化成事实表、维表,以及将实体之间的关系转化成多维关系的映射。在数据仓库项目中,数据集市通常按照地区、日期等维度对数据进行组织和汇总,因此数据仓库转化成数据集市也是按照轻量级汇总或者中度汇总和计算所完成的。简而言之,数据集市里的数据一般都是从数据仓库中经过转换、汇总计算获取的,直接支撑前端的应用需求,如图3-26所示。数据集市的数据通常会作为OLAP服务和应用服务的数据输入。数据集市的数据一般不会从源数据系统中直接抽取,即一般不提倡建设独立型的数据集市。这是因为,如果数据集市从源数据系统中直接抽取数据,则可能导致数据的不一致性,同时也会增加多个额外的进程,这些进程在源系统中将大大消耗系统的CPU资源,从而造成资源上的浪费。数据集市和数据仓库的关系如图3-27所示。

978-7-111-37241-7-Part01-52.jpg

图3-26 数据集市的数据来源(www.xing528.com)

978-7-111-37241-7-Part01-53.jpg

图3-27 数据仓库和数据集市的关系

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈