设计一个数据仓库是业务发展的一个重要部分。对于设计,有两种最常见的架构,即Kimball和Inmon,但问题是哪一种更好,哪一种在低冗余度下为用户服务。让我们在一些因素上对两者进行比较。
1. Kimball: Kimball设计Dataware房屋的方法是由Ralph Kimball提出的。这种方法从认识业务流程和Dataware house需要回答的问题开始。这些信息集正在被分析,然后被很好地记录下来。提取转换加载(ETL)软件从多个数据源带来所有的数据,称为数据集市,然后被加载到一个叫做staging的公共区域。然后,这被转化为一个OLAP立方体。
应用
- 设置和建立都很迅速。
- 针对多个星型模式生成报告是非常成功的。
- 数据库操作非常有效。
- 在数据库中占有较少的空间,管理也很容易。
Kimball Dataware房子的结构如下所示(这应该被改变。这不是一个Kimball模型。Kimball模型没有集成层。数据直接从源系统移动到数据集市。在Kimball中没有ODS)-
2、Inmon: Inmon设计Dataware房屋的方法是由Bill Inmon提出的。这种方法以企业数据模型为起点。这个模型确认了关键领域,也照顾到了客户、产品和供应商。这个模型用于创建一个详细的逻辑模型,用于主要业务。然后,细节和模型被用来开发一个物理模型。这个模型是规范化的,使数据的冗余度降低。这是一个复杂的模型,很难用于商业目的,为此创建了数据集市,每个部门都能为他们的目的使用它。
应用
- 数据仓库对变化非常灵活。
- 业务流程可以非常容易理解。
- 报告可以跨企业处理。
- ETL过程非常不容易出错。
Inmon数据仓库的架构如下所示-
Kimball和Inmon的区别如下。
参数 | Kimball | Inmon |
---|---|---|
引入 | 由拉尔夫-金博尔介绍。 | 由Bill Inmon引入。 |
Approach | Kimball有一个自下而上的实施方法。 | Inmon有自上而下的实施方法。 |
数据集成 | Kimball侧重于个别业务领域。 | Inmon侧重于企业范围内的领域。 |
构建时间 | Kimball是高效的,需要较少的时间。 | Inmon复杂,耗费大量时间。 |
成本 | Kimball有迭代的步骤,具有成本效益。 | Inmon初始成本巨大,开发成本低。 |
所需技能 | Kimball不需要这些技能,但一个普通的团队就能完成工作。 | Inmon需要专门的技能来实现工作。 |
维护 | Kimball的维护是困难的。 | Inmon的维护很容易。 |
数据模型 | Kimball倾向于将数据放在非正常化的模型中。 | Inmon更倾向于数据处于规范化的模型中。 |
数据存储系统 | Kimball源系统是高度稳定的。 | Inmon源系统的变化率很高。 |