什么是数仓
数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受
数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。
这是一个偏向学术的定义,却非常准确的界定了数据仓库与其他数据库系统的本质区别,我们也可以认为数据仓库是一种分析数据库,用于存储和处理数据,以便对数据进行分析。
数据仓库的两个主要功能:存储分析数据和处理分析数据。

库数据仓库是一种体系结构,而不是某一种技术,就像我们常说的Hive 也只是数仓的一种工具而已,可以是它,也可以是其他技术,技术一直在变化,而一种设计思想或者是架构设计是很长一段时间都不会变化的,例如数仓的分层设计,变化的只是层的划分界限或者是层的名称什么的,但是分层的思想是一直没有变化的。
数据仓库最为核心的内容主要有两部分,第一部分建模,第二部分查询,建模是我们组织管理数据的方式,查询是数仓对外提供服务的能力,
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/224758.html原文链接:https://javaforall.net
