数仓建模—数仓初识(01)

数仓建模—数仓初识(01)数据仓库 DataWarehous 一般缩写成 DW DWH 数据仓库是一个面向主题的 SubjectOrien 集成的 Integrate 相对稳定的 Non Volatile 反映历史变化 TimeVariant 的数据集合 用于支持管理决策的数据系统

什么是数仓

数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受

数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。

这是一个偏向学术的定义,却非常准确的界定了数据仓库与其他数据库系统的本质区别,我们也可以认为数据仓库是一种分析数据库,用于存储和处理数据,以便对数据进行分析。

数据仓库的两个主要功能:存储分析数据和处理分析数据

image-20201205182509649

库数据仓库是一种体系结构,而不是某一种技术,就像我们常说的Hive 也只是数仓的一种工具而已,可以是它,也可以是其他技术,技术一直在变化,而一种设计思想或者是架构设计是很长一段时间都不会变化的,例如数仓的分层设计,变化的只是层的划分界限或者是层的名称什么的,但是分层的思想是一直没有变化的。

数据仓库最为核心的内容主要有两部分,第一部分建模,第二部分查询,建模是我们组织管理数据的方式查询是数仓对外提供服务的能力,

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/224758.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月17日 上午11:12
下一篇 2026年3月17日 上午11:13


相关推荐

  • bzoj 3225: [Sdoi2008] 立方体覆盖 题解「建议收藏」

    bzoj 3225: [Sdoi2008] 立方体覆盖 题解

    2022年2月1日
    45
  • midjourney 该怎么用?

    midjourney 该怎么用?

    2026年3月12日
    1
  • web百度离线地图制作

    web百度离线地图制作先写标题有时间再写

    2026年3月18日
    2
  • netron安装使用

    netron安装使用1 netrongithub 链接 2 netron 网页版 3 python2 7 pip 安装使用 netronpipins ihttps pypi tuna tsinghua edu cn simple 仅针对 python2 7 安装完毕后 需要 pipshownetro 找到 netron 安装位置 修改 netron server py 文件 将 importurllib parse 修改为 importurlpar 否则会报错 ImportError Nomo

    2026年3月26日
    2
  • 怎么生成pkl文件_python unzip

    怎么生成pkl文件_python unzip我在训练UCF101数据集的时候,遇到一个大高玩使用pkl文件,一开始使用它们的数据炮的好好的。后来开始跑自己的数据时,就出问题了。不知道这个pkl到底是个什么东西。原始的那个大高玩的ucf101的标签数据读取出来是这个样的:[‘PommelHorse’,’Surfing’,’HammerThrow’,’PlayingViolin’,’WallPushups’,’PullUps’,’PizzaTossing’,’SalsaSpin’,’Shotput’,’CricketShot’,

    2025年9月3日
    7
  • leetcode-146. LRU 缓存机制(hash+双向链表)

    leetcode-146. LRU 缓存机制(hash+双向链表)运用你所掌握的数据结构,设计和实现一个 LRU (最近最少使用) 缓存机制 。实现 LRUCache 类:LRUCache(int capacity) 以正整数作为容量 capacity 初始化 LRU 缓存int get(int key) 如果关键字 key 存在于缓存中,则返回关键字的值,否则返回 -1 。void put(int key, int value) 如果关键字已经存在,则变更其数据值;如果关键字不存在,则插入该组「关键字-值」。当缓存容量达到上限时,它应该在写入新数据之前删除最久

    2022年8月9日
    8

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号