行存储(关系型数据库)与列存储(hbase,es聚合的doc_value)[通俗易懂]

行存储(关系型数据库)与列存储(hbase,es聚合的doc_value)[通俗易懂]1.为什么要按列存储列式存储(Columnarorcolumn-based)是相对于传统关系型数据库的行式存储(Row-basedstorage)来说的。简单来说两者的区别就是如何组织表:ØRow-basedstoragestoresatableinasequenceofrows.ØColumn-basedstoragestoresatablein…

大家好,又见面了,我是你们的朋友全栈君。

1.为什么要按列存储

列式存储(Columnar or column-based)是相对于传统关系型数据库的行式存储(Row-basedstorage)来说的。简单来说两者的区别就是如何组织表

Ø  Row-based storage stores atable in a sequence of rows.

Ø  Column-based storage storesa table in a sequence of columns.

行存储(关系型数据库)与列存储(hbase,es聚合的doc_value)[通俗易懂]

 行式存储下一张表的数据都是放在一起的,但列式存储下都被分开保存了

 

                             

行式存储

列式存储

优点

Ø  数据被保存在一起

Ø  INSERT/UPDATE容易

Ø  查询时只有涉及到的列会被读取

Ø  投影(projection)很高效

Ø  任何列都能作为索引

缺点

Ø  选择(Selection)时即使只涉及某几列,所有数据也都会被读取

Ø  选择完成时,被选择的列要重新组装

Ø  INSERT/UPDATE比较麻烦

ps:列式数据库方便projection
SQL Projection is the collective name for the columns that are Selected and returned from a query. In other words, the columns goes behind select in a query. In Oracle, a whole row is first fetched, then data values from the columns within that row are extracted into the known projection.

select某个字段就是projection。

注:关系型数据库理论回顾 – 选择(Selection)和投影(Projection)

行存储(关系型数据库)与列存储(hbase,es聚合的doc_value)[通俗易懂]

 

 

 数据压缩:通过字典表压缩数据

下面才是那张表本来的样子。经过字典表进行数据压缩后,表中的字符串才都变成数字了。正因为每个字符串字典表里只出现一次了,所以达到了压缩的目的(有点像规范化和非规范化Normalize和Denomalize)

 行存储(关系型数据库)与列存储(hbase,es聚合的doc_value)[通俗易懂]

 

 

 查询执行性能

通过一条查询的执行过程说明列式存储(以及数据压缩)的优点:

行存储(关系型数据库)与列存储(hbase,es聚合的doc_value)[通俗易懂]

关键步骤如下:

1.     去字典表里找到字符串对应数字(只进行一次字符串比较)。

2.     用数字去列表里匹配,匹配上的位置设为1

3.     把不同列的匹配结果进行位运算得到符合所有条件的记录下标。

4.     使用这个下标组装出最终的结果集

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/159119.html原文链接:https://javaforall.net

(0)
上一篇 2022年7月14日 上午11:36
下一篇 2022年7月14日 上午11:46


相关推荐

  • linggle 使用方法汇集[转]

    linggle 使用方法汇集[转]http linggle com 原文链接 http www jianshu com p f0705d09094f 如何形容一个单字 让我们先从比较简单的需求开始 在写英文信 英文文章 英文报告与论文时 一个单字前面不知道应该加什么形容词来形容 这时候只要输入 adj beach 那么就会出现一系列形容海滩的词汇用法 而同样的我们可以从每个词汇后面看到他在网路上的使用频率 找出

    2026年3月19日
    3
  • Unable to process Jar entry [module-info.class] from Jar的问题解决

    Unable to process Jar entry [module-info.class] from Jar的问题解决UnabletoprocessJarentry[module-info.class]fromJar的问题解决背景解决办法背景在使用Eclipse进行SpringBoot应用开发时,如果项目启动是RunAs->RunOnServer方式运行就会报类似于UnabletoprocessJarentry[module-info.class]fromJar的错误…

    2026年4月17日
    8
  • 深度学习检测小目标常用方法

    深度学习检测小目标常用方法

    2020年11月14日
    185
  • scala flatMap个人心得

    scala flatMap个人心得scalaflatMap个人心得前几天,用scala写了一个小程序。用到了flatMap函数,发现没有想象的那么简单,所以现在写下自己的体会,方便记忆。由于本人也是初学者,如果内容有误,欢迎大家指出错误内容:flatMap的常见用法flatMap和Map的区别flatMap与Future

    2022年5月10日
    41
  • javas数据库

    javas数据库首先在网上下载下面的这两个软件 下载好了以后就右键解压第一个 解压完成后会得到第一个一直点到下面图标一样然后打开一直点安装到下面点开安装找到继续选择试验版本一直点到安装什么都不用管这里不需要修改把 windows 换混合模式 以及设置密码 在添加用户到了这一步差不多这个软件成功了在继续安装一个 SSMS 安装以后就能够使用了 安装完成以后检查是否有这个软件 如果有就是成了 没有就是没有 就

    2026年3月18日
    2
  • js中find的用法_js中find函数

    js中find的用法_js中find函数首先简单的介绍一下ES6是什么,可能很多人还是第一次听说,我们都知道H5是html的新一代的标准,同样,ES6是javascript的新一代标准,全称是ECMAScript6.0,简称ES6,其实不是什么神秘的东西。15年6月发布的。今天我们要说的是结合ES6新特性谈一下js里面的一个很好用的方法-find()现在的前端和过去的不一样,过去的前端只要会画页面就行了,但是现在仅仅会画页面已…

    2022年10月14日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号