hbase拾遗「建议收藏」

hbase拾遗「建议收藏」hbase拾遗

大家好,又见面了,我是你们的朋友全栈君。

1,hbase 全称:hadoop dataBase ,即hadoop数据库

2,使用场景:大数据量,准实时查询

3,特点:面向列,支持独立索引,每个列支持存储多版本,稀疏性:空列不占内存,可随意做列扩展,传统DB无数据的列会以null填充。因为hbase是基于hdfs 的所以具有扩展性、高可用性、动态增加DataNode、高性能:LSM数据结构(子节点不断合并成主节点),分区(region)存储数据。

4,Hbase内两个主要进程服务:

Master 和regionServer。master做管理,监控调度各regionServer。

一个regionServer管理多个region区,每个regionServer服务定时像master报告健康状态和存储内容。

regionServer可通过向master报告健康状态达到高可用性,即一个regionServer服务挂掉后,可由其他regionserver来管理挂掉服务下的region

5,zookeeper可接受到同master来自regionServer报告的信息

6,对比关系性数据库|:列动态增加,数据自动切分,高并发读写

缺点:不支持条件查询

 

7,删除表:要先禁用disable禁用表,在drop删除表。

8,列在列簇中有序,列数没有限制,一张表列簇不会超过5个,列只有插入数据后才存在。

 

图示说明hbase存储结构:

Hbase智能分区 RowKey TimeStamp Column Family1(列簇) Column Family2(列簇) Column Family3(列簇)
Region-1 11111 t6 C1:name 小三        
t5 c1:age 25        
t4 c1:tel 1.23457E+11        
Region-2 21111 t3 c1:name 小四        
t2 c1:age 30 c2:collage 北京大学 c3:job1 CEO
t1 c1:tel 5647876213        
                 
      对应说明,联想简历样式
     
      个人信息列簇 教育经历列簇 工作经历列簇
      姓名 年龄。。等 大学 研究生等 工作1 工作2
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/105976.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 深度强化学习-DDPG算法原理与代码

    深度强化学习-DDPG算法原理与代码引言 DeepDetermin DDPG 算法是 DeepMind 团队提出的一种专门用于解决连续控制问题的离线式 off line 深度强化学习算法 它其实本质上借鉴了 DeepQ Network DQN 算法里面的一些思想 本文就带领大家了解一下这个算法 论文和代码的链接见下方 论文 https arxiv org pdf 1509 02971 pdf 代码 https github com indigoLovee DDPG 喜欢的话请点个 s

    2026年2月6日
    0
  • php生成唯一uid的解决思路「建议收藏」

    php生成唯一uid的解决思路

    2022年2月19日
    47
  • open函数打开文件方式

    open函数打开文件方式r:以只读方式打开文件。文件的指针将会放在文件的开头。这是**默认模式**。rb:以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。r+:打开一个文件用于读写。文件指针将会放在文件的开头。rb+:以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。w:打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。wb:以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。.

    2022年5月9日
    94
  • Numpy中Meshgrid函数介绍及2种应用场景

    Numpy中Meshgrid函数介绍及2种应用场景近期在好几个地方都看到meshgrid的使用,虽然之前也注意到meshgrid的用法。但总觉得印象不深刻,不是太了解meshgrid的应用场景。所以,本文将进一步介绍Numpy中meshgrid的用法

    2022年7月1日
    19
  • PS命令大全

    PS命令大全简介 Linux 中的 ps 命令是 ProcessStatu 的缩写 ps 命令用来列出系统中当前运行的那些进程 ps 命令列出的是当前那些进程的快照 就是执行 ps 命令的那个时刻的那些进程 如果想要动态的显示进程信息 就可以使用 top 命令 要对进程进行监测和控制 首先必须要了解当前进程的情况 也就是需要查看当前进程 而 ps 命令就是最基本同时也是非常强大的进程查看命令 使用该命令可以确定有哪些进程正在运

    2025年7月26日
    4
  • Linux 下 Mariadb 配置用法

    Linux 下 Mariadb 配置用法

    2021年7月6日
    83

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号