Redis_字典[通俗易懂]

Redis_字典

大家好,又见面了,我是全栈君。

阅读本文之前要了解的两件事情,第一,Redis是一种Key-Value数据库,第二,字典是一种保存键值对的抽象数据结构。所以不难猜出字典在Redis中应用一定很广泛,实际上,Redis数据库的底层实现就是字典,对数据库的增删查改也是构建在对字典的操作上。那么想要深入理解Redis,字典的解密是不可缺少的。接下来,就让我们一层一层解开指点的面纱,看看它的真面目。

首先看看Redis中有哪些地方使用到了字典

一, 数据库键空间

Redis是一个键值对数据库server,server中的每一个数据库都是一个RedisDB结构,当中RedisDb结构的dict字典保存了数据库中的全部键值对。我们将这个字典称为键空间(key space),键空间和用户直接所见的数据库是直接相应的

二。 Expires字典

Redis数据库结构是一个RedisDb结构,有一个属性expires也是字典,这个字典中保存了数据库中全部键的过期时间,我们称这个字典叫做过期字典

以下贴出RedisDb的数据结构。加深了理解。

三。 字典是Hash类型的底层实现之中的一个
这里之所以说是之中的一个。是应为Hash类型的实现能够是多种类型,在不同的场景下能够是不同的类型,但一个哈希键中包括的键值对照较多。有或者是键值对中元素都是比較长的字符串的时候。就会使用字典作为底层实现。否则就是压缩列表作为底层实现。
【注意】键空间中的键和过期字典中的键都指向都一个键对象,所以不会出现不论什么反复对象,也不会浪费内存空间。

然后我们来了解一下在Redis中字典是怎样实现的。

字典的定义在dict.h/dict中给出了,例如以下:

typedef struct dict {
    dictType *type;
    void *privdata;
    dictht ht[2];
    long rehashidx; /* rehashing not in progress if rehashidx == -1 */
    int iterators; /* number of iterators currently running */
} dict;

这是一个哈希表。table数组中的每一个元素都是指向一个dictEntry结构的指针,size是哈希表的大小。也就是table数组的大小。sizemask属性总是等于size-1 ,sizemask和哈希值一起决定将一个键应该被放到那个数组上,used表示眼下哈希表有多少个节点,used/size 是一个哈希表的负载因子,这个因子决定了什么时候后对哈希表进行扩展和收缩。

typedef struct dictht {
    dictEntry **table;
    unsigned long size;
    unsigned long sizemask;
    unsigned long used;
} dictht;

以下是一个哈希表节点,每一个dictEntry结构都保持着一个键值对,当中next指针能够将多个哈希值同样的键值对连接在一起,一次来解决键冲突的问题(这里能够引申出哈希函数以及哈希冲突解决方式。Redis中使用的解决方式是链地址法,就是。假设多个值通过哈希函数得到的哈希值是同样的,那么就链接到这个地址后,另一种解决哈希冲突的方案。就是寻地址法。就是当出现哈希冲突的时候,对键值对在进行一个哈希函数。得到一个没有被占用的地址为止,这两种方案各有利弊,链地址法可能会退化成一个链表。寻地址法可能在后期插入时,全是冲突)

typedef struct dictEntry {
    void *key;
    union {
        void *val;
        uint64_t u64;
        int64_t s64;
        double d;
    } v;
    struct dictEntry *next;
} dictEntry;

另一个须要说的地方,就是哈希表的rehash

随着操作的不断运行,一个哈希表中保存的键值对会越来越多或者是越来越少,哈希表中键值对数量过多或者过少都是不好的,过多,就会相当于是多个链表。过少也不好,查找的命中率也会非常低。将哈希表的负载因子(used/size)维持在一个范围之类是最好的。所以,当哈希表的数量过大或者过小的时候。程序会对哈希表进行扩展或者收缩,

扩展好理解,假设size=4 ,可是used=8,相当于每一个键的后面都有个链,这样查找起来是费劲的。这个时候能够通过Rehash来进行完毕,注意dict数据结构中的那个

dictht ht[2],这里是两个dictht,当中ht[1]是空暇的,在进行扩展的时候现将ht[1]扩展成ht[0]的两倍,然后将ht[0]中的键值对一个一个哈希到ht[1]中去。最后将ht[1]设置为ht[0]

这里须要注意的是rehash的时机。通常是负载因子大于5的时候扩展,负载因子小于0.1的时候收缩,另一个问题是字典中有个属性是rehashidx。这个属性标志rehash的状态,假设是0,表示rehash正式開始。然后没rehash一个键值对。就将这个值加一,当ht[0]的值所有被转移到ht[1]的时候。就将这个值设置成-1。表示rehash操作完毕。

事实上还有非常多要说的。比方渐进式rehash,渐进式就说说rehash过程不是一次性完毕的,而是分多次,渐进式完毕的,在rehash过程中,全部的删除,查找。更新都会在两个哈希表中进行。比如,假设查找一个元素,ht[0]中没有,那么就去ht[1]中查找,新加入的一律都是加入到ht[1]中,ht[0]中不再进行不论什么加入操作

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/115372.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Ubuntu 安装mysql和简单操作

    ubuntu上安装mysql非常简单只需要几条命令就可以完成。http://hovertree.com/menu/mysql/1. sudoapt-getinstallmysql-s

    2021年12月24日
    33
  • TensorFlow 安装教程

    趁着十一放假期间,有这么一点空闲时间,自己看了些tensorflow的资料,顺便在自己的机器上安装了一下tensorflow的环境。安装过程还算比较顺利,现在跟大家分享一下。1.准备好Anaconda环境tensorflow是属于很高层的应用。高层应用的一个比较大的麻烦就是需要依赖的底层的东西很多,如果底层依赖没有弄好的话,高层应用是没法玩转的。在极客学院有关tensorflow的教程中,提到了

    2022年4月9日
    35
  • V-rep学习笔记:切削

    V-rep学习笔记:切削

    2022年4月3日
    64
  • 编译原理实验1词法分析器的设计_编译原理实验一 词法分析

    编译原理实验1词法分析器的设计_编译原理实验一 词法分析实验目的 掌握词法分析器的功能。 掌握词法分析器的实现。 实验内容及要求 对于如下文法所定义的语言子集,试编写并上机调试一个词法分析程序:<程序>→PROGRAM<标识符>;<分程序>.<分程序>→<变量说明>BEGIN<语句表>END<变量说明>→VAR<变量表>:&l…

    2022年10月24日
    0
  • c语言之字符型数据类型关键字_字符型系统数据类型主要包括

    c语言之字符型数据类型关键字_字符型系统数据类型主要包括字符型数据类型就是字符1、字符数据的表示字符型数据是用单引号括起来的一个字符。例如:’a’、’b’、’=’、’+’、’?’都是合法字符型数据。在C语言中,字符型数据有以下特点:字符型数据只能用单引号括起来,不能用双引号或其它括号。字符型数据只能是单个字符,不能是字符串。字符可以是字符集中任意字符。但数字被定义为字符型之后就不能参与数值运算。如’5’和5是不同的。’5’是字符型数据,不能参与运算。…

    2025年7月11日
    0
  • [栈] 表达式求值 – C语言(多位数求值,2位数以上)

    [栈] 表达式求值 – C语言(多位数求值,2位数以上)【理论】https://blog.csdn.net/summer_dew/article/details/82048387【代码说明】支持:2位以上的数字,四则运算和幂运算使用的栈,是自己实现,封装在2SqStack.h文件中的,可自己实现,也可以参照:https://blog.csdn.net/summer_dew/article/details/82051767【结果】测试:…

    2022年6月22日
    29

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号