哈希表、哈希冲突

哈希表、哈希冲突哈希表1.哈希表是一种以键值key存储数据value的结构,以key作为标识值存储value值;只要输入待查找的key,即可获取其对应的value值。当按照键值查询元素时,使用相同的hash函数将key转换为数组下标,从数组中按照下标对应的位置获取数据。它实际上是数组的一种扩展,数组+链表+红黑树。2.哈希表的设计哈希函数的设计首先不能过于复杂,复杂的哈希函数会间接的影响hash表的性能;其次要求哈希值应该尽可能随机且均匀分布,避免或者减少哈希冲突的数量,使每个桶中存储的数据比较平均。常规的设计方法

大家好,又见面了,我是你们的朋友全栈君。

哈希表
1.哈希表是一种以键值key存储数据value的结构,以key作为标识值存储value值;只要输入待查找的key,即可获取其对应的value值。当按照键值查询元素时,使用相同的hash函数将key转换为数组下标,从数组中按照下标对应的位置获取数据。它实际上是数组的一种扩展,数组+链表+红黑树。
2.哈希表的设计
哈希函数的设计首先不能过于复杂,复杂的哈希函数会间接的影响hash表的性能;其次要求哈希值应该尽可能随机且均匀分布,避免或者减少哈希冲突的数量,使每个桶中存储的数据比较平均。

常规的设计方法有数据分析法,选择数据的业务特征提取部分数据进行计算,然后得到结果再与哈希表数组的长度求余后最为哈希值。另外还有直接寻址法、平方取中法、折叠法和随机数法等。

负载因子(加载因子):减少链表长度
低效扩容:乘以2进行扩容
加载因子越大,哈希表中存储的元素越多,空闲的位置就越少,哈希冲突的概率就越大,插入、删除和查找数据时的性能就随之降低。
应该避免低效扩容,因为极个别情况插入速度非常慢,会导致用户崩溃。
哈希函数
1.哈希函数计算达到的哈希值应该是一个非负整数
2.如果key1==key2,那么hash(key1)==hash(key2)
3.即使两个key的hash值相等,但是有可能key值不相等
4.应用场景:安全加密、唯一标识、数据校验、负载均衡、数据分片和分布式存储等
哈希冲突
由于映射的范围限制,key取值的可能性大于映射范围,出现两个不同的key映射到同一个位置

解决哈希冲突的常见方法有开放地址法和链表法。
开放地址法:一旦出现hash值冲突则通过重新探测新位置的方法来解决冲突。对于线性探测法当哈希表中存储的元素越多时,哈希冲突的概率越高,极端情况下需要探测整个哈希表,时间复杂度为O(n)。
链表法:链地址法,在具体的应用中使用较多,在哈希表中每个桶对应一个链表,把哈希值相同的元素存放在相同桶位置的对应链表中,由于需要对比key值所以插入时间复杂度为O(k),查找和删除时的时间复杂度与链表的长度成正比O(k),一般当k值不是很大时可以粗略的认为O(1)。需要尽量减少链表长度,可以引入一个参数:负载因子或者称为加载因子。负载因子用于间接的限定链表的长度,如果值越大则允许的链表长度越大,哈希表的性能越差,但是加载因子越小空间浪费越严重。

HashMap采用的是链表法解决hash冲突,ThreadLocalMap通过基于线性检测的开放寻址法解决冲突。

开放寻址法数据存储在数组中,可以有效地利用CPU缓存加快查询速度,不会涉及链表和指针的问题。当加载因子较大时会导致大量的探测行为操作,性能会急剧下降,同时删除数据也很麻烦,而且比链表法需要占用更多的存储空间。数据量比较小、负载因子小的时候适合开放地址法。
链表法数据存储在链表中,对内存的利用率比开发地址法高一些,可以容忍比较大的装载因子,由于节点中需要存储next指针,会消耗额外的内存空间【有效载荷问题】。实际上如果考虑链表长度变长的问题,可以考虑引入红黑树,以避免恶意的将数据存储在一个桶中的哈希碰撞攻击问题。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/151682.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 毕设系列之 — 教程:单片机控制步进电机

    毕设系列之 — 教程:单片机控制步进电机文章目录1简介2步进电机介绍3A4988驱动介绍4电机启动代码5最后1简介Hi,大家好,这里是丹成学长,今天向大家介绍如何使用单片机控制步进电机大家可用于课程设计或毕业设计技术解答毕设帮助:<Q>7468760412步进电机介绍步进电机是一种将电脉冲转化为角位移的执行机构。通俗一点讲:当步进驱动器接收到一个脉冲信号,它就驱动步进电机按设定的方向转动一个固定的角度(即步进角),多用于雕刻机、3D打印机等需要精确控制的设备。本篇使用ULN2003驱动五线四相减速

    2022年5月31日
    29
  • Depix初体验

    Depix初体验前情提要这几天有一个同学给我发了一张马赛克图,问我能不能还原?图片如上。我一看,这被马成什么鬼样子了,谁能还原得了?不过我忽然想到,我在公众号上看到一个名字叫做”Depix”的Github项目。然而近期在Github上,又出现了一款号称能抹去马赛克让原图重现的神器,引发海内外热议。这款工具名为Depix,上线没几天就在GitHub上标星已超过一万多,截止目前累计分支也超过了1.3k个。让它火出圈子的,就是下面这张效果图:如图所示,第一行是打了一层巨厚马赛克完全像素化后的文本内容,看不出

    2022年6月30日
    84
  • latex中的括号怎么打_小括号和中括号的简便算法

    latex中的括号怎么打_小括号和中括号的简便算法https://blog.csdn.net/han____shuai/article/details/49679335功能语法显示不好看    (\frac{1}{2})好一点\left(\frac{1}{2}\right)您可以使用\left和\right来显示不同的括号:功能语法显示圆括号,小括号\left( \frac{a}{b}\right)方括号,中括号\left[ \frac…

    2022年10月11日
    5
  • iPhone4s完美越狱_苹果4越狱工具

    iPhone4s完美越狱_苹果4越狱工具通常我们所说iPhone激活成功教程实际上包含了很多内容在里面,激活成功教程的目的有很多,例如使用第三方软件,可以打电话,可以使用YouTube等等,其最终目的是可以实现所有的功能。在整个过程中的任何一步都可以叫做是激活成功教程,所以如果有网友单纯问如何激活成功教程这类问题实际上是很难回答的,因为不知道网友关心的是针对哪一部分的激活成功教程。因此本教程中凡是用到激活成功教程这个词的地方,都泛指各种激活成功教程方法,而对于特定的激活成功教程目的则用专门的词来描述…

    2022年9月20日
    3
  • c语言数组中插入新数据

    c语言数组中插入新数据数组插入数据 在数组的应用中,我们有时会向数组中插入一个数据,而且不打破原来的排序规律,其实数组中的插入数据,就是数据的比较和移动;如果想要弄懂这些方法最好拿笔比划以下,或者debug一下,了解其中的思想,光看理解的不深;方法一:输入一个数据x,将数组中的数据与x逐一比较,如果大于x,记录下数据的下标,然后此数据下标和其后的数据的下标都加一,相当于都向后挪一位,然后将x赋值给数组的那…

    2022年7月11日
    17
  • 手把手教你linux系统安装和完美配置

    手把手教你linux系统安装和完美配置Linux系统虚拟机安装

    2022年6月2日
    30

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号