HashMap的数据结构(浅谈有与无)

HashMap数据结构浅谈开篇语:hashmap作为一种非常重要的数据结构,无论是在理论学习中,还是实际开发中都会经常遇到。这里总结一下对于hashmap一些基础的知识点。1、常见的数据结构一般开发中常见的数据结构有数组、链表、树、及HashMap。数组结构和链表结构的图形结构非常简单。本次主要讲解HashMap的结构,并结合着源码进行简要分析2、HashMapHashMap的结构图如…

大家好,又见面了,我是你们的朋友全栈君。

HashMap数据结构浅谈

开篇语:hashmap作为一种非常重要的数据结构,无论是在理论学习中,还是实际开发中都会经常遇到。这里总结一下对于hashmap一些基础的知识点。

1、常见的数据结构

一般开发中常见的数据结构有数组、链表、树、及HashMap。

数组结构和链表结构的图形结构非常简单。本次主要讲解HashMap的结构,并结合着源码进行简要分析

2、HashMap

HashMap的结构图如下:

HashMap的数据结构(浅谈有与无)

主要分为横向的数组和纵向的链表;数组保存的内存中的物理地址,对象的存放索引,纵向的链表保存的是对象的值。

首先看下hashmap的源码,理解下hash存储的过程:

public V put(K key, V value) {
    //hash方法是把一个对象散列成一个int值
	return putVal(hash(key), key, value, false, true);
}



//这里为了更好的阐述,我假定数组的长度为16,key经过散列后的值为9
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    //Node为定义的一个链表结构
	Node<K,V>[] tab; 
	Node<K,V> p; 
	int n, i;
    //下面这个if这样写会更容易理解
	/*
	if (table == null || table.length ==0)
		table = resize();
	tab = table;
	n = tab.length;
	*/
	if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
	//下面这个if表示的是看tab[9]是否为空,可以这样写
	/*
		i = 15 & hash; // 1111 & 1001
		p = tab[9];
		if (p == null) {
			直接把该值放在此地址位上
		}else {
			如果该地址位已经有值了,
			就以链表的方式存放该Entry
		}
	*/
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        Node<K,V> e; K k;
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}

可以简要概括了,存放hashmap主要分为两步:

  • 把key进行hash计算得到数组中的索引
  • 把entry值存放到该位置,如果该位置没有值,则直接存放,如果有值则以链表的形式存放

那么现在可以理解为什么采用这种结构,主要解决的是散列冲突问题。

何为散列冲突,即两个或者以上的key经过hash函数计算之后得到同一个值。

3、注重点

因此到这里,我们可以从原理上理解如果重写Object的equals
方法的时候,也同时需要复写hashcode()。
例如下面的测试,

@Data
@AllArgsConstructor
class Student {
    private String name;

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;

        Student student = (Student) o;
        return this.name == student.getName();
    }

}
public class Test {
    public static void main(String[] args) {
        Student student1 = new Student("zhangsan");
        Student student2 = new Student("zhangsan");
        System.out.println(student1.equals(student2));//true
        Map<Student,String> map = new HashMap<>();
        map.put(student1,"上海大学");

        System.out.println(map.get(student2));//null

    }
}

系统分析:
首先key值虽然重写了equals方法,使他们逻辑上相等。但是在map存放的时候需要hash(Student),而每个student的hashcode是不一样的。看如下源码。因此,我们犯了刻舟求剑同样的错误。

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

4、总结

本文只是对hashmap进行一个简要的分析,由于能力有限,水平一般,不正之处敬请指正。每篇博文都是作者学习之路的一篇结晶。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/127894.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • linux生成initramfs,Linux启动过程与initramfs

    linux生成initramfs,Linux启动过程与initramfsLinux启动过程概述这里先简单列一下Linux操作系统启动的全过程:按下电脑的电源键后,电脑通电,BIOS启动;BIOS读取硬盘的MBR,运行启动扇区中的代码,旧系统往往需要自己写启动扇区,而新系统基本上由专用的启动软件接管了,在Linux世界中,目前都是用的Grub2。由于启动扇区空间太小,放不下太复杂的代码逻辑,所以Grub2也使用了多阶段启动的策略;Grub2负责将操作系统…

    2022年8月11日
    5
  • fferrone_png转换svg

    fferrone_png转换svgffmpeg-vcodecrawvideo-frawvideo-pix_fmtbgr32-s1792x2176-i~/Downloads/dumpdata/dump_src_44_0_f2_1792x2176.raw-fimage2-vcodec pngscreenshot1.png颜色不对一般是RGB的值有问题 PIX_FMT_RGB24改成PIX_FM

    2022年9月25日
    2
  • Idea激活码最新教程2020.1.2版本,永久有效激活码,亲测可用,记得收藏

    Idea激活码最新教程2020.1.2版本,永久有效激活码,亲测可用,记得收藏Idea 激活码教程永久有效 2020 1 2 激活码教程 Windows 版永久激活 持续更新 Idea 激活码 2020 1 2 成功激活

    2025年5月23日
    6
  • 不是单组分组函数

    不是单组分组函数问题:一:SELECT tablespace_name, SUM(bytes) freeFROM dba_free_space不是单组分组函数原因: 1、如果程序中使用了分组函数,则有两种情况可以使用:程序中存在group by,并指定了分组条件,这样可以将分组条件一起查询出来改为:  SELECT tablespace_name, SUM(bytes) freeFROM dba_free_spa…

    2022年6月30日
    27
  • 批处理文件for循环_批处理循环语句

    批处理文件for循环_批处理循环语句命令格式:for{%variable|%%variable}in(集合)docommand[options]%variable|%%variable:代表可替换参数。使用%variable通过命令提示符执行for命令。使用%%variable在批处理文件中执行for命令;这个变量可以是26个英文字母任意一个,也可以是其他;这些变量会区分大小写,%%x和%%X代表

    2022年10月12日
    4
  • 瑞芯微rk3399pro_arm主板定制开发

    瑞芯微rk3399pro_arm主板定制开发深圳市宁远电子科技有限公司于2015年在中国广东省深圳市成立,公司自成立以来一直专注于工业嵌入式产品的软硬件研发和生产,以及相应的增值服务。公司拥有强大的研发技术实力,创始团队来自于华为,三星十年工作经验以上资深研发人员。  深圳市宁远电子科技有限公司专注于工来控制产品的研发,是ARM在中国最具实力的方案公司.  公司定位于中高端产品的研发,基于RK3288,RK3399等处理器,,开发了…

    2022年10月14日
    4

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号