手撕HashMap

前言：

平时工作的时候，用的最多的就是ArrayList和HashMap了，今天看了遍HashMap的源码，决定自己手写一遍HashMap。

一、创建MyHashMap接口

我们首先创建一个MyHashMap的入口，暴露一个外部调用的接口，里面简单的定义一下put和get。

public interface MyHashMap<K,V> {

    public V put(K k,V v);

    public V get(K k);

    interface Entry<K,V>{

        public K getKey();

        public V getValue();

    }

}

二、建一个实现类MyHashMapImpl

接口定义完成之后，那就要开始实现了，我们首先创建一个类MyHashMapImpl来实现MyHashMap。然后我们定义一些变量。以及构造函数，比如我们定义的数组初始长度为16，加载因子为0.75。这两个参数会涉及到自动扩容，我们后面再说。

public class MyHashMapImpl<K, V> implements MyHashMap<K, V> {

//数组的初始长度
private static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;

//阀值比例(加载因子)
private static final float DEFAULT_LOAD_FACTOR = 0.75f;

private int defaultInitSize;

private final float defaultLoadFactor;

//Map当中entry的数量
private int entryUseSize;

//数组
private Entry<K, V>[] table;

//构造函数
public MyHashMapImpl() {
    this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
}

public MyHashMapImpl(int defaultInitialCapacity, float defaultLoadFactor) {

    if (defaultInitialCapacity < 0)
        //容量不合规
        throw new IllegalArgumentException("Illegal initial capacity" + defaultInitialCapacity);
    if (defaultLoadFactor <= 0 || Float.isNaN(defaultLoadFactor))
        //不合规的加载因子
        throw new IllegalArgumentException("Illegal load factor" + defaultLoadFactor);
    this.defaultInitSize = defaultInitialCapacity;
    this.defaultLoadFactor = defaultLoadFactor;
    table = new Entry[this.defaultInitSize];
}

}

三、重写put方法

我们首先重写下put方法，可以看到，当Map中存储的数据大于加载因子*初始化数据长度的时候，会第一时间触发扩容机制，扩容的过程也就是重新设置一个更大的数组，并把原本的数组地址指过去，并且把原本的值重新put进去。这个过程如果频繁发生还是很消耗机器性能的，所以我们在写代码的时候最好是预估好初始大小，尽量不触发扩容机制。

 @Override

    public V put(K k, V v) {

        V oldValue;

        //是否需要扩容

        //扩容完毕，肯定需要重新散列

        if (entryUseSize >= defaultInitSize * defaultLoadFactor) {

            resize(2 * defaultInitSize);

        }

        int index = hash(k) & (defaultInitSize - 1);

        if (table[index] == null) {

            table[index] = new Entry<K, V>(k, v, null);

            ++entryUseSize;

        } else {

            Entry<K, V> entry = table[index];

            Entry<K, V> e = entry;

            while (e != null) {

                if (k == e.getKey() || k.equals(e.getKey())) {

                    oldValue = e.value;

                    e.value = v;

                    return oldValue;

                }

                e = e.next;

            }

            table[index] = new Entry<K, V>(k, v, entry);

            ++entryUseSize;

        }

        return null;

    }

 private void resize(int i) {

        Entry[] newTable = new Entry[i];

        defaultInitSize = i;

        entryUseSize = 0;

        rehash(newTable);

    }

private void rehash(Entry<K, V>[] newTable) {

        //得到原来老得entry集合，注意遍历单链表

        List<Entry<K, V>> entryList = new ArrayList<Entry<K, V>>();

        for (Entry<K, V> entry : table) {

            if (entry != null) {

                do {

                    entryList.add(entry);

                    entry = entry.next;

                } while (entry != null);

            }

        }

        //覆盖旧的引用

        if (newTable.length > 0) {

            table = newTable;

        }

        //重新hash也就是重新put entry到hashmap

        for (Entry<K, V> entry : entryList) {

            put(entry.getKey(), entry.getValue());

        }

    }

  class Entry<K, V> implements MyHashMap.Entry<K, V> {

        private K key;

        private V value;

        private Entry<K, V> next;

        public Entry() {

        }

        public Entry(K key, V value, Entry<K, V> next) {

            this.key = key;

            this.value = value;

            this.next = next;

        }

        @Override

        public K getKey() {

            return key;

        }

        @Override

        public V getValue() {

            return value;

        }

    }

四、重写get方法

如果要拿到数组中的值，我们首先要获取对应的位置。其中有一个基本概念要说一下，每一个数据通过hash函数都会得到一个值，并且这个值是固定的，所以我们可以通过k.hashCode()

来获取对应的hash值，然后按照散列算法均匀分散hash值，然后通过hashcode获取对应的值，得到基本数组的下标。这时候就能拿到我们存在map中的值了，但是hash值并不是一定是唯一的，也就是说可以能a.hash和b.hash值是一样的，但是a不等于b，所以如果两个数据hash值相同，会触发hash冲突。严重降低hashmap的性能，本次hash方法的作用也就是尽量减少hash冲突。使数据排列的更加均匀一些。当我们遇到hash冲突的时候可以再次hash解决冲突。

  @Override

    public V get(K k) {

        int index = hash(k) & (defaultInitSize - 1);

        if (table[index] == null) {

            return null;

        } else {

            Entry<K, V> entry = table[index];

            do {

                if (k == entry.getKey() || k.equals(entry.getKey())) {

                    return entry.value;

                }

                entry = entry.next;

            } while (entry != null);

        }

        return null;

    }

手撕HashMap的更多相关文章

手写HashMap，快手面试官直呼内行！
手写HashMap?这么狠,面试都卷到这种程度了? 第一次见到这个面试题,是在某个不方便透露姓名的Offer收割机大佬的文章: 这--我当时就麻了,我们都知道HashMap的数据结构是数组+链表+红黑 ...
Netty实现高性能IOT服务器(Groza)之手撕MQTT协议篇上
前言诞生及优势 MQTT由Andy Stanford-Clark(IBM)和Arlen Nipper(Eurotech,现为Cirrus Link)于1999年开发,用于监测穿越沙漠的石油管道.目标 ...
手撕RPC框架
手撕RPC 使用Netty+Zookeeper+Spring实现简易的RPC框架.阅读本文需要有一些Netty使用基础. 服务信息在网络传输,需要讲服务类进行序列化,服务端使用Spring作为容器.服 ...
手写HASHMAP
手写HASHMAP const int MAXN=10010; const int HASH=10100; //需要hash的数的总个数最大值 struct HASHMAP { ...
NN入门，手把手教你用Numpy手撕NN(一)
前言这是一篇包含极少数学推导的NN入门文章大概从今年4月份起就想着学一学NN,但是无奈平时时间不多,而且空闲时间都拿去做比赛或是看动漫去了,所以一拖再拖,直到这8月份才正式开始NN的学习. 这篇文 ...
NN入门，手把手教你用Numpy手撕NN(2)
这是一篇包含较少数学推导的NN入门文章上篇文章中简单介绍了如何手撕一个NN,但其中仍有可以改进的地方,将在这篇文章中进行完善. 误差反向传播之前的NN计算梯度是利用数值微分法,虽容易实现,但是计算 ...
手撕公司SSO登陆原理
Single Sign-on SSO是老生常谈的话题了,但部分同学对SSO可能掌握的也是云里雾里,一知半解.本次手撕公司的SSO登陆原理,试图以一种简单,流畅的形式为你提供有用的SSO登陆原理. 按 ...
NN入门，手把手教你用Numpy手撕NN(三)
NN入门,手把手教你用Numpy手撕NN(3) 这是一篇包含极少数学的CNN入门文章上篇文章中简单介绍了NN的反向传播,并利用反向传播实现了一个简单的NN,在这篇文章中将介绍一下CNN. CNN C ...
手撕代码：统计1到n二进制数中1出现的总次数
题目描述: 互娱手撕代码题. 统计从1到n这n个数的二进制表示中1出现的次数. 思路分析: 思路一:直接的做法是从1遍历到n,对于每个数和1做与操作,之后,对于这个数不断做右移操作,不断和1做与操作, ...

随机推荐

IC晶圆缺货涨价浪潮持续上涨无线路由芯片WiFi模块受波及严重
正是多事之秋,继受美国贸易战影响后.由于晶圆供不应求,市场各大行业IC纷纷出现了断货,缺货,涨价的现象.这给了本来低迷的经济市场又一重创.WiFi路由芯片的无线路由模块必不可免的受到了波及. 晶圆代工 ...
Pycharm同步远程服务器调试
Pycharm同步远程服务器调试 1.需要准备工具 xftp:上传项目文件 xshell:连接Linux系统调试,执行命令 PyCharm:调试python代码这些软件可以自行网上搜索下载,也可以关 ...
对于RBAC与shiro的一些思考
一.什么是RBAC模型 RBAC模型是一个解决用户权限问题的设计思维. 在最简单的RBAC模型中,将用户表设计为如下几个表 1.用户 2.角色 3.权限以及这三张表衍生出来的两张中间表 4.用户_角 ...
关于synchronized无法锁住Integer原因
原因在多线程的时候,为了保证数据安全,必须在修改数据时使用线程同步,java中的synchronized用来实现线程同步.线程列队. 学完多线程基础的我,写一个多线程交替输出1,2,3,4,5... ...
TCP性能分析与调优策略
网络传输传播延迟: 消息从发送端到接收端需要的时间,是信号传播距离和速度的函数传输延迟: 把消息中的所有比特转移到链路中需要的时间,是消息长度和链路速率的函数处理延迟: 处理分组首部.检查位错误 ...
C++ 基础 4：继承和派生
1 继承和派生在 C++ 中可重用性是通过继承这一机制实现的.继承允许我们依据另一个类来定义一个类,这使得创建和维护一个应用程序变得更容易.这样做,也达到了重用代码功能和提高执行效率的效果. 当创 ...
重点思维导图------redis深度历险
const常量与define宏定义的区别（转）
#define RADIUS 100; const float RADIUS = 100; (1) 编译器处理方式不同 define宏是在预处理阶段展开. const常量是编译运行阶段使用. ( ...
《GNU_makefile》第六章——变量
makefile中的变量特征和C语言中的宏一样. 变量使用 =,:=,?= 和 define 定义一些特殊的自动化变量:$< $@ $^ $* 1.变量的引用通过 $(VAR) 或 ${VA ...
Ceph实现数据的'不拆分'
前言之前看过一个朋友一篇文章,讲述的是Vsan为什么使用的是两副本,而ceph则大多数情况下需要三副本,当时个人观点是这个并不是关键点,但是在仔细考虑了问题的出发点以后,这个也可以说是其中的一个点 ...

手撕HashMap

手撕HashMap的更多相关文章

随机推荐

热门专题