Hashmap的Hash()

JDK7：

public final int hashCode() {
return Objects.hashCode(getKey()) ^ Objects.hashCode(getValue());
}

/**
     * Retrieve object hash code and applies a supplemental hash function to the
     * result hash, which defends against poor quality hash functions. This is
     * critical because HashMap uses power-of-two length hash tables, that
     * otherwise encounter collisions for hashCodes that do not differ
     * in lower bits. Note: Null keys always map to hash 0, thus index 0.
     */
    final int hash(Object k) {
        int h = hashSeed;
        if (0 != h && k instanceof String) {
            return sun.misc.Hashing.stringHash32((String) k);
        }

h ^= k.hashCode();

// This function ensures that hashCodes that differ only by
        // constant multiples at each bit position have a bounded
        // number of collisions (approximately 8 at default load factor).
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

http://www.365doit.com/all/news/hashmapdeep.html

假设key.hashCode()的值为：0x7FFFFFFF，table.length为默认值16。
上面算法执行如下：

得到i=15
。这种算法使得最低位上原hashCode的8位都参与了^运算，所以在table.length为默认值16的情况下面，hashCode任意位的变化
基本都能反应到最终hash table
定位算法中，这种情况下只有原hashCode第3位高1位变化不会反应到结果中，即：0x7FFFF7FF的i=15。

这样做的好处是什么？我的理解是：它的目的是让“1”变的均匀一点，散列的本意就是要尽量均匀分。先看个例子，一个十进制数32768（二进制1000 0000 0000 0000），经过上述公式运算之后的结果是35080（二进制1000 1001 0000 1000）。看出来了吗？或许这样还看不出什么，再举个数字61440（二进制1111 0000 0000 0000），运算结果是65263（二进制1111 1110 1110 1111），现在应该很明显了。这个运算确实可以散列均匀。。

那散列的均匀又有何用？来分析下一句话：

HashMap可以看作是Java实现的哈希表。HashMap中存放的是key-value对，对应的类型为 java.util.HashMap.Entry，所以在HashMap中数据都存放在一个Entry引用类型的数组table中。这里key是一个对象，为了把对象映射到table中的一个位置，我们可以通过求余法来，所以我们可以使用 [key的hashCode % table的长度]来计算位置（当然在实际操作的时候由于需要考虑table上的key的均匀分布可能需要对key的hashCode做一些处理）。

/**
     * Returns index for hash code h.
     */
    static int indexFor(int h, int length) {
        // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
        return h & (length-1);
    }

当计算出来的hash函数h和hashMap的length做了&运算后，会得到[0，length-1]其中的一个值，而散列的均匀也会使这个值分布的均匀，从而达到HashMap高效的一点。

hash对一个对象的hashCode进行重新计算，而IndexFor生成这个对象的index。

hash值重新计算，是为了防止质量低下的hashCode()函数实现。在hashMap数组长度中长度是初始长度的2倍。通过右移造成地位的数据尽量的不同。

而在计算index上使用的是h&(length-1)的方法。简单而效率高。

看了Java的代码，自己在设计hash函数的时候，就有选择了。尽量使用位运算符，少使用+-*/%的运算符，这样可以提高hash的效率。

Hashmap的Hash()的更多相关文章

hashmap的hash算法( 转)
HashMap 中hash table 定位算法: int hash = hash(key.hashCode()); int i = indexFor(hash, table.length); 其中i ...
HashMap的hash冲突解决方案
Hash函数非哈希表的特点:关键字在表中的位置和它之间不存在一个确定的关系,查找的过程为给定值一次和各个关键字进行比较,查找的效率取决于和给定值进行比较的次数. 哈希表的特点:关键字在表中位置和它之 ...
HashMap，Hash优化与高效散列
OverView Hash table based implementation of the Map interface. This implementation provides all of t ...
关于HashMap中hash()函数的思考
关于HashMap中hash()函数的思考 JDK7中hash函数的实现 static int hash(int h) { h ^= (h >>> 20) ^ (h >&g ...
调试JDK源代码-一步一步看HashMap怎么Hash和扩容
调试JDK源代码-一步一步看HashMap怎么Hash和扩容调试JDK源代码-ConcurrentHashMap实现原理调试JDK源代码-HashSet实现原理调试JDK源代码-调试JDK源代码 ...
HashMap的hash分析
哈希 Hash,一般翻译做“散列”,也有直接音译为“哈希”的,就是把任意长度的输入,通过散列算法,变换成固定长度的输出,该输出就是散列值.这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空 ...
JDK1.8中HashMap的hash算法和寻址算法
JDK 1.8 中 HashMap 的 hash 算法和寻址算法 HashMap 源码 hash() 方法 static final int hash(Object key) { int h; ret ...
Java源码之HashMap的hash篇
提到哈希,我们脑袋中立马就会闪过一个方法,就是hashCode(),没错.就是这个! 我们知道HashMap是通过数组+链表的结构进行数据存储的,有数组就会有索引,而HashMap内的数据要存储在 ...
Java中hashCode()方法以及HashMap()中hash()方法
Java的Object类中有一个hashCode()方法: public final native Class<?> getClass(); public native int hashC ...
HashMap解决hash冲突的方法
HashMap 采用一种所谓的“Hash 算法”来决定每个元素的存储位置.当程序执行 map.put(String,Obect)方法时,系统将调用String的 hashCode() 方法得到其 h ...

随机推荐

iTOP4412环境搭建：arm-linux-gcc: 没有那个文件或目录
系统:vmware下的ubuntu14.04 对于iTOP4412自己搭建环境,在source /root/.bashrc后发现还是没有正常,调用arm-linux-gcc -v提示没有那个文件或目录 ...
分布式系统的BASE理论
一.BASE理论 eBay的架构师Dan Pritchett源于对大规模分布式系统的实践总结,在ACM上发表文章提出BASE理论,BASE理论是对CAP理论的延伸,核心思想是即使无法做到强一致性(St ...
net core体系-web应用程序-4net core2.0大白话带你入门-1目录
asp.net core2.0大白话带你入门本系列包括: 1.新建asp.net core项目2.web项目目录解读3.配置访问地址4.环境变量详解5.配置文件6.日志7.DI容器8.服务的生命周期 ...
mybatis拦截器处理
1.自定义注释 package com.hsfw.backyard.biz.security.authority; import java.lang.annotation.*; /** * 数据权限过 ...
Python学习（九） —— 正则表达式与re模块
一.正则表达式定义:正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑. 正则表达 ...
Linux安装Tomcat-Nginx-FastDFS-Redis-Solr-集群——【第十集之Nginx反向代理原理】（有参考其他文章）
1,正向代理(代理客户机) 2,反向代理(代理服务器,所以叫反向代理) 3,集群+负载均衡集群指的是将几台服务器集中在一起,实现同一业务. 负载均衡是由多台服务器以对称的方式组成一个服务器集合,每台 ...
050 Kafka的引入介绍
高吞吐量的分布式订阅消息系统 1.官网 http://kafka.apache.org/ 2.官网的介绍 3.结构这个是版本1.0之后的版本. In Kafka the communication ...
Python 2 和 3 的区别记录
Python 2 和 3 的区别记录 print 2:关键字,可以 print a,也可以 print(a) 3:内置函数,必须带(),print(a) reload() 2:内置函数,可以直接使用 ...
解决java编译错误：编码GBK的不可映射字符
新建java文件,存储时Encoding选择了UTF-8, 由于语句中包含中文,javac编译时报错,提示"编码GBK的不可映射字符": 解决办法: 1.使用javac -enco ...
Sunscreen POJ - 3614（贪心）
To avoid unsightly burns while tanning, each of the C (1 ≤ C ≤ 2500) cows must cover her hide with s ...

Hashmap的Hash()

Hashmap的Hash()的更多相关文章

随机推荐

热门专题