Java自学-集合框架 hashCode原理

Java hashCode原理

步骤 1 : List查找的低效率

假设在List中存放着无重复名称，没有顺序的2000000个Hero

要把名字叫做“hero 1000000”的对象找出来

List的做法是对每一个进行挨个遍历，直到找到名字叫做“hero 1000000”的英雄。

最差的情况下，需要遍历和比较2000000次，才能找到对应的英雄。

测试逻辑：

初始化2000000个对象到ArrayList中
打乱容器中的数据顺序
进行10次查询，统计每一次消耗的时间

不同计算机的配置情况下，所花的时间是有区别的。在本机上，花掉的时间大概是600毫秒左右

package collection;

import java.util.ArrayList;

import java.util.Collections;

import java.util.List;

import charactor.Hero;

public class TestCollection {

    public static void main(String[] args) {

        List<Hero> heros = new ArrayList<Hero>();

        for (int j = 0; j < 2000000; j++) {

            Hero h = new Hero("Hero " + j);

            heros.add(h);

        }

        // 进行10次查找，观察大体的平均值

        for (int i = 0; i < 10; i++) {

            // 打乱heros中元素的顺序

            Collections.shuffle(heros);

            long start = System.currentTimeMillis();

            String target = "Hero 1000000";

            for (Hero hero : heros) {

                if (hero.name.equals(target)) {

                    System.out.println("找到了 hero!" );

                    break;

                }

            }

            long end = System.currentTimeMillis();

            long elapsed = end - start;

            System.out.println("一共花了：" + elapsed + " 毫秒");

        }

    }

}

步骤 2 : HashMap的性能表现

使用HashMap 做同样的查找

初始化2000000个对象到HashMap中。
进行10次查询
统计每一次的查询消耗的时间

可以观察到，几乎不花时间，花费的时间在1毫秒以内

package collection;

import java.util.HashMap;

import charactor.Hero;

public class TestCollection {

    public static void main(String[] args) {

        HashMap<String,Hero> heroMap = new HashMap<String,Hero>();

        for (int j = 0; j < 2000000; j++) {

            Hero h = new Hero("Hero " + j);

            heroMap.put(h.name, h);

        }

        System.out.println("数据准备完成");

        for (int i = 0; i < 10; i++) {

            long start = System.currentTimeMillis();

            //查找名字是Hero 1000000的对象

            Hero target = heroMap.get("Hero 1000000");

            System.out.println("找到了 hero!" + target.name);

            long end = System.currentTimeMillis();

            long elapsed = end - start;

            System.out.println("一共花了：" + elapsed + " 毫秒");

        }

    }

}

步骤 3 : HashMap原理与字典

在展开HashMap原理的讲解之前，首先回忆一下大家初中和高中使用的汉英字典。

比如要找一个单词对应的中文意思，假设单词是Lengendary,首先在目录找到Lengendary在第 555页。

然后，翻到第555页，这页不只一个单词，但是量已经很少了，逐一比较，很快就定位目标单词Lengendary。

555相当于就是Lengendary对应的hashcode

步骤 4 : 分析HashMap性能卓越的原因

-----hashcode概念-----

所有的对象，都有一个对应的hashcode（散列值）

比如字符串“gareen”对应的是1001 (实际上不是，这里是方便理解，假设的值)

比如字符串“temoo”对应的是1004

比如字符串“db”对应的是1008

比如字符串“annie”对应的也是1008

-----保存数据-----

准备一个数组，其长度是2000，并且设定特殊的hashcode算法，使得所有字符串对应的hashcode，都会落在0-1999之间

要存放名字是"gareen"的英雄，就把该英雄和名称组成一个键值对，存放在数组的1001这个位置上

要存放名字是"temoo"的英雄，就把该英雄存放在数组的1004这个位置上

要存放名字是"db"的英雄，就把该英雄存放在数组的1008这个位置上

要存放名字是"annie"的英雄，然而 "annie"的hashcode 1008对应的位置已经有db英雄了，那么就在这里创建一个链表，接在db英雄后面存放annie

-----查找数据-----

比如要查找gareen，首先计算"gareen"的hashcode是1001，根据1001这个下标，到数组中进行定位，（根据数组下标进行定位，是非常快速的）发现1001这个位置就只有一个英雄，那么该英雄就是gareen.

比如要查找annie，首先计算"annie"的hashcode是1008，根据1008这个下标，到数组中进行定位，发现1008这个位置有两个英雄，那么就对两个英雄的名字进行逐一比较(equals)，因为此时需要比较的量就已经少很多了，很快也就可以找出目标英雄

这就是使用hashmap进行查询，非常快原理。

这是一种用空间换时间的思维方式

步骤 5 : HashSet判断是否重复

HashSet的数据是不能重复的，相同数据不能保存在一起，到底如何判断是否是重复的呢？

根据HashSet和HashMap的关系，我们了解到因为HashSet没有自身的实现，而是里面封装了一个HashMap，所以本质上就是判断HashMap的key是否重复。

再通过上一步的学习，key是否重复，是由两个步骤判断的：

hashcode是否一样

如果hashcode不一样，就是在不同的坑里，一定是不重复的

如果hashcode一样，就是在同一个坑里，还需要进行equals比较

如果equals一样，则是重复数据

如果equals不一样，则是不同数据。

练习：自定义字符串的hashcode

如下是Java API提供的String的hashcode生成办法；

s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]

s[0] 表示第一位字符

n表示字符串的长度

本练习并不是要求去理解这个算法，而是自定义一个简单的hashcode算法，计算任意字符串的hashcode

因为String类不能被重写，所以我们通过一个静态方法来返回一个String的hashcode

public static int hashcode(String)

如果字符串长度是0，则返回0。

否则：获取每一位字符，转换成数字后，相加，最后乘以23

(s[0]+ s[1] + s[2] + s[3]+ s[n-1])*23.

如果值超过了1999，则取2000的余数，保证落在0-1999之间。

如果是负数，则取绝对值。

随机生成长度是2-10的不等的100个字符串，打印用本hashcode获取的值分别是多少

答案：

package collection;

public class TestCollection {

    public static void main(String[] args) {

        for (int i = 0; i < 100; i++) {

            int length = (int) (Math.random()*8+2);

            String str = randomString(length);

            int hashcode = hashcode(str);

            System.out.printf("%-11s的自定义hashcode是:%d%n",str,hashcode);

        }

    }

    private static int hashcode(String str) {

        // TODO Auto-generated method stub

        if(0==str.length())

            return 0;

        int hashcode = 0;

        char[]cs= str.toCharArray();

        for (int i = 0; i < cs.length; i++) {

            hashcode +=cs[i];

        }

        hashcode*=23;

        //取绝对值

        hashcode = hashcode<0?0-hashcode:hashcode;

        //落在0-1999之间

        hashcode %=2000;

        return hashcode;

    }

    private static String randomString(int length) {

        String pool = "";

        for (short i = '0'; i <= '9'; i++) {

            pool += (char) i;

        }

        for (short i = 'a'; i <= 'z'; i++) {

            pool += (char) i;

        }

        for (short i = 'A'; i <= 'Z'; i++) {

            pool += (char) i;

        }

        char cs[] = new char[length];

        for (int i = 0; i < cs.length; i++) {

            int index = (int) (Math.random() * pool.length());

            cs[i] = pool.charAt(index);

        }

        String result = new String(cs);

        return result;

    }

}

Java自学-集合框架 hashCode原理的更多相关文章

Java自学-集合框架 HashSet
Java集合框架 HashSet 示例 1 : 元素不能重复 Set中的元素,不能重复 package collection; import java.util.HashSet; public cla ...
Java自学-集合框架 Collections
Java集合框架工具类Collections Collections是一个类,容器的工具类,就如同Arrays是数组的工具类步骤 1 : 反转 reverse 使List中的数据发生翻转 pack ...
Java自学-集合框架 Collection
Java集合框架 Collection Collection是一个接口步骤 1 : Collection Collection是 Set List Queue和 Deque的接口 Queue: 先进 ...
Java自学-集合框架 HashMap
Java集合框架 HashMap 示例 1 : HashMap的键值对 HashMap储存数据的方式是-- 键值对 package collection; import java.util.HashM ...
Java自学-集合框架二叉树
Java集合框架二叉树示例 1 : 二叉树概念二叉树由各种节点组成二叉树特点: 每个节点都可以有左子节点,右子节点每一个节点都有一个值 package collection; public ...
Java自学-集合框架 LinkedList
Java集合框架 LinkedList 序列分先进先出FIFO,先进后出FILO FIFO在Java中又叫Queue 队列 FILO在Java中又叫Stack 栈示例 1 : LinkedList ...
Java自学-集合框架与数组的区别
Java集合框架与数组的区别示例 1 : 使用数组的局限性如果要存放多个对象,可以使用数组,但是数组有局限性比如声明长度是10的数组不用的数组就浪费了超过10的个数,又放不下 //Test ...
Java自学-集合框架遍历
遍历ArrayList的三种方法步骤 1 : 用for循环遍历通过前面的学习,知道了可以用size()和get()分别得到大小,和获取指定位置的元素,结合for循环就可以遍历出ArrayList的 ...
Java自学-集合框架 ArrayList和HashSet的区别
Java ArrayList和HashSet的区别示例 1 : 是否有顺序 ArrayList: 有顺序 HashSet: 无顺序 HashSet的具体顺序,既不是按照插入顺序,也不是按照hashc ...

随机推荐

【规范建议】服务端接口返回字段类型与iOS端的解析
一.本文档的写作目的 App需要跟产品.UI.后台.服务器.测试打交道,app的产出是其他端人员产出的综合体现.与其他端人员沟通就像是开发写接口,也就是面向接口编程的思想. 本文档讲解针对的是服务端返 ...
Win10中小娜无法搜索本地应用
解决方案 1.win+X - Windows PowerShell(管理员) 2. 输入Get-AppXPackage -Name Microsoft.Windows.Cortana | Fo ...
IVM sdk command
1.load sdk shell ./auto_load_user.sh 2.查看all端口状态 IVM:0>ifcs show devport 3.查看个别端口状态 IVM:0>ifcs ...
Java - 使用hibernate配置文件 + JPA annotation注解操作数据库
本程序运行环境:IDEA. 实际上我对hiberbate与注解的关系还不是太清晰.据我所知注解都是Java JPA的,那么我的理解是:hibernate就应该只是通过这些JPA标识及hibernate ...
如何申请自己的Flag Counter?
申请自己的Flag Counter是一件简单的事. 首先,进入Flag Counter主页. 之后,选择好样式,点击"GET YOUR FLAG COUNTER".会弹出一个对话窗 ...
WebService介绍及C/C++访问
一．什么是WebService? Web 服务是一个软件接口,它描述了一组可以在网络上通过标准化的 XML 消息传递访问的操作.它使用基于 XML 语言的协议来描述要执行的操作或者要与另一个 Web ...
Charles + Android 抓取Https数据包（适用于Android 6.0及以下）
通过Charles代理,我们能很轻易的抓取手机的Http请求,因为Http属于明文传输,所以我们能直接获取到我们要抓取的内容.但是Https内容本身就是加密的,这时我们会发现内容是加密的了.本文我们来 ...
学习黑马教学视频SSM整合中Security遇到的问题org.springframework.security.access.AccessDeniedException: Access is denied
问题已解决. 总结: 报错:org.springframework.security.access.AccessDeniedException: Access is denied 当您遇到同样问题时, ...
设计模式课程设计模式精讲 22-2 备忘录模式coding
1 代码演练 1.1 代码演练1 1 代码演练 1.1 代码演练1 需求: 网站笔记需要存储快照,能实现回退的功能. 注意: a 设计的时候,可以分为笔记类,笔记快照类和笔记快照管理类三个类. ...
Java知识总结：Java反射机制（用实例理解）
概念理解: 反射是指一类应用,它们能够自描述和自控制.也就是说,这类应用通过采用某种机制来实现对自己行为的描述( self-representation )和检测( examination) ,并能 ...

Java自学-集合框架 hashCode原理

Java hashCode原理

Java自学-集合框架 hashCode原理的更多相关文章

随机推荐

热门专题