java数据结构----哈希表
1.哈希表:它是一种数据结构,可以提供快速的插入操作和查找操作。如果哈希表中有多少数据项,插入和删除操作只需要接近常量的时间。即O(1)的时间级。在计算机中如果需要一秒内查找上千条记录,通常使用哈希表。哈希表的速度明显比树快,编程实现也相对容易。但哈希表是基于数组的,数组创建后难于扩展。某些哈希表被填基本填满后性能下降的非常严重,所以程序员必须清除表中需要存储多少数据,而且也没有简便的方式以任意一种顺序(如由大到小)遍历表中的数据项,如果需要这种能力,只能选择其他数据结构。
2.哈希化:把关键字转化成数组下标的过程称为哈希化。在哈希表中这个转换通过哈希函数来完成。而对于特定的关键字,并不需要哈希函数,关键字的值可以直接作为数组下标。
3.冲突:把巨大的数字空间压缩成较小的数字空间必然要付出代价,即不能保证每个单词都映射到数组的空白单元。假设要在数组中插入单词cat,通过哈希函数得到它的数组下标后,发现那个单元已经有一个单词了,对于特定大小的数组,这种情况称为冲突。冲突使得哈希化的方案无法实施,解决的方案有两种,一种是通过系统的方法找到数组的一个空位,并把单词填入,而不再用哈希函数得到的下标,这种方法称为开放地址法,第二种方案是创建一个存放单词链表的数组,数组不直接用来存储单词,这样发生冲突时,新的数据项就直接插入这个数组下标所指向的链表中,这种方法称为链地址法。
3-1.开放地址法的具体实现有三种不同方案,线性探测,二次探测和再哈希法。
3-1-1.线性探测:在线性探测中,线性的查找空白单元,如果5421是要插入的数据位置,它已被占用,那么就使用5422,然后是5423,依次类推,直到找到这个空位。
3-1-1-1.存在的问题:会出现聚集情况。也叫原始聚集
3-1-2.二次探测:二次探测是防止聚集产生的一种尝试,思想是探测相隔较远的单元。而不知和原始单元相邻的单元。在二次探测中,探测的过程是x+1,x+4,x+9,x+16....
3-1-2-1.问题:存在二次聚集。
3-1-3.再哈希法:为了消除原始聚集和二次聚集,引入了再哈希法,二次聚集产生的原因是,二次探测的算法产生的探测序列步长总是固定的:1,4,9,16...现在需要一 种方法是依赖关键字的探测序列,方法是把关键字用相同的哈希函数再做一次哈希化,用这个结果作为步长,对指定的关键字步长在整个探测过程中是不变的,第二个哈希函数必须具备以下特点:a.和第一个哈希函数不同,b.不能输出0(否则就没有步长,将先入死循环)专家发现类似于stepsize = constant - (key % constant)的形式工作的很好,其中个constant是质数,且小于数组容量。(stepsize = 5 - (key % 5)),这种方案最为常用。
3-2.链地址法图示:
3-2-1.缺点:链地址法在概念上比开放地址法简单,但是代码可能要比其他的长,因为要包含链表机制,这就要求在程序中增加一个类。
4.再哈希法实现代码:
4.1.DataItem.java
- package com.cn.hashtable;
- /**
- * 再哈希法
- * @author Administrator
- *
- */
- public class DataItem {
- private int iData;
- public DataItem(int id){
- iData = id;
- }
- public int getkey(){
- return iData;
- }
- }
4.2.HashTable.java
- package com.cn.hashtable;
- /**
- * 哈希表算法开放地址法---再哈希实现
- * @author Administrator
- *
- */
- public class HashTable {
- private DataItem[] hashArray;
- private int arraySize;
- private DataItem nonItem;
- HashTable(int size){
- arraySize = size;
- hashArray = new DataItem[arraySize];
- nonItem = new DataItem(-1);
- }
- public void displayTable(){
- System.out.print("Table:");
- for (int i = 0; i < arraySize; i++) {
- if (hashArray[i] != null)
- System.out.print(hashArray[i].getkey()+" ");
- else
- System.out.print("** ");
- }
- System.out.println("");
- }
- public int hashFunc1(int key){
- return key % arraySize;
- }
- public int hashFunc2(int key){
- return 5 - key % 5;
- }
- public void insert(int key,DataItem item){
- int hashval = hashFunc1(key);
- int stepsize = hashFunc2(key);
- while (hashArray[hashval] != null && hashArray[hashval].getkey() != 1){
- hashval += stepsize;
- hashval %= arraySize;
- }
- hashArray[hashval] = item;
- }
- public DataItem delete(int key){
- int hashval = hashFunc1(key);
- int stepsize = hashFunc2(key);
- while (hashArray[hashval] != null){
- if (hashArray[hashval].getkey() == key){
- DataItem temp = hashArray[hashval];
- hashArray[hashval] = nonItem;
- return temp;
- }
- hashval += stepsize;
- hashval %= arraySize;
- }
- return null;
- }
- public DataItem find(int key){
- int hashval = hashFunc1(key);
- int stepsize = hashFunc2(key);
- while (hashArray[hashval] != null){
- if (hashArray[hashval].getkey() == key)
- return hashArray[hashval];
- hashval += stepsize;
- hashval %= arraySize;
- }
- return null;
- }
- }
4.3.HTTest.java
- package com.cn.hashtable;
- /**
- * 测试类
- * @author Administrator
- *
- */
- public class HTTest {
- public static void main(String[] args) {
- HashTable t = new HashTable(10);
- t.insert(1, new DataItem(1));
- t.insert(2, new DataItem(2));
- t.insert(4, new DataItem(3));
- t.insert(3, new DataItem(4));
- t.insert(2, new DataItem(5));
- t.insert(9, new DataItem(6));
- t.displayTable();
- t.delete(9);
- System.out.println(t.find(9));
- }
- }
5.链地址法实现:
5.1.Link.java
- package com.cn.hashtable;
- /**
- * 链地址法实现
- * @author Administrator
- *
- */
- public class Link {
- public int iData;
- public Link next;
- public Link(int it){
- iData = it;
- }
- public int getkey(){
- return iData;
- }
- public void displayLink(){
- System.out.print(iData+" ");
- }
- }
5.2.SortedList.java
- package com.cn.hashtable;
- public class SortedList {
- private Link first;
- public void insert(Link thelink){
- int key = thelink.getkey();
- Link previous = null;
- Link current = first;
- while (current != null && key > current.getkey()){
- previous = current;
- current = current.next;
- }
- if (previous == null)
- first = thelink;
- else
- previous.next = thelink;
- thelink.next = current;
- }
- public void delete(int key){
- Link previous = null;
- Link current = first;
- while (current != null && key != current.getkey()){
- previous = current;
- current = current.next;
- }
- if (previous == null)
- first = first.next;
- else
- previous.next = current.next;
- }
- public Link find(int key){
- Link current = first;
- while (current != null && current.getkey() <= key){
- if (current.getkey() == key)
- return current;
- current = current.next;
- }
- return null;
- }
- public void displayList(){
- System.out.print("list:first-->last: ");
- Link current = first;
- while (current != null){
- current.displayLink();
- current = current.next;
- }
- System.out.println("");
- }
- }
5.3.LHashTable.java
- package com.cn.hashtable;
- /**
- * 链地址法实现哈希表类
- * @author Administrator
- *
- */
- public class LHashTable {
- private SortedList[] hashArray;
- private int arraySize;
- public LHashTable(int size){
- arraySize = size;
- hashArray = new SortedList[arraySize];
- for (int i = 0; i < arraySize; i++) {
- hashArray[i] = new SortedList();
- }
- }
- public void display(){
- for (int i = 0; i < arraySize; i++) {
- System.out.print(i+". ");
- hashArray[i].displayList();
- }
- System.out.println("");
- }
- public int hashFunc(int key){
- return key % arraySize;
- }
- public void insert(Link thelink){
- int key = thelink.getkey();
- int hashval = hashFunc(key);
- hashArray[hashval].insert(thelink);
- }
- public void delete(int key){
- int hashval = hashFunc(key);
- hashArray[hashval].delete(key);
- }
- public Link find(int key){
- int hashval = hashFunc(key);
- Link thelink = hashArray[hashval].find(key);
- return thelink;
- }
- }
5.4.LHTTest.java
- package com.cn.hashtable;
- /**
- * 链地址法实现测试类
- * @author Administrator
- *
- */
- public class LHTTest {
- public static void main(String[] args) {
- LHashTable lt = new LHashTable(10);
- for (int i = 0; i < 5; i++) {
- lt.insert(new Link(i));
- }
- lt.display();
- }
- }
6.哈希化的效率:在哈希表中执行插入和搜索操作可以达到O(1)的时间级,如果没有遇到冲突,就只需要使用一次哈希函数和数组的引用。这是最小的存取时间级。如果发生冲突,存取时间就依赖后边的探测长度。因此,一次的查找或插入操作与探测长度成正比,平均探测长度取决于装填因子(表中项数和表长的比率),随着填装因子变大,探测长度也越来越长。
6.1.线性探测时,探测序列(p)和填装因子(L)的关系:成功查找:P = (1 + 1/(1 - L)^2)/2;不成功查找:(1 + 1/(1 - L))/2,随着装填因子变小,存储效率下降而速度上升。
6.2.二次探测和再哈希法:对成功的搜索公式是:-log2(1 - loadfactor)/loadfactor;不成功的查找:1/(1-loadfactor)
6.3.假设哈希表含有arraySize个数据项,每个数据项有一个链表,在表中有N个数据项:averageListLength = N/arraySize;成功查找:1+loadfactor/2;不成功的查找:1+loadfactor
java数据结构----哈希表的更多相关文章
- JAVA数据结构--哈希表的实现(分离链接法)
哈希表(散列)的定义 散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构.也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度 ...
- java数据结构——哈希表(HashTable)
哈希表提供了快速的插入操作和查找操作,每一个元素是一个key-value对,其基于数组来实现. 一.Java中HashMap与Hashtable的区别: HashMap可以接受null键值和值,而Ha ...
- Java数据结构——哈希表
- Java中哈希表(Hashtable)是如何实现的
Java中哈希表(Hashtable)是如何实现的 Hashtable中有一个内部类Entry,用来保存单元数据,我们用来构建哈希表的每一个数据是Entry的一个实例.假设我们保存下面一组数据,第一列 ...
- (js描述的)数据结构[哈希表1.1](8)
(js描述的)数据结构[哈希表1.1](8) 一.数组的缺点 1.数组进行插入操作时,效率比较低. 2.数组基于索引去查找的操作效率非常高,基于内容去查找效率很低. 3.数组进行删除操作,效率也不高. ...
- openssl lhash 数据结构哈希表
哈希表是一种数据结构,通过在记录的存储位置和它的关键字之间建立确定的对应关系,来快速查询表中的数据: openssl lhash.h 为我们提供了哈希表OPENSSL_LHASH 的相关接口,我们可以 ...
- Java数据结构之线性表(2)
从这里开始将要进行Java数据结构的相关讲解,Are you ready?Let's go~~ java中的数据结构模型可以分为一下几部分: 1.线性结构 2.树形结构 3.图形或者网状结构 接下来的 ...
- Java数据结构之线性表
从这里开始将要进行Java数据结构的相关讲解,Are you ready?Let's go~~ java中的数据结构模型可以分为一下几部分: 1.线性结构 2.树形结构 3.图形或者网状结构 接下来的 ...
- java数据结构之hash表
转自:http://www.cnblogs.com/dolphin0520/archive/2012/09/28/2700000.html Hash表也称散列表,也有直接译作哈希表,Hash表是一种特 ...
随机推荐
- android4.3 蓝牙BLE编程
一.蓝牙4.0简介 蓝牙4.0标准包含两个蓝牙标准,准确的说,是一个双模的标准,它包含传统蓝牙部分(也有称之为经典蓝牙Classic Bluetooth)和低功耗蓝牙部分(Bluetooth Low ...
- Transaction事务注解和DynamicDataSource动态数据源切换问题解决
问题描述: 写主库开事务的情况下会导致时不时的将更新/插入操作写入到从库上, 导致mysqlException update command denied 问题原因: jetty的工作队列会重用处 ...
- System.exit(0);和finish();,push原理
今天师姐问我安卓后台的问题,想起几年前做进制转换的时候特意研究了一下怎么才能「不驻留内存地退出」.虽然Android不推荐用户手动关闭进程,但是在那个内存捉襟见肘的年代,不得不考虑内存. 首先直接按b ...
- springMVC之HttpServletRequest的getParameterMap()
request.getParameterMap()的返回类型是Map类型的对象,也就是符合key-value的对应关系,但这里要注意的是,value的类型是String[],而不是String. 得到 ...
- SQL Server中查询CPU占用高的SQL语句
SQL Server中查询CPU占用高的情况,会用到sys.sysprocesses ,dm_exec_sessions ,dm_exec_requests 一.查看当前的数据库用户连接有多少 USE ...
- leetcode398 and leetcode 382 蓄水池抽样算法
382. 链表随机节点 给定一个单链表,随机选择链表的一个节点,并返回相应的节点值.保证每个节点被选的概率一样. 进阶:如果链表十分大且长度未知,如何解决这个问题?你能否使用常数级空间复杂度实现? 示 ...
- CS231n 2016 通关 第三章-SVM 作业分析
作业内容,完成作业便可熟悉如下内容: cell 1 设置绘图默认参数 # Run some setup code for this notebook. import random import nu ...
- World is Exploding
题意: 给出一个长为n的序列A,问有多少四元组(a, b, c, d)满足$a \ne b \ne c \ne d, 1 \leq a < b \leq n, 1 \leq c < d \ ...
- 2.3 Hive的数据类型讲解及实际项目中如何使用python脚本对数据进行ETL
一.hive Data Types https://cwiki. apache. org/confluence/display/HiveLanguageManual+Types Numeric Typ ...
- 【Hadoop】HDFS笔记(一):Hadoop的RPC机制
RPC(Remote Procedure Call, 远程过程调用)主要面对两个问题: 1.对象调用方式: 2.序列/反序列化机制. Hadoop实现的RPC组件依赖于Hadoop Writable类 ...