【Python算法】哈希存储、哈希表、散列表原理

哈希表的定义：

　　哈希存储的基本思想是以关键字Key为自变量，通过一定的函数关系（散列函数或哈希函数），计算出对应的函数值（哈希地址），以这个值作为数据元素的地址，并将数据元素存入到相应地址的存储单元中。

　　查找时再根据要查找的关键字采用同样的函数计算出哈希地址，然后直接到相应的存储单元中去取要找的数据元素即可。

哈希表的应用：

　　哈希表(hash table)是实现字典操作的一种有效的数据结构。

　　尽管最坏的情况下，散列表中查找一个元素的时间与链表中查找的时间相同，达到了O(n)。

　　然而实际应用中，散列的查找的性能是极好的。在一些合理的假设下，在散列表中查找一个元素的平均时间是O(1)。

建立哈希表操作步骤：

　　1) step1 取数据元素的关键字key，计算其哈希函数值（地址）。若该地址对应的存储空间还没有被占用，则将该元素存入；否则执行step2解决冲突。

　　2) step2 根据选择的冲突处理方法，计算关键字key的下一个存储地址。若下一个存储地址仍被占用，则继续执行step2，直到找到能用的存储地址为止。

常用的哈希函数：

　　构造哈希函数的方法有很多，总的原则是尽可能将关键字集合空间均匀的映射到地址集合空间中，同时尽可能降低冲突发生的概率。

1、除留余数法：

　　H(Key) = key % p (p ≤ m)

　　取关键字除以p的余数作为哈希地址，p最好选择一个小于或等于m（哈希地址集合的个数）的某个最大素数

哈希表长度	8	16	32	64	128	256	512
最大素数	7	13	31	61	127	251	503

2、直接地址法

　　H(Key) = a * Key + b；这个“a，b”是常量。

3、数字分析法

　　比如有一组key1=112233，key2=112633，key3=119033，

　　针对这样的数我们分析数中间两个数比较波动，其他数不变。那么我们取key的值就可以是 key1=22,key2=26,key3=90。

4、平方取中法

　　此处忽略，见名识意。

5、折叠法

　　比如key=135790，要求key是2位数的散列值。那么我们将key变为13+57+90=160，然后去掉高位“1”,此时key=60，

　　这就是他们的哈希关系，这样做的目的就是地址与每一位的key都相关，来做到“散列地址”尽可能分散的目地。

冲突处理方法：

　　影响哈希查找效率的一个重要因素是哈希函数本身。当两个不同的数据元素的哈希值相同时，就会发生冲突。为减少发生冲突的可能性，哈希函数应该将数据尽可能分散地映射到哈希表的每一个表项中。

　　解决冲突的方法有以下两种：　

　　(1) 开放地址法　　

　　　　如果两个数据元素的哈希值相同，则在哈希表中为后插入的数据元素另外选择一个表项。

　　　　当程序查找哈希表时，如果没有在第一个对应的哈希表项中找到符合查找要求的数据元素，程序就会继续往后查找，直到找到一个符合查找要求的数据元素，或者遇到一个空的表项。　　

　　　　①.线性探测法

　　　　　　这种方法在解决冲突时，依次探测下一个地址，直到有空的地址后插入，若整个空间都找遍仍然找不到空余的地址，产生溢出。

　　　　　　H_i =( H(Key) + d_i) % m ( i = 1,2,3,...,k , k ≤ m-1 )

　　　　　　地址增量 d_i= 1,2,...,m-1 , 其中 i 为探测次数

　　　　②.二次探测法

　　　　　　地址增量序列为：d_i= 1²，-1²，2²，-2² ，...，q²，-q² （q ≤ m/2）

　　　　③.双哈希函数探测法

　　　　　　H_i =( H(Key) + i * RH(Key)) % m ( i = 1,2,3,..., m-1 )

　　　　　　H(Key) , RH(Key)是两个哈希函数，m为哈希表长度。

　　　　　　先用第一个哈希函数对关键字计算哈希地址，一旦产生地址冲突，再用第二个函数确定移动的步长寅子，最后通过步长因子序列由探测函数寻找空余的哈希地址。

　　　　　　H₁ = ( a+b )%m , H₂ = ( a + 2b )%m , ... , H_m-1 = ( a+(m-1)*b )%m

　　(2) 链地址法

　　　　将哈希值相同的数据元素存放在一个链表中，在查找哈希表的过程中，当查找到这个链表时，必须采用线性查找方法。

Python字典dict的实现是使用开放寻址法中的二次探查来解决冲突的。

【Python算法】哈希存储、哈希表、散列表原理的更多相关文章

JavaScript 哈希表(散列表)应用
查找的效率与比较次数密切相关.基于比较的程序,运算效率是比较低的.比如平时可以通过indexOf查找一个数据.但这是一个基于比较的一个实现.如果是淘宝那样有上亿个商品,那么用indeOf 来查数据就会 ...
JavaScript 哈希表(散列表)实现和应用
查找的效率与比较次数密切相关.基于比较的程序,运算效率是比较低的.比如平时可以通过indexOf查找一个数据.但这是一个基于比较的一个实现.如果是淘宝那样有上亿个商品,那么用indeOf 来查数据就会 ...
线性表 & 散列表
线性表: 数据排成一条线一样的机构,每个线性表上的数据最多只有前后两个方向, 包括数组,链表,队列,栈. 非线性表 : 数据之间并不是简单的前后关系,有二叉树.图等. 散列表(基于数组支持按照下标 ...
哈希表（散列表），Hash表漫谈
1.序该篇分别讲了散列表的引出.散列函数的设计.处理冲突的方法.并给出一段简单的示例代码. 2.散列表的引出给定一个关键字集合U={0,1......m-1},总共有不大于m个元素.如果m不是很大 ...
java资料——哈希表（散列表）（转）
哈希表散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构.也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度. ...
Python与数据结构[4] -> 散列表[0] -> 散列表与散列函数的 Python 实现
散列表 / Hash Table 散列表与散列函数散列表是一种将关键字映射到特定数组位置的一种数据结构,而将关键字映射到0至TableSize-1过程的函数,即为散列函数. Hash Table: ...
Java数据结构和算法（十三）——哈希表
Hash表也称散列表,也有直接译作哈希表,Hash表是一种根据关键字值(key - value)而直接进行访问的数据结构.它基于数组,通过把关键字映射到数组的某个下标来加快查找速度,但是又和数组.链表 ...
【Java】大话数据结构(13) 查找算法(4) （散列表（哈希表））
本文根据<大话数据结构>一书,实现了Java版的一个简单的散列表(哈希表). 基本概念对关键字key,将其值存放在f(key)的存储位置上.由此,在查找时不需比较,只需计算出f(key) ...
Python 散列表查询_进入<哈希函数>为结界的世界
1. 前言哈希表或称为散列表,是一种常见的.使用频率非常高的数据存储方案. 哈希表属于抽象数据结构,需要开发者按哈希表数据结构的存储要求进行 API 定制,对于大部分高级语言而言,都会提供已经实现好 ...

随机推荐

Flume线上日志采集【模板】
Flume线上日志采集[模板] 预装软件 Java HDFS Lzo/Lzop 系统版本 Flume 1.5.0-cdh5.4.0 系统流程图 flume-env.sh配置文件 export JAVA ...
android布局自适应小示例（用户反馈界面）
要求: 1.整个界面刚好填满屏幕,不需要滚动 2.输入反馈内容的EditText控件高度能够自适应 3.提交按钮位于屏幕最下方核心布局文件如下: <?xml version="1.0 ...
xslt 映射 xml
1.xslt文件映射xml文件中的A节点的时候,如果A节点有属性的话,先把属性值映射出来,然后再映射节点的值,如下: xml文件: <A age="11" sex=" ...
Windows Phone实用教程：利用Blend为程序添加设计时数据
[前言] Blend自诞生那一天起就伴随这开发者如此的评价: 有VS还用Blend干啥,直接码代码就好了. Blend会生成一堆垃圾无用代码,很不爽. 对于这类我只会在心里评价,当你并不真正了解一样事 ...
Eclipse上配置btm
1.新建一个空的工程btm-szny,jdk版本1.6 2.在工程中导入CVS中的代码如下图
UCOS2_STM32移植详细过程（汇总）
Ⅰ.概述笔者发现一个问题,很多初学者,甚至很多工作一两年的人,他们有一种依赖的思想,就是希望从别处获取的软件代码不做任何修改,直接可以运行或者使用.笔者想说,实践才是检验真理的关键,实践才是掌握知识 ...
一次完整的https过程
参考: 1. 一次完整的HTTP事务是怎样一个过程? 2. The First Few Milliseconds of an HTTPS Connection 3. 也许,这样理解HTTPS更容易 4 ...
java定时调度器解决方案分类及特性介绍
什么是定时调度器? 我们知道程序的运行要么是由事件触发的,而这种事件的触发源头往往是用户通过ui交互操作层层传递过来的:但是我们知道还有另外一种由机器系统时间触发的程序运行场景.大家想想是否遇到或者听 ...
Memcached 1.4.20 发布，集中式缓存系统
内存缓存Memcached 1.4.20发布.2014-05-12 上一个版本是2014-05-01的1.4.19 此版本只修正了一个1.4.18和1.4.19中引入的Bug. 此版本只是修复了导致 ...
ThinkPHP 汉字转成多种形式拼音
模型: <?php namespace Admin\Model; use Think\Model; /** * 汉字转拼音 * @author huangguojin */ class ZHMo ...

【Python算法】哈希存储、哈希表、散列表原理

【Python算法】哈希存储、哈希表、散列表原理的更多相关文章

随机推荐

热门专题