python---哈希算法实现
# coding = utf-8 class Array: def __init__(self, size=32, init=None): self._size = size self._items = [init] * size def __getitem__(self, index): return self._items[index] def __setitem__(self, index, value): self._items[index] = value def __len__(self): return self._size def clear(self, value=None): for i in range(self._items): self._items[i] = value def __iter__(self): for item in self._items: yield item class Slot: """ 定义一个哈希表数组的槽 注意:一个槽有三种状态 1. 从未被使用过,HashMap.UNUSED。 此槽没有被使用和冲突过,查找时只要找到UNUSED 就不用再继续探查了 2. 使用过但是remove了, 此时是HashMap.EMPTY,该点后面的元素仍可能是有key 3. 槽正在使用Slot 节点 """ def __init__(self, key, value): self.key = key self.value = value class HashTable: # 表示slot 没有被使用过 UNUSED = None # 使用过被删除 EMPTY = Slot(None, None) def __init__(self): # 初始化,数组的每个元素都是UNUSED self._table = Array(8, init=HashTable.UNUSED) self.length = 0 # 内置装饰器,把方法变成属性 @property def __load_factor(self): return self.length / float(len(self._table)) def __len__(self): return self.length def _hash(self, key): # abs函数返回绝对值 hash 是内置函数 _hash 直接使用内置的哈希函数,对数组的长度取模 hash_str = abs(hash(key)) % len(self._table) # print(hash_str) return hash_str def _find_key(self, key): # 先用 _hash方法计算出槽的位置 index = self._hash(key) # 先保存数组长度 _len = len(self._table) # 如果这个槽不是没有被使用过 while self._table[index] is not HashTable.UNUSED: # 如果这个槽是,曾经有过值,不过被删除了 if self._table[index] is HashTable.EMPTY: # cpython 使用的一种解决哈希冲突的方式 index = (index*5+1) % _len continue # 正在使用, 如果key值相同 elif self._table[index].key == key: return index # 这里就只剩最后一种可能, 正在使用,但是key没有找到 else: index = (index*5+1) % _len return None # 判断一个槽是否可以插入 def _slot_can_insert(self, index): return self._table[index] is HashTable.EMPTY or self._table[index] is HashTable.UNUSED # 寻找一个空槽,用来插入 def _find_slot_for_insert(self, key): index = self._hash(key) _len = len(self._table) while not self._slot_can_insert(index): index = (index*5+1) % _len # print(index) return index # 实现一个in操作符 def __contains__(self, key): index = self._find_key(key) return index is not None def add(self, key, value): # 上面实现的in操作符 if key in self: index = self._find_key(key) self._table[index].value = value # 返回False 表示没有执行插入操作,执行的是更新操作 return False else: # 这两步可能会调用_slot_can_insert 函数, # 不管是哪种情况,EMPTY 或 是 UNUSEZD, # 都将这个节点声明为Slot类 index = self._find_slot_for_insert(key) self._table[index] = Slot(key, value) self.length += 1 # 当空间占用大于0.8 的时候,进行rehash 重新分配空间。 if self.__load_factor >= 0.8: self._rehash() return True def _rehash(self): old_table = self._table new_size = len(self._table) * 2 self._table = Array(new_size, HashTable.UNUSED) self.length = 0 for slot in old_table: # 判断这个slot 是有值的 if slot is not HashTable.UNUSED and slot is not HashTable.EMPTY: # 找到一个可以插入的槽 index = self._find_slot_for_insert(slot.key) self._table[index] = slot self.length += 1 def get(self, key, default=None): index = self._find_key(key) if index is None: return default else: return self._table[index].value def remove(self, key): index = self._find_key(key) if index is None: raise KeyError value = self._table[index].value self.length -= 1 self._table[index] = HashTable.EMPTY return value # 遍历操作,python 字典默认遍历的是key,这里实现的也是遍历key def __iter__(self): for slot in self._table: if slot not in (HashTable.EMPTY, HashTable.UNUSED): yield slot.key if __name__ == '__main__': h = HashTable() h.add('a', 0) h.add('b', 1) h.add('c', 2) assert len(h) == 3 assert h.get('a') == 0 assert h.get('b') == 1 assert h.get('c') == 2 assert h.get('sky') is None h.remove('a') assert h.get('a') is None assert sorted(list(h)) == ['b', 'c'] for n in range(50): h.add(n, n) for i in range(50): assert h.get(n) == n
python---哈希算法实现的更多相关文章
- 感知哈希算法——Python实现【转】
转自:https://blog.csdn.net/m_buddy/article/details/78887248 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原 ...
- python数据结构与算法
最近忙着准备各种笔试的东西,主要看什么数据结构啊,算法啦,balahbalah啊,以前一直就没看过这些,就挑了本简单的<啊哈算法>入门,不过里面的数据结构和算法都是用C语言写的,而自己对p ...
- Iconfinder 如何杜绝盗版,哈希算法检测图像重复
原地址:http://blog.jobbole.com/65914/ 本文由 伯乐在线 - 小鱼 翻译自 Silviu Tantos.欢迎加入技术翻译小组.转载请参见文章末尾处的要求. [伯乐在线导读 ...
- 以图搜图(一):Python实现dHash算法(转)
近期研究了一下以图搜图这个炫酷的东西.百度和谷歌都有提供以图搜图的功能,有兴趣可以找一下.当然,不是很深入.深入的话,得运用到深度学习这货.Python深度学习当然不在话下. 这个功能最核心的东西就是 ...
- os常用模块,json,pickle,shelve模块,正则表达式(实现运算符分离),logging模块,配置模块,路径叠加,哈希算法
一.os常用模块 显示当前工作目录 print(os.getcwd()) 返回上一层目录 os.chdir("..") 创建文件包 os.makedirs('python2/bin ...
- Python哈希表的例子:dict、set
dict(字典) Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度. 和list比较,dic ...
- ELFhash - 优秀的字符串哈希算法
ELFhash - 优秀的字符串哈希算法 2016年10月29日 22:12:37 阅读数:6440更多 个人分类: 算法杂论算法精讲数据结构 所属专栏: 算法与数据结构 版权声明:本文为博主原创 ...
- day22- hashlib模块-摘要算法(哈希算法)
# python的hashlib提供了常见的摘要算法,如md5(md5算法),sha1等等.摘要:digest # 摘要算法又称哈希算法.散列算法. # 它通过一个函数,把任意长度的数据(明文)转换为 ...
- java单向加密算法小结(2)--MD5哈希算法
上一篇文章整理了Base64算法的相关知识,严格来说,Base64只能算是一种编码方式而非加密算法,这一篇要说的MD5,其实也不算是加密算法,而是一种哈希算法,即将目标文本转化为固定长度,不可逆的字符 ...
- [基础技能] 安全技术——哈希算法密码破解之彩虹表(Rainbow Table)学习
1.基础知识 刚刚学习过数字签名的相关知识,以及数字签名的伪造技术,而伪造数字签名归根结底就是密码破解的一个过程,然而直接破解的速度是非常缓慢的,所以有人想出一种办法,直接建立出一个数据文件,里面事先 ...
随机推荐
- 离线安装IE 11
转自:http://blog.sina.com.cn/s/blog_711ab1b10102wzq1.html 1.在D盘下,新建文件夹,取名为“ie”. 2.将官网下载的IE11离线包放到此文件夹中 ...
- [模板] K-D Tree
K-D Tree K-D Tree可以看作二叉搜索树的高维推广, 它的第 \(k\) 层以所有点的第 \(k\) 维作为关键字对点做出划分. 为了保证划分均匀, 可以以第 \(k\) 维排名在中间的节 ...
- java基础1之引用数据类型
5种引用类型(对象类型) 类 接口 数组 枚举 标注 类 类在JVM的内存空间的存储 (1). Heap 堆空间:分配对象 new Student() 存放引用数据类型的实例 (2). Stack 栈 ...
- windows下使用hbase/opencv/ffmpeg小记
1.hadoop安装 不同于Ubuntu,win 10下使用hbase需安装hadoop环境,这里有几个坑,首先14年以后,hadoop已不再发布window版本,这里可往官网 http://hado ...
- 洛谷P1258 小车问题(题解)
https://www.luogu.org/problemnew/show/P1258(题目传送) 看题的第一眼就把题归为二分题,一直向着二分的方向走,却忽略了数学的推理.推理一番后(看了题解),发现 ...
- django系列7:修改404页面展示,优化模板,降低urlconf和模板之间的耦合,命名app将模板和app绑定
为了增加程序的友好和健壮性,修改view代码,处理以下如果出现404,页面的UI展示. 修改view代码 from django.http import Http404 from django.sho ...
- ruby 对象转换哈希(Hash)
通过 ActiveRecord 从数据库的某张数据表(table)中获取的对象如何转换成为 Hash orders_table 是一张订单信息表,对应的 model 为 Orders @order = ...
- 第八节: EF的性能篇(一) 之 EF自有方法的性能测试
一. 开发中常见的性能问题 我们在日常开发过程中,由于一些不好的习惯,经常会导致所写的代码性能低下,却毫无发觉,下面就总结一下常见的一些性能问题. 1. 真假分页 ① 假分页: db.xxx.toLi ...
- [Android] Android 锁屏实现与总结 (二)
上接: [Android] Android 锁屏实现与总结 (一) 系列文章链接如下: [Android] Android 锁屏实现与总结 (一) [Android] Android 锁屏实现与总结 ...
- nginx禁止ip登录,只允许域名访问
公司要求,线上solr.kibana要求只能通过域名进行访问,禁止用ip+端口进行登录访问,那么,下面介绍下我是如何实现的 1.禁止ip,允许域名访问 如下图,默认安装好nginx,不让ip方式访问, ...