集合(python)

# -*- coding: utf-8 -*-

class Array(object):

    def __init__(self, size=32, init=None):

        self._size = size

        self._items = [init] * size

    def __getitem__(self, index):

        return self._items[index]

    def __setitem__(self, index, value):

        self._items[index] = value

    def __len__(self):

        return self._size

    def clear(self, value=None):

        for i in range(len(self._items)):

            self._items[i] = value

    def __iter__(self):

        for item in self._items:

            yield item

class Slot(object):

    def __init__(self, key, value):

        self.key, self.value = key, value

class HashTable(object):

    UNUSED = None  # 没被使用过

    EMPTY = Slot(None, None)  # 使用却被删除过

    def __init__(self):

        self._table = Array(8, init=HashTable.UNUSED)   # 保持 2*i 次方

        self.length = 0

    @property

    def _load_factor(self):

        # load_factor 超过 0.8 重新分配

        return self.length / float(len(self._table))

    def __len__(self):

        return self.length

    def _hash(self, key):

        return abs(hash(key)) % len(self._table)

    def _find_key(self, key):

        index = self._hash(key)

        _len = len(self._table)

        while self._table[index] is not HashTable.UNUSED:

            if self._table[index] is HashTable.EMPTY:

                index = (index*5 + 1) % _len

                continue

            elif self._table[index].key == key:

                return index

            else:

                index = (index*5 + 1) % _len

        return None

    def _find_slot_for_insert(self, key):

        index = self._hash(key)

        _len = len(self._table)

        while not self._slot_can_insert(index):

            index = (index*5 + 1) % _len

        return index

    def _slot_can_insert(self, index):

        return (self._table[index] is HashTable.EMPTY or self._table[index] is HashTable.UNUSED)

    def __contains__(self, key):  # in operator

        index = self._find_key(key)

        return index is not None

    def add(self, key, value):

        if key in self:

            index = self._find_key(key)

            self._table[index].value = value

            return False

        else:

            index = self._find_slot_for_insert(key)

            self._table[index] = Slot(key, value)

            self.length += 1

            if self._load_factor >= 0.8:

                self._rehash()

            return True

    def _rehash(self):

        old_table = self._table

        newsize = len(self._table) * 2

        self._table = Array(newsize, HashTable.UNUSED)

        self.length = 0

        for slot in old_table:

            if slot is not HashTable.UNUSED and slot is not HashTable.EMPTY:

                index = self._find_slot_for_insert(slot.key)

                self._table[index] = slot

                self.length += 1

    def get(self, key, default=None):

        index = self._find_key(key)

        if index is None:

            return default

        else:

            return self._table[index].value

    def remove(self, key):

        index = self._find_key(key)

        if index is None:

            raise KeyError()

        value = self._table[index].value

        self.length -= 1

        self._table[index] = HashTable.EMPTY

        return value

    def __iter__(self):

        for slot in self._table:

            if slot not in (HashTable.EMPTY, HashTable.UNUSED):

                yield slot.key

class SetADT(HashTable):

    def add(self, key):

        return super(SetADT, self).add(key, True)

    def __and__(self, other_set):

        """交集 A&B"""

        new_set = SetADT()

        for element_a in self:

            if element_a in other_set:

                new_set.add(element_a)

        return new_set

    def __sub__(self, other_set):

        """差集 A-B"""

        new_set = SetADT()

        for element_a in self:

            if element_a not in other_set:

                new_set.add(element_a)

        return new_set

    def __or__(self, other_set):

        """并集 A|B"""

        new_set = SetADT()

        for element_a in self:

            new_set.add(element_a)

        for element_b in other_set:

            new_set.add(element_b)

        return new_set

def test_set_adt():

    sa = SetADT()

    sa.add(1)

    sa.add(2)

    sa.add(3)

    assert 1 in sa

    sb = SetADT()

    sb.add(3)

    sb.add(4)

    sb.add(5)

    assert sorted(list(sa & sb)) == [3]

    assert sorted(list(sa - sb)) == [1, 2]

    assert sorted(list(sa | sb)) == [1, 2, 3, 4, 5]

if __name__ == '__main__':

    test_set_adt()

集合(python)的更多相关文章

Java集合-Python数据结构比较
Java list与Python list相比较 Java List:有序的,可重复的.(有序指的是集合中对象的顺序与添加顺序相同) Python list(列表)是有序的,可变的. Java Lis ...
面试基础知识集合(python、计算机网络、操作系统、数据结构、数据库等杂记)
python python _.__.__xx__之间的差别 python中range.xrange和randrange的区别 python中 =.copy.deepcopy的差别 python 继承 ...
二叉树题目集合 python
二叉树是被考察频率非常高的数据结构.二叉树是按照“父节点-左子树&右子树”这样的方式,由根节点不断向下扩展,形成一棵树的结构.二叉树经常被提到的三种遍历方式:前序遍历.中序遍历和后序遍历,既是 ...
【Python学习笔记】集合
概述集合的一般操作内建函数进行标准操作集合数学运算符进行标准操作集合集合的应用概述 python的集合(set)是无序不重复元素集,是一种容器.集合(set)中的元素必须是不可变对象,即可用 ...
python 基础 set 集合类型补充
为啥今天又重提这个数据类型呢?平时用的少,等要用起来的时候才发现,自己对这块啥都不知道了,so,今天就把这块再梳理一下咯. 一.set集合,是一个无序且不重复的元素集合.这一点是非常重要的. 二.集合 ...
Python 全栈开发二 python基础字符串字典集合
一.字符串 1,在python中,字符串是最为常见的数据类型,一般情况下用引号来创建字符串. >>ch = "wallace" >>ch1 = 'walla ...
Python基础数据类型之集合
Python基础数据类型之集合集合(set)是Python基本数据类型之一,它具有天生的去重能力,即集合中的元素不能重复.集合也是无序的,且集合中的元素必须是不可变类型. 一.如何创建一个集合 #1 ...
Python学习——集合
集合 python中的集合和数学上集合具有基本相同的性质,此处不再赘述. 1.创建集合的两种方法 #直接创建 num={1,2,3,4,5} #利用set方法创建 num1=set([1,2,3,4, ...
Python 学习第14篇：数据类型（元组和集合）
元组和集合是Python中的基本类型一,元组元组(tuple)由小括号.逗号和数据对象构成的集合,各个项通过逗号隔开,元组的特点是: 元组项可以是任何数据类型,也可以嵌套元组是一个位置有序的对象 ...

随机推荐

ConfigMap介绍
来源 ConfigMap API资源用来保存key-value pair配置数据,这个数据可以在pods里使用,或者被用来为像controller一样的系统组件存储配置数据.虽然ConfigMap跟S ...
OneNote中更改英文输入默认不是微软雅黑的问题
win10下的终极版解决方案: 1.进入C:\Windows\Fonts找到Calibri字体,点进去后先右键Calibri常规-属性-安全-高级,将所有者从“TrustedInstaller”更改为 ...
autocomplete="off" 在新版chrome中不起作用
autocomplete="off" 在新版chrome中不起作用,还是自动填充了用户名和密码,改为 autocomplete="new-password" ...
Swing的基本操作
package GUI_experience; import java.awt.*; import java.awt.Container; import java.awt.FlowLayout; im ...
PAT(B) 1083 是否存在相等的差（Java）统计
题目链接:1083 是否存在相等的差 (20 point(s)) 题目描述给定 N 张卡片,正面分别写上 1.2.--.N,然后全部翻面,洗牌,在背面分别写上 1.2.--.N.将每张牌的正反两面数 ...
Linux和Windows系统目录结构区别
Windows目录结构图 Linux目录结构图我们所有的操作尽量都要在/home/username目录下进行. 快捷进入家目录方式是cd ~.
RabbitMQ 应用一
(百度百科)MQ全称为Message Queue,消息队列(MQ)是一种应用程序对应用程序的通信方法.应用程序通过读写出入队列的消息(针对应用程序的数据)来通信,而无需专用连接来链接它们.消息传递指的 ...
Python之（scrapy）爬虫
一.Scrapy是Python开发的一个快速.高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据.Scrapy用途广泛,可以用于数据挖掘.监测和自动化测试. Scrapy吸 ...
c#基础知识梳理（一）
一.C#简介 C#是微软公司发布的一种面向对象的.运行于.NET Framework之上的高级程序设计语言.C#看起来与Java有着惊人的相似:它包括了诸如单一继承.接口.与Java几乎同样的语法和编 ...
数据结构之队列(queue)
队列介绍 1.队列是一个有序列表,可以用数组或是链表来实现. 2.遵循先入先出的原则.即:先存入队列的数据,要先取出.后存入的要后取出. 应用场景比如某某银行叫号系统: 数组模拟队列队列本身是有序 ...

集合(python)

集合(python)的更多相关文章

随机推荐

热门专题