第二十七篇玩转数据结构——集合（Set）与映射（Map）

1.. 集合的应用

集合可以用来去重
集合可以用于进行客户的统计
集合可以用于文本词汇量的统计

2.. 集合的实现

定义集合的接口

Set<E>

·void add(E)   // 不能添加重复元素

·void remove(E)

·boolean contains(E)

·int getSize()

·boolean isEmpty()

集合接口的业务逻辑如下：

public interface Set<E> {

    void add(E e);

    void remove(E e);

    boolean contains(E e);

    int getSize();

    boolean isEmpty();

}

用二分搜索树作为集合的底层实现

public class BSTSet<E extends Comparable<E>> implements Set<E> {

    private BST<E> bst;

    // 构造函数

    public BSTSet() {

        bst = new BST<>();

    }

    // 实现getSize方法

    @Override

    public int getSize() {

        return bst.size();

    }

    // 实现isEmpty方法

    @Override

    public boolean isEmpty() {

        return bst.isEmpty();

    }

    // 实现contains方法

    @Override

    public boolean contains(E e) {

        return bst.contains(e);

    }

    // 实现add方法

    public void add(E e) {

        bst.add(e);

    }

    // 实现remove方法

    public void remove(E e) {

        bst.remove(e);

    }

}

用链表作为集合的底层实现

public class LinkedListSet<E> implements Set<E> {

    private LinkedList<E> list;

    // 构造函数

    public LinkedListSet() {

        list = new LinkedList<>();

    }

    // 实现getSize方法

    @Override

    public int getSize() {

        return list.getSize();

    }

    // 实现isEmpty方法

    @Override

    public boolean isEmpty() {

        return list.isEmpty();

    }

    // 实现contains方法

    @Override

    public boolean contains(E e) {

        return list.contains(e);

    }

    // 实现add方法

    @Override

    public void add(E e) {

        if (!list.contains(e)) {

            list.addFirst(e);

        }

    }

    // 实现remove方法

    @Override

    public void remove(E e) {

        list.removeElement(e);

    }

用二分搜索树实现的集合与用链表实现的集合的性能比较

import java.util.ArrayList;

public class Main {

    public static double testSet(Set<String> set, String filename) {

        long startTime = System.nanoTime();

        System.out.println(filename);

        ArrayList<String> words = new ArrayList<>();

        if (FileOperation.readFile(filename, words)) {

            System.out.println("Total words: " + words.size());

            for (String word : words) {

                set.add(word);

            }

            System.out.println("Total different words: " + set.getSize());

        }

        long endTime = System.nanoTime();

        return (endTime - startTime) / 1000000000.0;

    }

    public static void main(String[] args) {

        String filename = "pride-and-prejudice.txt";

        BSTSet<String> bstSet = new BSTSet<>();

        double time1 = testSet(bstSet, filename);

        System.out.println("BSTSet, time: " + time1 + " s");

        System.out.println();

        LinkedListSet<String> linkedListSet = new LinkedListSet<>();

        double time2 = testSet(linkedListSet, filename);

        System.out.println("LinkedListSet, time: " + time2 + " s");

    }

}

输出结果：

pride-and-prejudice.txt

Total words: 125901

Total different words: 6530

BSTSet, time: 0.109504342 s

pride-and-prejudice.txt

Total words: 125901

Total different words: 6530

LinkedListSet, time: 2.208894105 s

通过比较结果，我们发现，用二分搜索树实现的集合的比用链表实现的集合更加高效

3.. 集合的时间复杂度分析

上图中"h"是二分搜索树的高度
当二分搜索树"满"的时候，性能是最佳的，时间复杂度为O(logn)；当二分搜索树退化为链表的时候，性能是最差的，时间复杂度为O(n)

4.. 映射（Map）

映射是存储（键，值）数据对的数据结构（Key, Value）
根据键（Key），寻找值（Value）

5.. 映射的实现

定义映射的接口

Map<K, V>

·void add(K, V)

·V remove(K)

·boolean contains(K)

·V get(K)

·void set(K, V)

·int getSize()

·boolean isEmpty()

映射接口的业务逻辑如下

public interface Map<K, V> {

    void add(K key, V value);

    V remove(K key);

    boolean contains(K key);

    V get(K key);

    void set(K key, V value);

    int getSize();

    boolean isEmpty();

}

用链表作为映射的底层实现

public class LinkedListMap<K, V> implements Map<K, V> {

    private class Node {

        public K key;

        public V value;

        public Node next;

        public Node(K key, V value, Node next) {

            this.key = key;

            this.value = value;

            this.next = next;

        }

        public Node(K key) {

            this(key, null, null);

        }

        public Node() {

            this(null, null, null);

        }

        @Override

        public String toString() {

            return key.toString() + " : " + value.toString();

        }

    }

    private Node dummyHead;

    private int size;

    // 构造函数

    public LinkedListMap() {

        dummyHead = new Node();

        size = 0;

    }

    // 实现getSize方法

    @Override

    public int getSize() {

        return size;

    }

    // 实现isEmpty方法

    @Override

    public boolean isEmpty() {

        return size == 0;

    }

    private Node getNode(K key) {

        Node cur = dummyHead;

        while (cur != null) {

            if (cur.key.equals(key)) {

                return cur;

            }

            cur = cur.next;

        }

        return null;

    }

    // 实现contains方法

    @Override

    public boolean contains(K key) {

        return getNode(key) != null;

    }

    // 实现get方法

    @Override

    public V get(K key) {

        Node node = getNode(key);

        // return node == null ? null : node.value;

        if (node != null) {

            return node.value;

        }

        return null;

    }

    // 实现add方法

    public void add(K key, V value) {

        Node node = getNode(key);

        if (node == null) {

            dummyHead.next = new Node(key, value, dummyHead.next);

            size++;

        } else {

            node.value = value;

        }

    }

    // 实现set方法

    public void set(K key, V newValue) {

        Node node = getNode(key);

        if (node == null) {

            throw new IllegalArgumentException(key + " doesn't exist.");

        } else {

            node.value = newValue;

        }

    }

    // 实现remove方法

    public V remove(K key) {

        Node node = getNode(key);

        if (node == null) {

            throw new IllegalArgumentException(key + " doesn't exist.");

        }

        Node prev = dummyHead;

        while (prev.next != null) {

            if (prev.next.key.equals(key)) {

                break;

            }

            prev = prev.next;

        }

        if (prev.next != null) {

            Node delNode = prev.next;

            prev.next = delNode.next;

            delNode.next = null;

            size--;

            return delNode.value;

        }

        return null;

    }

}

用二分搜索树作为映射的底层实现

public class BSTMap<K extends Comparable<K>, V> implements Map<K, V> {

    private class Node {

        private K key;

        private V value;

        private Node left;

        private Node right;

        // 构造函数

        public Node(K key, V value) {

            this.key = key;

            this.value = value;

            this.left = null;

            this.right = null;

        }

//        public Node(K key) {

//            this(key, null);

//        }

    }

    private Node root;

    private int size;

    // 构造函数

    public BSTMap() {

        root = null;

        size = 0;

    }

    // 实现getSize方法

    @Override

    public int getSize() {

        return size;

    }

    // 实现isEmpty方法

    public boolean isEmpty() {

        return size == 0;

    }

    // 实现add方法

    @Override

    public void add(K key, V value) {

        root = add(root, key, value);

    }

    // 向以node为根节点的二分搜索树中插入元素(key, value)，递归算法

    // 返回插入新元素后的二分搜索树的根

    private Node add(Node node, K key, V value) {

        if (node == null) {

            size++;

            return new Node(key, value);

        }

        if (key.compareTo(node.key) < 0) {

            node.left = add(node.left, key, value);

        } else if (key.compareTo(node.key) > 0) {

            node.right = add(node.right, key, value);

        } else {

            node.value = value;

        }

        return node;

    }

    // 返回以node为根节点的二分搜索树中，key所在的节点

    private Node getNode(Node node, K key) {

        if (node == null)

            return null;

        if (key.compareTo(node.key) < 0) {

            return getNode(node.left, key);

        } else if (key.compareTo(node.key) > 0) {

            return getNode(node.right, key);

        } else {

            return node;

        }

    }

    @Override

    public boolean contains(K key) {

        return getNode(root, key) != null;

    }

    @Override

    public V get(K key) {

        Node node = getNode(root, key);

        return node == null ? null : node.value;

    }

    @Override

    public void set(K key, V newValue) {

        Node node = getNode(root, key);

        if (node == null)

            throw new IllegalArgumentException(key + " doesn't exist!");

        node.value = newValue;

    }

    // 返回以node为根的二分搜索树的最小元素所在节点

    private Node minimum(Node node) {

        if (node.left == null) {

            return node;

        }

        return minimum(node.left);

    }

    // 删除掉以node为根的二分搜索树中的最小元素所在节点

    // 返回删除节点后新的二分搜索树的根

    private Node removeMin(Node node) {

        if (node.left == null) {

            Node rightNode = node.right;

            node.right = null;

            size--;

            return rightNode;

        }

        node.left = removeMin(node.left);

        return node;

    }

    // 实现remove方法

    // 删除二分搜索树中键为key的节点

    @Override

    public V remove(K key) {

        Node node = getNode(root, key);

        if (node != null) {

            root = remove(root, key);

            return node.value;

        }

        return null;

    }

    // 删除以node为根节点的二分搜索树中键为key的节点，递归算法

    // 返回删除节点后新的二分搜索树的根

    private Node remove(Node node, K key) {

        if (node == null) {

            return null;

        }

        if (key.compareTo(node.key) < 0) {

            node.left = remove(node.left, key);

            return node;

        } else if (key.compareTo(node.key) > 0) {

            node.right = remove(node.right, key);

            return node;

        } else {

            // 待删除节点左子树为空的情况

            if (node.left == null) {

                Node rightNode = node.right;

                node.right = null;

                size--;

                return rightNode;

                // 待删除节点右子树为空的情况

            } else if (node.right == null) {

                Node leftNode = node.left;

                node.left = null;

                size--;

                return leftNode;

                // 待删除节点左右子树均不为空

                // 找到比待删除节点大的最小节点，即待删除节点右子树的最小节点

                // 用这个节点顶替待删除节点

            } else {

                Node successor = minimum(node.right);

                successor.right = removeMin(node.right);  //这里进行了size--操作

                successor.left = node.left;

                node.left = null;

                node.right = null;

                return successor;

            }

        }

    }

}

用二分搜索树实现的映射与用链表实现的映射的性能比较

import java.util.ArrayList;

public class Main {

    public static double testMap(Map<String, Integer> map, String filename) {

        long startTime = System.nanoTime();

        System.out.println(filename);

        ArrayList<String> words = new ArrayList<>();

        if (FileOperation.readFile(filename, words)) {

            System.out.println("Total words: " + words.size());

            for (String word : words) {

                if (map.contains(word)) {

                    map.set(word, map.get(word) + 1);

                } else {

                    map.add(word, 1);

                }

            }

            System.out.println("Total different words: " + map.getSize());

            System.out.println("Frequency of PRIDE: " + map.get("pride"));

            System.out.println("Frequency of PREJUDICE: " + map.get("prejudice"));

        }

        long endTime = System.nanoTime();

        return (endTime - startTime) / 1000000000.0;

    }

    public static void main(String[] args) {

        String filename = "pride-and-prejudice.txt";

        LinkedListMap<String, Integer> linkedListMap = new LinkedListMap<>();

        double time1 = testMap(linkedListMap, filename);

        System.out.println("Linked List Map, time: " + time1 + " s");

        System.out.println();

        System.out.println();

        BSTMap<String, Integer> bstMap = new BSTMap<>();

        double time2 = testMap(bstMap, filename);

        System.out.println("BST Map, time: " + time2 + " s");

    }

}

输出结果

pride-and-prejudice.txt

Total words: 125901

Total different words: 6530

Frequency of PRIDE: 53

Frequency of PREJUDICE: 11

Linked List Map, time: 9.692566895 s

pride-and-prejudice.txt

Total words: 125901

Total different words: 6530

Frequency of PRIDE: 53

Frequency of PREJUDICE: 11

BST Map, time: 0.085364242 s

通过比较结果，我们发现，用二分搜索树实现的映射的比用链表实现的映射更加高效

6.. 映射的时间复杂度

上图中"h"是二分搜索树的高度
当二分搜索树"满"的时候，性能是最佳的，时间复杂度为O(logn)；当二分搜索树退化为链表的时候，性能是最差的，时间复杂度为O(n)

第二十七篇玩转数据结构——集合（Set）与映射（Map）的更多相关文章

第二十三篇玩转数据结构——栈（Stack）
1.. 栈的特点: 栈也是一种线性结构: 相比数组,栈所对应的操作是数组的子集: 栈只能从一端添加元素,也只能从这一端取出元素,这一端通常称之为"栈顶": 向栈中添加元 ...
第二十八篇玩转数据结构——堆（Heap）和有优先队列(Priority Queue)
1.. 优先队列(Priority Queue) 优先队列与普通队列的区别:普通队列遵循先进先出的原则:优先队列的出队顺序与入队顺序无关,与优先级相关. 优先队列可以使用队列的接口,只是在 ...
第二十六篇玩转数据结构——二分搜索树（Binary Search Tree）
1.. 二叉树跟链表一样,二叉树也是一种动态数据结构,即,不需要在创建时指定大小. 跟链表不同的是,二叉树中的每个节点,除了要存放元素e,它还有两个指向其它节点的引用,分别用Node l ...
第二十五篇玩转数据结构——链表（Linked List）
1.. 链表的重要性我们之前实现的动态数组.栈.队列,底层都是依托静态数组,靠resize来解决固定容量的问题,而"链表"则是一种真正的动态数据结构,不需要处理固定容 ...
第二十四篇玩转数据结构——队列（Queue）
1.. 队列基础队列也是一种线性结构: 相比数组,队列所对应的操作数是队列的子集: 队列只允许从一端(队尾)添加元素,从另一端(队首)取出元素: 队列的形象化描述如下图: 队列是一种先进 ...
第二十九篇玩转数据结构——线段树（Segment Tree）
1.. 线段树引入线段树也称为区间树为什么要使用线段树:对于某些问题,我们只关心区间(线段) 经典的线段树问题:区间染色,有一面长度为n的墙,每次选择一段墙进行染色(染色允许覆盖),问 ...
第二十七篇:Windows驱动中的PCI, DMA, ISR, DPC, ScatterGater, MapRegsiter, CommonBuffer, ConfigSpace
近期有些人问我PCI设备驱动的问题, 和他们交流过后, 我建议他们先看一看<<The Windows NT Device Driver Book>>这本书, 个人感觉, 这本书 ...
第三十一篇玩转数据结构——并查集（Union Find）
1.. 并查集的应用场景查看"网络"中节点的连接状态,这里的网络是广义上的网络数学中的集合类的实现 2.. 并查集所支持的操作对于一组数据,并查集主要支持两种操作:合并两 ...
第二十七篇 -- QTreeWidget总结
前言之前写过几篇关于TreeWidget的文章,不过不方便查阅,特此重新整合作为总结.不过关于QtDesigner画图,还是不重新写了,看第一篇就OK. 准备工作 1. 用QtDesigner画 ...

随机推荐

题解【洛谷P1896】[SCOI2005]互不侵犯
题面棋盘类状压 DP 经典题. 我们考虑设 $dp_{i,j,s}$ 表示前 $i$ 行已经摆了 $j$ 个国王,且第 $i$ 行国王摆放的状态为 $s$ 的合法方案数. 转移的 ...
使用VSCode创建简单的Razor Webapp--1.入门
1.下载vscode,安装dotnet core sdk 在cmd中使用命令dotnet --version可以查看当前安装的版本 2.打开vscode,设置语言和扩展在最左边的工具栏,点击最下面的 ...
Laravel通过用户名和密码查询
一.如果要检查要验证的用户数据是否正确,可以使用: if (Auth::validate($credentials)) { // } 二.但是如果您想通过用户和密码从数据库中获取用户,您可以使用: / ...
jsp报错java.io.IOException: Stream closed
在使用jsp的时候莫名其妙的抛出了这个异常,经过反复检查去掉了网友们说的jsp使用流未关闭,以及tomcat版本冲突等原因,最后发现是书写格式的原因. 当时使用的代码如下 <jsp:inclu ...
C/C++ Windows API——获取系统指定目录（转）
原文地址:C/C++ Windows API——获取系统指定目录经测试,在win10 VS2017中用wprintf()输出正常,SHGetSpecialFolderPath函数也正常运行但是用M ...
mybatis-plus - buildSqlSessionFactory()
一. buildSqlSessionFactory() mybatis-plus 同样的是调用 factory.getObject() 方法来进行 SqlSessionFactory 创建的. 然后 ...
rest_framework:url控制
一.基本路由(原始方式) 二.半自动路由(视图继承ModelViewSet) 三.自动路由(自动生成路由) 准备工作: models中创建一张表,默认使用sqlite数据库,更新表新增测试数据加载 ...
如何面试QA（面试官角度）
面试是一对一或者多对一的沟通,是和候选人互相交换信息.平等的. 面试的目标是选择和雇佣最适合的人选.是为了完成组织目标.协助人力判断候选人是否合适空缺职位. 面试类型: (1)预判面试(查看简历后 ...
java.awt.Font
显示效果 Font mf = new Font(String 字体,int 风格,int 字号);字体:TimesRoman, Courier, Arial等风格:三个常量 lFont.PLAIN, ...
（转）GC ROOTS
还是英文的技术博客更给力,更清楚,本人懒,没有翻译. In your specific example, in any managed environment, Person is not a GC ...

第二十七篇 玩转数据结构——集合（Set）与映射（Map）

第二十七篇 玩转数据结构——集合（Set）与映射（Map）的更多相关文章

随机推荐

热门专题

第二十七篇玩转数据结构——集合（Set）与映射（Map）

第二十七篇玩转数据结构——集合（Set）与映射（Map）的更多相关文章