K:跳表
跳表(SkipList)是一种随机化的数据结构,目前在redis和leveldb中都有用到它,它的效率和红黑树以及 AVL 树不相上下,但跳表的原理相当简单,只要你能熟练操作链表,
就能轻松实现一个 SkipList。
考虑一个有序表:
从该有序表中搜索元素 < 23, 43, 59 >,需要比较的次数分别为 < 2, 4, 6 >,总共比较的次数为 2 + 4 + 6 = 12 次。
有没有优化的算法吗?链表是有序的,但不能使用二分查找。类似二叉搜索树,我们把一些节点提取出来,作为索引。得到如下结构:
这里我们把 < 14, 34, 50, 72 >提取出来作为一级索引,这样搜索的时候就可以减少比较次数了。
我们还可以再从一级索引提取一些元素出来,作为二级索引,变成如下结构:
这里元素不多,体现不出优势,如果元素足够多,这种索引结构就能体现出优势来了。
这基本上就是跳表的核心思想,其实也是一种通过“空间来换取时间”的一个算法,通过在每个节点中增加了向前的指针,从而提升查找的效率。
从上面的例子中可以看出,调表具有如下性质:
由很多层结构组成
每一层都是一个有序的链表
最底层(Level 1)的链表包含所有元素
如果一个元素出现在 Level i 的链表中,则它在 Level i 之下的链表也都会出现。
每个节点包含两个指针,一个指向同一链表中的下一个元素,一个指向下面一层的元素。
以下介绍跳表的基本操作:
- 搜索:
跳表的搜索操作,其先在高层节点中查找,之后逐步缩小范围,向下层查找。
例子:查找元素 117
(1) 比较 21, 比 21 大,往后面找
(2) 比较 37, 比 37大,比链表最大值小,从 37 的下面一层开始找
(3) 比较 71, 比 71 大,比链表最大值小,从 71 的下面一层开始找
(4) 比较 85, 比 85 大,从后面找
(5) 比较 117, 等于 117, 找到了节点。
- 插入:
跳表的插入,需要解决的一个问题是,要插入的元素所占用的层数,当所有的元素层数过多时,其高层链表充当索引的作用便没有多大的作用。当层数过少时,其效率又不高。最理想的状态是二分的情况,当前层的元素是下面一层的元素的一般,以此类推。但是,这样又存在一个问题是要花费大量精力去调整维护该链表以维持该平衡状态。
聪明的是,跳表的发明者,采用了一种抛硬币的方式解决了这个问题,使每层的元素节点的个数的期望值为下层链表节点元素数目的1/2。
当要插入一个元素的时候,先抛硬币决定当前插入元素的层数,抛一枚硬币,当遇到正面,继续丢,遇到反面,则停止。在这过程中,硬币正面出现的次数,即为该元素节点的层数。用实验中丢硬币的次数 K 作为元素占有的层数。显然随机变量 K 满足参数为 p = 1/2 的几何分布,K 的期望值 E[K] = 1/p = 2.就是说,各个元素的层数,期望值是 2 层。
示例如下:
先确定该元素要占据的层数K(采用丢硬币的方式,这完全是随机的)
然后在 Level 1 ... Level K 各个层的链表都插入元素。
例子:插入 119, K = 2
如果 K 大于链表的层数,则要添加新的层。
例子:插入 119, K = 4
- 删除:
在各个层中找到包含 x 的节点,使用标准的 delete from list 方法删除该节点
例子:删除 71
对于删除操作,需要注意的是,应当采用逐层查找,逐个删除的方式,而不能再某一层找到相应的元素节点之后,便直接往下层删除其前继节点的方式。
跳表的相关性能分析:
- 跳表的时间复杂度:
其搜索,插入,删除操作的时间复杂度为O(lgn)
- 跳表的空间复杂度:
根据上面插入一个元素的过程的分析,每个元素的期望高度为2,一个大小为n的跳表,其节点数目的期望值是 2n。其空间复杂度为O(n)
以下附上java实现的跳表代码:
代码来源于java实现跳跃表
import java.util.ArrayList;
import java.util.List;
import java.util.Random;
/**
* Created by author on 2017/10/9.
* 实现跳跃表:能够对递增链表实现logN的查询时间
*/
public class SkipList<T> {
public static void main(String[] args) {
//测试随机数生成的结果对二取模,结果是否是接近于0.5
// Random r = new Random(47);
// int t = 1, a = 1;
// while (a < 10000000) {
// a++;
// if (r.nextInt() % 2 == 0)
// t++;
// }
// System.out.println(t * 1.0 / a);
SkipList<String> list = new SkipList<>();
list.put(1.0, "1.0");
System.out.println(list);
list.put(2.0, "2.0");
System.out.println(list);
list.put(3.0, "3.0");
System.out.println(list);
list.put(4.0, "4.0");
System.out.println(list);
list.put(4.0, "5.0");
System.out.println(list);
list.delete(3.0);
list.delete(3.5);
System.out.println(list);
System.out.println("查找4.0" + list.get(4.0));
}
/**
* 跳跃表的节点的构成
*
* @param <E>
*/
private static class SkipNode<E> {
E val;//存储的数据
double score;//跳跃表按照这个分数值进行从小到大排序。
SkipNode<E> next, down;//next指针,指向下一层的指针
SkipNode() {
}
SkipNode(E val, double score) {
this.val = val;
this.score = score;
}
}
private static final int MAX_LEVEL = 1 << 6;
//跳跃表数据结构
private SkipNode<T> top;
private int level = 0;
//用于产生随机数的Random对象
private Random random = new Random();
public SkipList() {
//创建默认初始高度的跳跃表
this(4);
}
//跳跃表的初始化
public SkipList(int level) {
this.level = level;
int i = level;
SkipNode<T> temp = null;
SkipNode<T> prev = null;
while (i-- != 0) {
temp = new SkipNode<T>(null, Double.MIN_VALUE);
temp.down = prev;
prev = temp;
}
top = temp;//头节点
}
/**
* 产生节点的高度。使用抛硬币
*
* @return
*/
private int getRandomLevel() {
int lev = 1;
while (random.nextInt() % 2 == 0)
lev++;
return lev > MAX_LEVEL ? MAX_LEVEL : lev;
}
/**
* 查找跳跃表中的一个值
*
* @param score
* @return
*/
public T get(double score) {
SkipNode<T> t = top;
while (t != null) {
if (t.score == score)
return t.val;
if (t.next == null) {
if (t.down != null) {
t = t.down;
continue;
} else
return null;
}
if (t.next.score > score) {
t = t.down;
} else
t = t.next;
}
return null;
}
public void put(double score, T val) {
//1,找到需要插入的位置
SkipNode<T> t = top, cur = null;//若cur不为空,表示当前score值的节点存在
List<SkipNode<T>> path = new ArrayList<>();//记录每一层当前节点的前驱节点
while (t != null) {
if (t.score == score) {
cur = t;
break;//表示存在该值的点,表示需要更新该节点
}
if (t.next == null) {
path.add(t);//需要向下查找,先记录该节点
if (t.down != null) {
t = t.down;
continue;
} else {
break;
}
}
if (t.next.score > score) {
path.add(t);//需要向下查找,先记录该节点
if (t.down == null) {
break;
}
t = t.down;
} else
t = t.next;
}
if (cur != null) {
while (cur != null) {
cur.val = val;
cur = cur.down;
}
} else {//当前表中不存在score值的节点,需要从下到上插入
int lev = getRandomLevel();
if (lev > level) {//需要更新top这一列的节点数量,同时需要在path中增加这些新的首节点
SkipNode<T> temp = null;
SkipNode<T> prev = top;//前驱节点现在是top了
while (level++ != lev) {
temp = new SkipNode<T>(null, Double.MIN_VALUE);
path.add(0, temp);//加到path的首部
temp.down = prev;
prev = temp;
}
top = temp;//头节点
level = lev;//level长度增加到新的长度
}
//从后向前遍历path中的每一个节点,在其后面增加一个新的节点
SkipNode<T> downTemp = null, temp = null, prev = null;
// System.out.println("当前深度为"+level+",当前path长度为"+path.size());
for (int i = level - 1; i >= level - lev; i--) {
temp = new SkipNode<T>(val, score);
prev = path.get(i);
temp.next = prev.next;
prev.next = temp;
temp.down = downTemp;
downTemp = temp;
}
}
}
/**
* 根据score的值来删除节点。
*
* @param score
*/
public void delete(double score) {
//1,查找到节点列的第一个节点的前驱
SkipNode<T> t = top;
while (t != null) {
if (t.next == null) {
t = t.down;
continue;
}
if (t.next.score == score) {
// 在这里说明找到了该删除的节点
t.next = t.next.next;
t = t.down;
//删除当前节点后,还需要继续查找之后需要删除的节点
continue;
}
if (t.next.score > score)
t = t.down;
else
t = t.next;
}
}
@Override
public String toString() {
StringBuilder sb = new StringBuilder();
SkipNode<T> t = top, next = null;
while (t != null) {
next = t;
while (next != null) {
sb.append(next.score + " ");
next = next.next;
}
sb.append("\n");
t = t.down;
}
return sb.toString();
}
}
博文参考自:SkipList跳表基本原理 和 java实现跳跃表
K:跳表的更多相关文章
- SkipList 跳表
1.定义描述 跳跃列表(也称跳表)是一种随机化数据结构,基于并联的链表,其效率可比拟于二叉查找树(对于大多数操作需要O(log n)平均时间). 基本上,跳跃列表是对有序的链表增加 ...
- [转载] 跳表SkipList
原文: http://www.cnblogs.com/xuqiang/archive/2011/05/22/2053516.html leveldb中memtable的思想本质上是一个skiplist ...
- 跳表SkipList
原文:http://www.cnblogs.com/xuqiang/archive/2011/05/22/2053516.html 跳表SkipList 1.聊一聊跳表作者的其人其事 2. 言归正 ...
- skiplist 跳表(1)
最近学习中遇到一种新的数据结构,很实用,搬过来学习. 原文地址:skiplist 跳表 为什么选择跳表 目前经常使用的平衡数据结构有:B树,红黑树,AVL树,Splay Tree, Treep等. ...
- levelDB跳表实现
跳表的原理就是利用随机性建立索引,加速搜索,并且简化代码实现难度.具体的跳表原理不再赘述,主要是看了levelDB有一些实现细节的东西,凸显自己写的实现不足之处. 去除冗余的key template& ...
- SkipList跳表基本原理
为什么选择跳表 目前经常使用的平衡数据结构有:B树,红黑树,AVL树,Splay Tree, Treep等. 想象一下,给你一张草稿纸,一只笔,一个编辑器,你能立即实现一颗红黑树,或者AVL树 出来吗 ...
- 算法进阶面试题06——实现LFU缓存算法、计算带括号的公式、介绍和实现跳表结构
接着第四课的内容,主要讲LFU.表达式计算和跳表 第一题 上一题实现了LRU缓存算法,LFU也是一个著名的缓存算法 自行了解之后实现LFU中的set 和 get 要求:两个方法的时间复杂度都为O(1) ...
- 跳表(skiplist)Python实现
# coding=utf-8 # 跳表的Python实现 import random # 最高层数设置为4 MAX_LEVEL = 4 def randomLevel(): ""& ...
- 跳表 SkipList
跳表是平衡树的一种替代的数据结构,和红黑树不同,跳表对树的平衡的实现是基于一种随机化的算法,这样就使得跳表的插入和删除的工作比较简单. 跳表是一种复杂的链表,在简单链表的节点信息之上又增加了额 ...
随机推荐
- 盗墓笔记—阿里旺旺ActiveX控件imageMan.dll栈溢出漏洞研究
本文作者:i春秋作家——cq5f7a075d 也许现在还研究Activex就是挖坟,但是呢,笔者是摸金校尉,挖坟,呸!盗墓是笔者的本职工作. 额,不扯了,本次研究的是阿里旺旺ActiveX控件imag ...
- dos新建文件夹 新建文件
https://jingyan.baidu.com/article/49ad8bceb0237f5834d8fa19.html 新建文件夹: mkdir kkk 新建kkk文件夹 新建文件: type ...
- 【javascript】iOS Safari 中点击事件失效的解决办法
问题描述 当使用委托给一个元素添加click事件时,如果事件是委托到 document 或 body 上,并且委托的元素是默认不可点击的(如 div, span 等),此时 click 事件会失效. ...
- Tcp下载文件
一.下载文件 tcp 客户端 1.创建套接字down_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)2.获取ip,portdown ...
- 《JAVA与模式》之代理模式
在阎宏博士的<JAVA与模式>一书中开头是这样描述代理(Proxy)模式的: 代理模式是对象的结构模式.代理模式给某一个对象提供一个代理对象,并由代理对象控制对原对象的引用. 代理模式的结 ...
- python多态和鸭子类型
多态与多态性 多态指的是一类事物有多种形态,(一个抽象类有多个子类,因而多态的概念依赖于继承). 比如:文件分为文本文件,可执行文件(在定义角度) 比如 我们按下 F1 键这个动作: 如果当前在 Fl ...
- 【xsy1214】 异或路径(xorpath) 点分治+可持久化trie
题目大意:给你一棵$n$个点的树,每个点有一个点权$x$,问你所有路径中点权异或和最大的路径的异或和 数据范围:$n≤30000$,$x≤2^{31}-1$. 如果是边上有点权的话非常简单,直接一个$ ...
- windows7下部署tomcat
需要准备的软件: 1.JDK 安装程序 2.Tomcat 安装程序 JDK安装步骤: 安装方式:使用安装程序进行安装.使用JDK文件夹,免安装,以下步骤使用的是文件夹免安装,只需配置环境变量 配置环境 ...
- 用Python玩转数据——第五周数据统计和可视化
一.数据获取 1.本地数据 with 语句,pd.read_csv('data.csv') 2.网站上数据 2.1 直接获取网页源码,在用正则表达式进行删选 2.2 API接口获取---以豆瓣为例 i ...
- js集合set类的实现
js集合set类的实现 /*js集合set类的实现*/ function Set() { this.dataStore = []; this.add = add;//新增元素 this.remove ...