Merkle 树 图 1.5.6.1 - Merkle 树示例 默克尔树(又叫哈希树)是一种二叉树,由一个根节点.一组中间节点和一组叶节点组成.最下面的叶节点包含存储数据或其哈希值,每个中间节点是它的两个孩子节点内容的哈希值,根节点也是由它的两个子节点内容的哈希值组成. 进一步的,默克尔树可以推广到多叉树的情形. 默克尔树的特点是,底层数据的任何变动,都会传递到其父亲节点,一直到树根. 默克尔树的典型应用场景包括: 快速比较大量数据:当两个默克尔树根相同时,则意味着所代表的数据必然相同. 快速定…
回到目录 空间与时间 空间换时间是在数据库中经常出现的术语,简单说就是把查询需要的条件进行索引的存储,然后查询时为O(1)的时间复杂度来快速获取数据,从而达到了使用空间存储来换快速的时间响应!对于redis这个k/v存储系统来说,复杂的查询不是它所建议的,它的优势在于通过key快速定位数据,它定位数据的速度与数据多少没有直接关系,无论是1万还是1亿数据,它定位的时间复杂度都是O(1),而在实际使用中,可能不简单使用key定位数据就够了,可能还需要数据里的某个属性去定位数据,这种情况第一感觉不能用…
空间与时间 空间换时间是在数据库中经常出现的术语,简单说就是把查询需要的条件进行索引的存储,然后查询时为O(1)的时间复杂度来快速获取数据,从而达到了使用空间存储来换快速的时间响应!对于redis这个k/v存储系统来说,复杂的查询不是它所建议的,它的优势在于通过key快速定位数据,它定位数据的速度与数据多少没有直接关系,无论是1万还是1亿数据,它定位的时间复杂度都是O(1),而在实际使用中,可能不简单使用key定位数据就够了,可能还需要数据里的某个属性去定位数据,这种情况第一感觉不能用redis…
5.2  内联函数 通过5.1节的学习我们知道,系统为了实现函数调用会做很多额外的幕后工作:保存现场.对参数进行赋值.恢复现场等等.如果函数在程序内被多次调用,且其本身比较短小,可以很快执行完毕,那么,在完成这个函数调用的时候,系统花在完成这些幕后工作上的时间将远大于最核心的函数本身执行的时间,这就像好钢用在了刀背上,将极大地减低程序的性能.为了解决这个问题,C++提供了内联函数的机制,通过将函数代码内联到函数调用的地方,避免函数调用过程中的那些幕后工作,从而提高这种短小的函数被重复多次调用的性…
计数排序就是利用空间换时间,时间复杂度O(n+k) n是元素个数,k是最大数的个数: 统计每个数比他小的有多少,比如比a[i]小的有x个,那么a[i]应该排在x+1的位置 代码: /* * @Author: LyuC * @Date: 2017-10-11 21:24:27 * @Last Modified by: LyuC * @Last Modified time: 2017-10-11 21:39:36 */ #include <bits/stdc++.h> #define MAXN 1…
我们知道,AtomicLong的实现方式是内部有个value 变量,当多线程并发自增,自减时,均通过CAS 指令从机器指令级别操作保证并发的原子性. // setup to use Unsafe.compareAndSwapLong for updates private static final Unsafe unsafe = Unsafe.getUnsafe(); private static final long valueOffset; /** * Records whether the…
题目描述: Given an arbitrary ransom note string and another string containing letters from all the magazines, write a function that will return true if the ransom note can be constructed from the magazines ; otherwise, it will return false. Each letter i…
1.应用场景 实时数据流通过kafka后,根据业务需求,一部分直接借助kafka-connector入Elasticsearch不同的索引中. 另外一部分,则需要先做聚类.分类处理,将聚合出的分类结果存入ES集群的聚类索引中.如下图所示: 业务系统的分层结构可分为:接入层.数据处理层.数据存储层.接口层. 那么问题来了? 我们需要基于聚合(数据处理层)的结果实现检索和聚合分析操作,如何实现更快的检索和更高效的聚合分析效果呢? 2.方案选型 方案一: 只建立一个索引,aggs_index. 数据处…
对于数论的学习比较的碎片化,所以开了一篇随笔来记录一下学习中遇到的一些坑,主要通过题目来讲解 本题围绕:素数筛选法与空间换时间 HDU4548美素数 题目描述 小明对数的研究比较热爱,一谈到数,脑子里就涌现出好多数的问题,今天,小明想考考你对素数的认识.问题是这样的:一个十进制数,如果是素数,而且它的各位数字和也是素数,则称之为“美素数”,如29,本身是素数,而且2+9 = 11也是素数,所以它是美素数.给定一个区间,你能计算出这个区间内有多少个美素数吗? 输入 第一行输入一个正整数T,表示总共…
我们怎么衡量一个函数/代码块/算法的优劣呢?这需要从多个角度看待.本篇笔记我们先不考虑代码可读性.规范性.可移植性那些角度. 在我们嵌入式中,我们需要根据实际资源的情况来设计我们的代码.比如当我们能用的存储器空间极其有限的情况,我之前就有遇到这样子的情况,我能用的flash空间只有4KB,但是要实现的功能很多,稍微不注意就会超了,这种情况下我们就得多考虑程序占用方面的问题.如果我们的存储器空间很足,有时候可以牺牲一些存储器空间来换取我们程序的运行速度.查表法就是 以空间换取时间 的典型例子.下面…
Skip List的提出已有二十多年[Pugh, W. (1990)],却依旧应用广泛(Redis.LevelDB等).作为平衡树(AVL.红黑树.伸展树.树堆)的替代方案,虽然它性能不如平衡树稳定,但是在实现难度上却很有优势.它的查询.插入.删除等主要操作时间复杂度也都是Θ(lgn),空间复杂度是Θ(n). 一个Skip List的结构如下图,除了数据域,每个节点还包括1个或多个域用来保存后续节点的位置. 从结构上看,Skip List通过增加层数,节点上可以带有更多的信息,通过这些信息可以直…
转自:http://www.infoq.com/cn/articles/best-practice-of-cassandra-data-model-design 不要把Cassandra model想象成关系型数据库table 取而代之,应该把它想象成事一个有序的map结构. 对于一个新手来说,下面关系型数据库术语常常被对应到Cassandra模型 这种对比可以帮助我们从关系型数据库转换到非关系型数据库.但是当设计Cassandra column famiy的时候请不要这样去类比.取而代之,考虑…
Coins Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 8999    Accepted Submission(s): 3623 Problem Description Whuacmers use coins.They have coins of value A1,A2,A3...An Silverland dollar. One…
/* 题目: 求从1开始的第n个丑数. */ /* 思路: 按顺序列出各个丑数. */ #include<iostream> #include<cstring> #include<vector> #include<algorithm> #include<map> using namespace std; int GetUglyNumber_Solution(int index) { if(index <= 0) return 0; int…
Merkle树 https://www.jianshu.com/p/fc439a8fd0de 所谓比特币交易就是从一个比特币钱包向另一个中转账,每笔交易都有数字签名来保证安全.一个交易一旦发生那么就是对所有人都公开的,每个交易的历史可以最终追溯到相应的比特币最初被挖出来的那个点. 先简单回顾一下比特币交易过程. 其实比特币并不存在于任何地方.有人如果持有比特币,那么他们其实是拥有特定比特币的地址,但是所谓的币并不是直接就存在于这个地址中的,地址就相当于你的银行账户. 有的只是各个地址之间的转账记…
背景 Cassandra的逆熵功能使用Merkle树来检测副本之间的数据不一致. 定义 Merkle树是一种哈希树,其中的叶子包含各个数据块的哈希值,父节点包含其各自的子节点的哈希值.它提供了一种有效的方法来查找副本上存储的数据块中的差异,并减少了传输以比较数据块的数据量. Cassandra的Merkle树(org.apache.cassandra.utils.MerkleTree)的实现使用完美的二叉树,其中每个叶子都包含行值的哈希,每个父节点都包含其左右子节点的哈希.在一棵完美的二叉树中,…
题意:先构造一个词典,然后输入外文单词,输出相应的英语单词. 这道题有4种方法可以做: 1.map 2.字典树 3.快排+二分 4.hash表 参考博客:[解题报告]POJ_2503 字典树,MAP 参考博客:POJ2503两种解法:快速排序+二分查找与哈希表 思路1:可以使用map来做 代码: #include<iostream> #include<stdio.h> #include<string> #include<map> using namespac…
http://www.cnblogs.com/mumuxinfei/p/4441826.html 前言: 我以前在百度的mentor, 在面试时特喜欢考察哈希表. 那时的我满是疑惑和不解, 觉得这东西很基础, 不就的分桶理念(以空间换时间)和散列函数选择吗? 最多再考察点冲突解决方案. 为何不考察类似跳跃表, LSM树等高级数据结构呢? 随着工程实践的积累, 慢慢发现了自己当初的肤浅. 面试的切入点, 最好是大家所熟悉的, 但又能从中深度挖掘/剖析和具有区分度的.  本文结合自己的工程实践, 来…
hash表冲突的解决方法一般有两个方向: 一个是倾向于空间换时间,使用向量加链表可以最大程度的在节省空间的前提下解决冲突. 另外一个倾向于时间换空间,下面是关于这种思路的一种合适表长度的证明过程: 这种思路的主要做法是当位置冲突时使用随后的位置保存数据,但是毫无策略的直接使用随后的位置会造成大量的冲突,于是产生了平方位递增的方法,同时使用双方向交替的递增冲突位. 大家都知道表长度一般选取素数会比较好,那什么样的素数会比较好呢 素数除了2之外,都可以表示为4k+1和4k+3,就是对素数取模,模余要…
Trie.并查集.堆.Hash表: Trie 快速存储和查找字符串集合 字符类型统一,将单词在最后一个字母结束的位置上打上标记 练习题:Trie字符串统计 import java.util.*; public class Main{ static int N = 100010; static int[][] son = new int[N][26]; static int[] con = new int[N]; static int idx =0; static char[] str = new…
[数据结构]Hash表 Hash表也叫散列表,是一种线性数据结构.在一般情况下,可以用o(1)的时间复杂度进行数据的增删改查.在Java开发语言中,HashMap的底层就是一个散列表. 1. 什么是Hash表 Hash表是一种线性数据结构,这种数据结构的底层一般是通过数组来实现的.在进行数据增删改查的时候,Hash表首先通过Hash函数对某个键值进行Hash操作,这个Hash操作会将这个键映射到数组的某个下标,获得下标以后就可以直接对数组中的数据进行操作了.理论上讲,Hash表数据操作的时间复杂…
转载请声明出处哦~,本篇文章发布于luozhiyun的博客:https://www.luozhiyun.com/archives/667 本文使用的Redis 5.0源码 概述 我们在学习 Redis 的 Hash 表的时候难免脑子里会想起其他 Hash 表的实现,然后进行一番对比.通常我们如果要设计一个 Hash 表,那么我们需要考虑这几个问题: 有没有并发操作: Hash冲突如何解决: 以什么样的方式扩容. 对 Redis 来说,首先它是单线程的工作模式,所以不需要考虑并发问题,这题 pas…
当显示多条结果时,存储在变量中非常智能,变量类型会自动转换为一个数组. 在下面的例子中,使用GetType()可以看到$a变量已经不是我们常见的string或int类型,而是Object类型,使用-is操作符来判断是否是个数组,返回True则是数组,返回False则不是. 如果要统计数组的行数,用我们前面学到的一个方法count即可.例如要看一下$a变量值的行数: 数组都有一个下标索引,用于访问其中的值,从0开始.例如我要访问$a第六行结果,在Powershell Console中输入$a[5]…
前言 nginx的hash表有几种不同的种类, 不过都是以ngx_hash_t为基础的, ngx_hash_t是最普通的hash表, 冲突采用的是链地址法, 不过这里冲突的元素不是一个链表, 而是一个数组, 为了加快访存速度,这种hash表只用于存储一些静态的信息, 例如所有头部信息, 配置信息等等. 涉及数据结构 /*hash元素数据结构包含key和value*/ typedef struct { /*hash值*/ void *value; /*hash表原始key的长度, 即name长度*…
数组和Hash表 当显示多条结果时,存储在变量中非常智能,变量类型会自动转换为一个数组. 在下面的例子中,使用GetType()可以看到$a变量已经不是我们常见的string或int类型,而是Object类型,使用-is操作符来判断是否是个数组,返回True则是数组,返回False则不是. 如果要统计数组的行数,用我们前面学到的一个方法count即可.例如要看一下$a变量值的行数: 数组都有一个下标索引,用于访问其中的值,从0开始.例如我要访问$a第六行结果,在Powershell Consol…
项目地址:  https://github.com/kelin-xycs/HashTableLib 为什么会想要自己写一个 Hash 表, 以前也想过 Hash 表 的 原理, 觉得很神奇, 不过最近的 直接原因 是 最近在搞  ILBC, 这可以认为是一个 编译器 项目, 有关 ILBC,  见 <ILBC 规范>  https://www.cnblogs.com/KSongKing/p/10354824.html , 编译器 里 会 需要 快速 的 查找 成员(变量 .字段 .类 . 方法…
哈希表(Hash table,也叫散列表),是根据关键码值(Key value)而直接进行访问的数据结构.也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度.具体的介绍网上有很详细的描述,如闲聊哈希表 ,这里就不再累述了: 哈希表在像Java.C#等语言中是与生俱来的.可是在C的世界中,似乎只有自己动手,丰衣足食:在网上google了一把,大致有几个版本,我会一一来分析对比: 首先先来交代一下哈希表实现中需要注意的一些概念: (主要参考:这里) 1.哈希函数 也叫散列函数,…
百度云glib  链接:https://pan.baidu.com/s/1W9qdlMKWRKIFykenTVuWNQ 密码:ol6y hash表是一种提供key-value访问的数据结构,通过指定的key值可以快速的访问到与它相关联的value值.hash表的一种典型用法就是字典,通过单词的首字母能够快速的找到单词.关于hash表的详细介绍请查阅数据结构的相关书籍,我这里只介绍glib库中hash表的基本用法. 要使用一个hash表首先必须创建它,glib库里有两个函数可以用于创建hash表,…
这个看着应该是使用堆排序,但我图了一个简单,所以就简单hash表加选择排序来做了. 使用结构体: typedef struct node { struct node *pNext; int value; // 数值 int frequency; // 频率 }NODE_S; 思路: hash表用来存储每个值对应的频率,每读到一个数字,对应的频率就加1. 然后从表中再把这些数据读取出来. 先创建两个长度为k的数组,一个用来记录频率,一个用来记录对应的数值. 读取数据的时候,使用频率做排序,在排序的…
千万别! 非常多人这样说,也包括我. Linux内核早就把HASH路由表去掉了.如今就仅仅剩下TRIE了,只是我还是希望就这两种数据结构展开一些形而上的讨论. 1.hash和trie/radix hash和tire事实上是能够统一在一起的.具有同样hash值的多个项具有一个共同的特征,这个特征怎么提取呢?无疑这就是hash函数的工作.而trie树(或者radix树,管它呢)的一棵子树也有共同的特征,这个特征怎么提取呢?无疑这就是该子树根节点的父节点指示的某些bits在这棵子树的每个节点都具有同样…