[leetcode/lintcode 题解] 一致性哈希 II

【题目描述】

在 Consistent Hashing I 中我们介绍了一个比较简单的一致性哈希算法，这个简单的版本有两个缺陷：

增加一台机器之后，数据全部从其中一台机器过来，这一台机器的读负载过大，对正常的服务会造成影响。
当增加到3台机器的时候，每台服务器的负载量不均衡，为1:1:2。

为了解决这个问题，引入了 micro-shards 的概念，一个更好的算法是这样：

将 360° 的区间分得更细。从 0~359 变为一个 0 ~ n-1 的区间，将这个区间首尾相接，连成一个圆。
当加入一台新的机器的时候，随机选择在圆周中撒 k 个点，代表这台机器的 k 个 micro-shards。
每个数据在圆周上也对应一个点，这个点通过一个 hash function 来计算。
一个数据该属于哪台机器负责管理，是按照该数据对应的圆周上的点在圆上顺时针碰到的第一个 micro-shard 点所属的机器来决定。

n 和 k在真实的 NoSQL 数据库中一般是 2^64 和 1000。

请实现这种引入了 micro-shard 的 consistent hashing 的方法。主要实现如下的三个函数：

create(int n, int k)
addMachine(int machine_id) // add a new machine, return a list of shard ids.
getMachineIdByHashCode(int hashcode) // return machine id

在线评测地址:

https://www.lintcode.com/problem/consistent-hashing-ii/?utm_source=sc-bky-zq

【样例】

样例 1:

输入:

  create(, )

  addMachine()

  getMachineIdByHashCode()

  addMachine()

  getMachineIdByHashCode()

  getMachineIdByHashCode()

输出:

  [,,]

  [,,]

样例 2:

输入:

  create(, )

  addMachine()

  getMachineIdByHashCode()

  addMachine()

  getMachineIdByHashCode()

  getMachineIdByHashCode()

  getMachineIdByHashCode()

  getMachineIdByHashCode()

  getMachineIdByHashCode()

  getMachineIdByHashCode()

输出:

  [,,,,]

  [,,,,]

【题解】

public class Solution {

    public int n, k;

    public Set<Integer> ids = null;

    public Map<Integer, List<Integer>> machines = null;

    // @param n a positive integer

    // @param k a positive integer

    // @return a Solution object

    public static Solution create(int n, int k) {

        // Write your code here

        Solution solution = new Solution();

        solution.n = n;

        solution.k = k;

        solution.ids = new TreeSet<Integer>();

        solution.machines = new HashMap<Integer, List<Integer>>();

        return solution;

    }

    // @param machine_id an integer

    // @return a list of shard ids

    public List<Integer> addMachine(int machine_id) {

        // Write your code here

        Random ra = new Random();

        List<Integer> random_nums = new ArrayList<Integer>();

        for (int i = 0; i < k; ++i) {

            int index = ra.nextInt(n);

            while (ids.contains(index))

                index = ra.nextInt(n);

            ids.add(index);

            random_nums.add(index);

        }

        Collections.sort(random_nums);

        machines.put(machine_id, random_nums);

        return random_nums;

    }

    // @param hashcode an integer

    // @return a machine id

    public int getMachineIdByHashCode(int hashcode) {

        // Write your code here

        int distance = n + 1;

        int machine_id = 0;

        for (Map.Entry<Integer, List<Integer>> entry : machines.entrySet()) {

            int key = entry.getKey();

            List<Integer> random_nums = entry.getValue();

            for (Integer num : random_nums) {

                int d = num - hashcode;

                if (d < 0)

                    d += n;

                if (d < distance) {

                    distance = d;

                    machine_id = key;

                }

            }

        }

        return machine_id;

    }

}

[leetcode/lintcode 题解] 一致性哈希 II · Consistent Hashing II的更多相关文章

（转）每天进步一点点——五分钟理解一致性哈希算法(consistent hashing)
背景:在redis集群中,有关于一致性哈希的使用. 一致性哈希:桶大小0~(2^32)-1 哈希指标:平衡性.单调性.分散性.负载性为了提高平衡性,引入“虚拟节点” 每天进步一点点——五分钟理解一致 ...
一致性哈希算法(consistent hashing)（转）
原文链接:每天进步一点点——五分钟理解一致性哈希算法(consistent hashing) 一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网 ...
一致性哈希算法(Consistent Hashing Algorithm)
一致性哈希算法(Consistent Hashing Algorithm) 浅谈一致性Hash原理及应用在讲一致性Hash之前我们先来讨论一个问题. 问题:现在有亿级用户,每日产生千万级订单,如 ...
转白话解析：一致性哈希算法 consistent hashing
摘要: 本文首先以一个经典的分布式缓存的应用场景为铺垫,在了解了这个应用场景之后,生动而又不失风趣地介绍了一致性哈希算法,同时也明确给出了一致性哈希算法的优点.存在的问题及其解决办法. 声明与致谢: ...
白话解析：一致性哈希算法 consistent hashing【转】
学习一致性哈希算法原理的时候看到博主朱双印的一片文章,看完就懂,大佬! 白话解析:一致性哈希算法 consistent hashing
_00013 一致性哈希算法 Consistent Hashing 新的讨论，并出现相应的解决
笔者博文:妳那伊抹微笑博客地址:http://blog.csdn.net/u012185296 个性签名:世界上最遥远的距离不是天涯,也不是海角,而是我站在妳的面前.妳却感觉不到我的存在技术方向: ...
一致性哈希算法(consistent hashing)PHP实现
一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,初衷和CARP十分类似.一致性哈希修正了CARP使用的简单哈希 ...
五分钟理解一致性哈希算法(consistent hashing)
转载请说明出处:http://blog.csdn.net/cywosp/article/details/23397179 一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法 ...
每天进步一点点——五分钟理解一致性哈希算法(consistent hashing)
转载请说明出处:http://blog.csdn.net/cywosp/article/details/23397179 一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT) ...

随机推荐

入门大数据---Redis集群分布式学习
Redis是什么? 官方介绍: Redis 是一个开源(BSD许可)的,内存中的数据结构存储系统,它可以用作数据库.缓存和消息中间件. 它支持多种类型的数据结构,如字符串(strings), 散列( ...
windows下 react-native环境搭建
跟着慕课网做案例,搭建rn环境遇到很大问题. 下面说一下: 首先看一下文档:http://reactnative.cn/docs/0.44/getting-started.html#content 注 ...
spring配置文件的部分配置文字说明
http://blog.csdn.net/zzjjiandan/article/details/22922847/ spring的组成: <beans> <contenxt> ...
Linux必须要掌握的命令
Linux必须要掌握的命令文件目录操作命令 ls 命令格式:ls [选项] [目录名] 命令功能:列出目标目录中所有的子目录和文件常用参数:-a,-l,-R, 例1:列出/home/peidach ...
web页面的重构和回流【转载】
在了解什么是重构和回流之前,我们应该先看看浏览器是怎么渲染的? 浏览器的渲染过程: 1.处理HTML脚本,生成DOM树(DOM树里包含所有的HTML标签,包括display:none和js动态添加的元 ...
如何Simplest搭建个人博客
前期例如wordpress.hexo.hugo-- 准备安装Node.js,安装Git,进入Hexo网站.进入Github网站进注册和登录. 建议买个阿里云服务器(学生最近好像是免费的) 开始搭建 ...
java 基本语法（十三）数组（六）数组的常见异常
1.数组角标越界异常:ArrayIndexOutOfBoundsException int[] arr = new int[]{1,2,3,4,5}; // for(int i = 0;i <= ...
数据可视化之powerBI技巧（十一）基于SQL思维的PowerBI DAX实战
本文来自于PowerBI星球嘉宾天行老师的分享,天行老师不仅DAX使用娴熟,更是精通SQL,下面就来欣赏他利用SQL思维编写DAX解决问题的一个实战案例. 基于SQL思维使用DAX解决实战问题作者: ...
数据分析07 /matplotlib绘图
数据分析07 /matplotlib绘图目录数据分析07 /matplotlib绘图 1. 绘制线性图:plt.plot() 2. 绘制柱状图:plt.bar() 3. 绘制直方图:plt.his ...
Python之爬虫（十七） Scrapy框架中Spiders用法
Spider类定义了如何爬去某个网站,包括爬取的动作以及如何从网页内容中提取结构化的数据,总的来说spider就是定义爬取的动作以及分析某个网页工作流程分析以初始的URL初始化Request,并设 ...

[leetcode/lintcode 题解] 一致性哈希 II · Consistent Hashing II

[leetcode/lintcode 题解] 一致性哈希 II · Consistent Hashing II的更多相关文章

随机推荐

热门专题