一、概述
Memcached和mysql一样,是一款客户端/服务器端(C/S)系统管理软件,有IP、端口,一旦启动,服务器就一直处于可用状态。
Mysql是通过SQL语句管理“磁盘中”的文件,Memcached是通过客户端发送的命令管理“内存中缓存”的数据。 
需要缓存的对象或数据以 key/value 对的形式保存在服务器端,key的值通过hash(hash算法的意义在于提供一种快速存取数据的方法,它用一种算法建立键值与真实值之间的对应关系)进行转换,把value传递到对应的具体的某台服务器上。

Memcached的分布式不是在服务器端实现的,而是在客户端应用中实现的,即通过内置算法制定目标数据的节点。
多台服务器之间是没有任何通信联系的,每台服务器只是对自己的数据进行管理。

* 布置多台Memcached服务器。怎么确定一个数据应该保存到哪台服务器上?
* 方案一:普通Hash分布。
* 方案二:一致性Hash分布。
理论参考:https://blog.csdn.net/u011489043/article/details/78944985 二、简单hash算法
function simpleHash(string $key)
{
$md5 = md5($key);
$hash = 0;
for ($i = 0; $i < strlen($md5); $i++) {
$hash += ord($md5{$i});
}
return $hash;
}

三、普通hash分布

/**
* 普通Hash分布
* 取模算法算法的原理是:hash(key)%N
*/
$servers = ['192.168.1.12', '192.168.1.20'];
echo PHP_EOL . '普通hash算法' . PHP_EOL;
echo 'save key1 in server:' . $servers[simpleHash('this is key1') % 2] . PHP_EOL;
echo 'save key2 in server:' . $servers[simpleHash('this is key2') % 2] . PHP_EOL;

四、一致性哈希

* 一致哈希(Consistent Hashing)算法,分布式系统负载均衡的首选算法
*
* 步骤:
* 1、通常,一个缓存数据的key经过hash后会得到一个32位的值,
* 将一个32位整数(0~2^32-1)想象成一个环
* 2、通过hash函数把可以处理成整数,在环中找到一个位置与之对应
* 3、使用hash函数处理服务器使用的IP地址,把Memcached服务器群也映射到环上
* 4、把数据映射到服务器上
* 沿着圆环顺时针方向的key出发,直到遇到一个服务器为止,把key对应的数据保存到这个服务器上
* 5、移除服务器
* 受影响的仅是当前服务器节点沿着逆时针出发直到遇到下一个服务器之间的数据,
* 把这些数据按操作4重新映射即可
* 6、添加服务器
* 受影响的是当前服务器节点沿着逆时针出发直到遇到下一个服务器之间的数据,
* 重新映射
PHP的一种实现
class FlexiHash
{
// 保存服务器列表
private $serverList = [];
// 记录服务器列表是否已经排过序
private $isSorted = false; /**
* 添加一个服务器到服务器列表中
*/
public function addServer($server)
{
$hash = simpleHash($server);
if (!isset($this->serverList[$hash])) {
$this->serverList[$hash] = $server;
}
$this->isSorted = false;
return true;
} /**
* 从服务器列表中删除一个服务器
*/
public function removeServer($server)
{
$hash = simpleHash($server);
if (isset($this->serverList[$hash])) {
unset($this->serverList[$hash]);
}
$this->isSorted = false;
return true;
} /**
* 在当前的服务器列表中找到合适的服务器存放数据
* 逆时针的圆环
*/
public function lookup($key)
{
$hash = simpleHash($key);
if (!$this->isSorted) {
krsort($this->serverList, SORT_NUMERIC);
$this->isSorted = true;
}
foreach ($this->serverList as $pos => $server) {
if ($hash >= $pos) {
return $server;
}
}
$index = array_search(min($this->serverList), $this->serverList);
return $this->serverList[$index];
}
} // 测试
echo PHP_EOL . '一致性hash算法' . PHP_EOL;
$hserver = new FlexiHash();
$hserver->addServer('192.168.1.1');
$hserver->addServer('192.168.1.2');
$hserver->addServer('192.168.1.3');
$hserver->addServer('192.168.1.4');
$hserver->addServer('192.168.1.5');
echo '初始分布' . PHP_EOL;
echo 'save key1 in server:' . $hserver->lookup('key1') . PHP_EOL;
echo 'save key2 in server:' . $hserver->lookup('key2') . PHP_EOL;
echo '===============================================' . PHP_EOL;
$hserver->removeServer('192.168.1.4');
echo '删除一台服务器后' . PHP_EOL;
echo 'save key1 in server:' . $hserver->lookup('key1') . PHP_EOL;
echo 'save key2 in server:' . $hserver->lookup('key2') . PHP_EOL;
echo '===============================================' . PHP_EOL;
$hserver->addServer('192.168.1.6');
echo '添加一台服务器后' . PHP_EOL;
echo 'save key1 in server:' . $hserver->lookup('key1') . PHP_EOL;
echo 'save key2 in server:' . $hserver->lookup('key2') . PHP_EOL;

另一种实现 增加虚拟节点
class ConsistentHashing
{
// 每个节点对应虚拟节点数
const VIRTUAL_NODES = 32;
// server 拥有的hash(节点+虚拟节点)
protected $nodes = [];
// hash映射server
protected $position = [];
// 记录服务器列表是否已经排过序
protected $isSorted = false; /**
* 添加节点
*/
public function addNode($server)
{
if (isset($this->nodes[$server])) {
return;
} // 添加节点和虚拟节点
for ($i = 0; $i < self::VIRTUAL_NODES; $i++) {
$hash = $this->myHash($server . '#' . $i);
$this->position[$hash] = $server;
$this->nodes[$server][] = $hash;
} $this->isSorted = false;
} /**
* 删除节点
*/
public function delNode($server)
{
if (!isset($this->nodes[$server])) return; // 循环删除虚拟节点
foreach ($this->nodes[$server] as $val) {
unset($this->position[$val]);
} // 删除节点
unset($this->nodes[$server]); $this->isSorted = false;
} /**
* 定位key所属节点
* 顺时针环
*/
public function lookup($key)
{
if (!$this->isSorted) {
$this->sortPosition();
$this->isSorted = true;
} $hash = $this->myHash($key); // 先取圆环上最小的一个节点,当成结果
$server = current($this->position); // 循环获取相近的节点
foreach ($this->position as $pos => $val) {
if ($hash <= $pos) {
$server = $val;
break;
}
} return $server;
} /**
* 按键名顺序排序
*/
private function sortPosition()
{
ksort($this->position);
} /**
* 自定义哈希函数,把key转为32位符号整数
*/
private function myHash($key)
{ // return sprintf('%u', crc32($key));
return simpleHash($key);
}
} // 测试
echo PHP_EOL . '另一种hash一致性算法' . PHP_EOL;
$ch = new ConsistentHashing();
$ch->addNode('192.168.1.1');
$ch->addNode('192.168.1.2');
$ch->addNode('192.168.1.3');
$ch->addNode('192.168.1.4');
$ch->addNode('192.168.1.5');
echo '初始化' . PHP_EOL;
echo 'save key1 in server:' . $ch->lookup('key1') . PHP_EOL;
echo 'save key2 in server:' . $ch->lookup('key2') . PHP_EOL;
echo '==========================================' . PHP_EOL;
$ch->delNode('192.168.1.4');
echo '删除节点后' . PHP_EOL;
echo 'save key1 in server:' . $ch->lookup('key1') . PHP_EOL;
echo 'save key2 in server:' . $ch->lookup('key2') . PHP_EOL;
echo '==========================================' . PHP_EOL;
$ch->addNode('192.168.1.6');
echo '添加一台服务器后' . PHP_EOL;
echo 'save key1 in server:' . $ch->lookup('key1') . PHP_EOL;
echo 'save key2 in server:' . $ch->lookup('key2') . PHP_EOL;

php hash算法实现memcached分布式的更多相关文章

  1. 一致性Hash算法在Redis分布式中的使用

    由于redis是单点,但是项目中不可避免的会使用多台Redis缓存服务器,那么怎么把缓存的Key均匀的映射到多台Redis服务器上,且随着缓存服务器的增加或减少时做到最小化的减少缓存Key的命中率呢? ...

  2. 一致性Hash算法在Memcached中的应用

    前言 大家应该都知道Memcached要想实现分布式只能在客户端来完成,目前比较流行的是通过一致性hash算法来实现.常规的方法是将server的hash值与server的总台数进行求余,即hash% ...

  3. Nginx+Memcache+一致性hash算法 实现页面分布式缓存(转)

    网站响应速度优化包括集群架构中很多方面的瓶颈因素,这里所说的将页面静态化.实现分布式高速缓存就是其中的一个很好的解决方案... 1)先来看看Nginx负载均衡 Nginx负载均衡依赖自带的 ngx_h ...

  4. (转) 一致性Hash算法在Memcached中的应用

    前言 大家应该都知道Memcached要想实现分布式只能在客户端来完成,目前比较流行的是通过一致性hash算法来实现.常规的方法是将 server的hash值与server的总台数进行求余,即hash ...

  5. 一致性hash算法在memcached中的使用

    一.概述 1.我们的memcacheclient(这里我看的spymemcache的源代码).使用了一致性hash算法ketama进行数据存储节点的选择.与常规的hash算法思路不同.仅仅是对我们要存 ...

  6. 一致性Hash算法介绍(分布式环境算法)

    32的整数环(这个环被称作一致性Hash环),根据节点名称的Hash值(其分布范围同样为0~232)将节点放置在这个Hash 环上.然后根据KEY值计算得到其Hash值(其分布范围也同样为0~232  ...

  7. 分布式缓存技术memcached学习(四)—— 一致性hash算法原理

    分布式一致性hash算法简介 当你看到“分布式一致性hash算法”这个词时,第一时间可能会问,什么是分布式,什么是一致性,hash又是什么.在分析分布式一致性hash算法原理之前,我们先来了解一下这几 ...

  8. 分布式缓存技术memcached学习系列(四)—— 一致性hash算法原理

    分布式一致性hash算法简介 当你看到"分布式一致性hash算法"这个词时,第一时间可能会问,什么是分布式,什么是一致性,hash又是什么.在分析分布式一致性hash算法原理之前, ...

  9. 分布式一致性hash算法

    写在前面  在学习Redis的集群内容时,看到这么一句话:Redis并没有使用一致性hash算法,而是引入哈希槽的概念.而分布式缓存Memcached则是使用分布式一致性hash算法来实现分布式存储. ...

随机推荐

  1. spring使用context:property-placeholder载不进属性问题

    环境:spring3.1.1+mybatis3.2.8+mybatis-spring1.2.3 今天整合了SpringMVC + MyBatis,发现了一个问题,在这里做个记录,各位如果遇到相同的问题 ...

  2. Android Studio如何更新support repository

    转自: http://blog.csdn.net/sinat_29696083/article/details/70256377 刚进新公司,熟悉新业务中.老大叫我看看关于ConstraintLayo ...

  3. Linux kali国内源

    命令行:leafpad /etc/apt/sources.list 将原来的内容注释掉,添加以下代码 #中科大 deb http://mirrors.ustc.edu.cn/kali kali-rol ...

  4. 输入流输出流IO的理解

    之前对IO理解总是有点模糊, 输入输出,其实针对 数据处理主体 A ,这个主体我们通常是指服务器程序本身,   交互目的源B ,一般是本地磁盘,由本地磁盘IO传输, 或者 远程客户端,由网络IO传输. ...

  5. 时间复杂度Big O以及Python 内置函数的时间复杂度

    声明:本文部分内容摘自 原文 本文翻译自Python Wiki 本文基于GPL v2协议,转载请保留此协议. 本页面涵盖了Python中若干方法的时间复杂度(或者叫"大欧",&qu ...

  6. 如何搭建OWASP测试靶机

    刚刚入门的新手都需要一个可以用来练习的环境,但是dvwa的搭建需要相关环境,所以这里推荐大家在虚拟机上搭建owasp靶机,里面集成了dvwa靶机. https://sourceforge.net/pr ...

  7. day 10 作业

    # 2.写函数,接收n个数字,求这些参数数字的和. def sum_func(*args): total = 0 for i in args: total += i return total prin ...

  8. 杭电2014 (第一次用vector ac题目)

    早就想用容器类来实现一些编程,今天也算是学了一点吧. vector的使用方法参考了某位博主的一篇文章,感觉写得还是不错的:http://blog.csdn.net/always2015/article ...

  9. Java1.7已经舍弃substr了

    网上一堆在写substring和substr区别的文章,都是过时的. 起码在官方6.0的api文档中已经找不到了,只有substring()

  10. 实现JSP部分内容继承

    我们的网站框架搭好以后,只需要主体部分显示不同的数据. 如果每次代码重写都会造成冗余. 今天欣赏别人代码,学到了 maven 核心代码 <dependency> <groupId&g ...