简介

用过缓存系统的肯定都听过memcached的大名,memcached是一个非常优秀的分布式内存缓存系统,应用非常的广泛。Memcached不仅仅是Web缓存,它更是一个通用的数据缓存,基本上你可以将任何东西存入memcached中,它的分布式设计具有很好的可扩展性和灵活性。

Memcached是一个客户端-服务器端的架构模式。一般来说,在服务器上搭建好Memcached的服务器端,接下来就可以使用Memcached的客户端和服务器端进行交换了。

作为客户端和服务器端的模型,两者的通讯肯定是有特定的协议的,适用于memcached的协议就叫做memcached protocol。

memcached的协议有两种,分别是text协议和binary协议。本文将会详细讲解memcached text protocol的定义。

memcached protocol介绍

memcached可以看做是一个简单的key-value的存储系统,客户端通过key来请求服务器端的数据,服务器端通过key的hash值来查找对应的数据,然后返回给客户端。

memcached中的key长度一般不能超过250个字符。key不能包含控制字符或空白字符。

为了保证客户端和服务器端的消息通讯顺畅,一般来说都会制定特殊的客户端和服务器端的通讯协议,这个协议就叫做protocol。

什么是protocol呢?protocol听起来很高深很神秘,但是实际上protocol就是约定好的双方交互的消息格式。

对于memcached来说,memcached同时支持UDP和TCP协议,并且提供了两种协议方式,分别是“文本协议”和“二进制协议”。

其中文本协议是在第一个版本就支持的协议,而二进制协议是在v1.4之后才支持的。

文本协议和二进制协议都支持同样的命令,两者的唯一区别就是二进制协议具有更低的性能延迟和更好的可扩展性,而文本协议的有点就是它的可调试性能更好。

memcached text协议包含两部分数据,文本行和非结构化数据。前者是来自客户端的命令或来自服务器的响应,后者代表客户端访问的数据。命令以\r\n结尾,数据可以用\r、\n或\r\n,表示数据部分的结束。

memcached支持的命令

memcached支持三种命令,分别是存储命令,读取命令和其他命令。

存储命令

memcached中的存储命令总共有6个,分别是“set”、“add”、“replace”、“append”、"prepend" 和 "cas"。

首先,客户端发送如下所示的命令行:

command key [flags] [exptime] length [noreply]

另外cas命令的格式和其他几个不太一样:

cas key [flags] [exptime] length [casunique] [noreply]

上面的命令中,command代表的是命令的名字,也就是上面的“set”、“add”、“replace”、“append”和"prepend"。

set表示给key设置一个值。

Add表示如果key不存在的话,就添加。

replace用来替换已知key的value。

append表示将提供的值附加到现有key的value之后,是一个附加操作。

prepend将当前key对应的value添加到提供的值后面。

cas是一个原子操作,只有当casunique匹配的时候,才会设置对应的值。

flags是一个非常有趣的参数,这个参数对于memcached server来说是透明的,这个参数只是用来标记客户端命令的类型,并不会被服务器端识别。另外flags的长度在不同的memcached版本中也有所不同,在memcached 1.2.0或者根据低级的版本中,flags是一个16-bit的整数。在memcached 1.2.1或以上的版本,flags是一个32-bit的整数。

exptime是过期时间,0表示不会过期。

length是以byte表示的value的长度,这个值并不包含value中的结束符"\r\n"。

casunique是一个64-bit的现有entry的唯一值。

noreply告诉服务器端,这是个不需要reply的命令。

在发送完命令行之后,客户端还需要发送数据块:

<data block>\r\n

举个例子,我们想要将jack这个值设置到student这个key上,那么对应的命令应该如下所示:

set student 0 0 4\r\njack\r\n

对应的客户端收到的服务器端的返回可能有这些值:

  • "STORED\r\n",表示存储成功。

  • "NOT_STORED\r\n" 表示数据因为某些错误未存储成功。这通常意味着不满足“add”或“replace”命令的条件。

  • "EXISTS\r\n" 表示要设置的值在上次进行cas操作之后已经被修改了。

  • "NOT_FOUND\r\n" 表示要设置的值用在cas。

读取命令

memcached的读取命令有4个,分别是“get”、“gets”、“gat”和“gats,这些命令的格式如下:

get <key>*\r\n
gets <key>*\r\n
gat <exptime> <key>*\r\n
gats <exptime> <key>*\r\n

memcached中的读取命令后面不需要跟额外的数据块。

服务器端会根据接收到的key进行查询,每个key返回一条数据,格式如下:

VALUE <key> <flags> <bytes> [<cas unique>]\r\n
<data block>\r\n

在所有的数据都传输完毕之后,服务器端会发送"END\r\n"表示传输完毕。

这里的key表示查询传入的key。

flags是存储命令传入的flags。

bytes是后面data block的长度。

cas unique是当前item的唯一标记,在gets或者gats命令中返回。

data block是当前item具体的返回值。

上面我们提到了4个读取的命令,那么他们有什么区别呢?

首先是get和gets的区别,get 用于获取key的value值,若key不存在,返回空。支持多个key。 gets 用于获取key的带有CAS令牌值的value值,若key不存在,返回空。支持多个key。 他们的区别在于gets会返回多一个cas unique值。

gat和get的区别是,gat是get+touch的命令综合体,除了返回当前值之外,还会更新key的过期时间。

常用的其他命令

除了存储和获取之外,还有一些常用的其他命令。为什么这些命令被叫做第三类命令呢?这是因为这些命令只需要一个命令行即可,并不需要向服务器端传入额外的数据块。

下面是删除命令的格式:

delete <key> [noreply]\r\n

key是要删除的对象。

noreply表示是否需要收到服务器的返回值。

对应的服务器端返回值可能有两个:

  • "DELETED\r\n" 表示删除成功

  • "NOT_FOUND\r\n" 表示要删除的对象并不存在。

下面是Increment/Decrement命令的格式:

incr <key> <value> [noreply]\r\n
decr <key> <value> [noreply]\r\n

key是要修改的对象。

value是要添加或者减少的值,它必须是一个64-bit无符号整数。

noreply表示是否需要收到服务器的返回值。

服务器端的返回可能有两个:

  • "NOT_FOUND\r\n" 表示要修改的对象没有找到

  • "value\r\n" 返回修改成功之后的值

还有一个常用的是修改key过期时间的touch命令:

touch <key> <exptime> [noreply]\r\n

key是要修改的对象。

exptime是过期时间。

noreply表示是否需要收到服务器的返回值。

服务器端的返回值有两种:

  • "TOUCHED\r\n" 表示修改成功。

  • "NOT_FOUND\r\n" 表示要修改的对象不存在。

当然memcached支持的命令远不止上面所讲的这些。我们只是从中挑选出了最常用的一些命令进行讲解。

memcached服务器的返回值

上面在讲解具体的命令的时候有提到服务器的返回值,这里再总结一下,memcached服务器端的返回值有下面几种:

返回值 说明
STORED 值存储成功
NOT_STORED 值存储失败
EXISTS cas中要存储的对象已存在
NOT_FOUND 要修改的对象不存在
ERROR 提交了未知的命令
CLIENT_ERROR errorstring 客户端输入有误,具体的错误信息存放在 errorstring
SERVER_ERROR errorstring 服务器端异常
VALUE keys flags length 返回要查询的key对应的对象
DELETED 对象已经被删除
STAT name value 统计信息
END 服务器端返回结束

注意,上面所有的返回值都以"\r\n"结尾。

支持UDP协议

上面我们讲的都是TCP协议的报文格式。事实上memcached还支持UDP协议。

但是因为UDP不保证可靠性的特征,所以使用UDP的场合一般在做缓存的查询应用中,即使查询失败,也只是被看做是缓存没有被命中而已,并不会影响到数据的准确性。

事实上UDP的数据包和TCP的数据包格式基本一样,只不过多了一个简单的帧头。并且所有的请求都必须在单个UDP数据包中完成。

注意,这里只有请求才有这个要求,服务器端的返回并没有这个限制。

在UDP中帧头长8个字节,其中0-1个字节表示的是请求ID,请求ID是由客户端生成的一个单调递增的值。服务器端将会使用这个ID来标记是对哪个请求的响应。特别是在有服务器端有多个响应的情况下。

2-3个字节表示的是序列号,它的取值范围是0到n-1,其中n是消息中总的报文个数,也就是4-5个字节所表示的。

最后的6-7字节是保留字节,以备将来使用,现在设置为0。

总结

以上就是对memcached协议的介绍,通常来说我们使用memcached都是通过memcached客户端来进行的,如果有细心的朋友可能会发现,客户端使用的命令和协议中的命令差别不大,这是因为客户端就是对这些底层协议的封装,然后暴露给用户一个更加简单易操作的接口。

更多内容请参考 http://www.flydean.com/23-memcached-text-protocol/

最通俗的解读,最深刻的干货,最简洁的教程,众多你不知道的小技巧等你来发现!

欢迎关注我的公众号:「程序那些事」,懂技术,更懂你!

网络协议之:memcached text protocol详解的更多相关文章

  1. 网络协议之:memcached binary protocol详解

    目录 简介 memcached的协议包 memcached命令举例 总结 简介 前面讲到了memcached的文本协议,虽然文本协议看起来非常简单,但是对于客户端来说一般还是会选择效率更高的二进制协议 ...

  2. 网络协议之ts---ts 流分析详解

    名词缩写翻译: es:elements stream 基本流 pes:packet elements stream 打包流 pts:presentation time stamp 显示时间戳 dts: ...

  3. HTTP协议头部与Keep-Alive模式详解

    HTTP协议头部与Keep-Alive模式详解 .什么是Keep-Alive模式? 我们知道HTTP协议采用“请求-应答”模式,当使用普通模式,即非KeepAlive模式时,每个请求/应答客户和服务器 ...

  4. Linux 网络流量实时监控工具之ntopng详解

    大纲一.前言二.ntopng 简介三.ntopng 功能说明 四.ntopng 安装详解五.ntopng 配置详解 六.ntopng 使用详解注,操作系统 CentOS 5.5 X86_64,软件版本 ...

  5. 搞懂分布式技术4:ZAB协议概述与选主流程详解

    搞懂分布式技术4:ZAB协议概述与选主流程详解 ZAB协议 ZAB(Zookeeper Atomic Broadcast)协议是专门为zookeeper实现分布式协调功能而设计.zookeeper主要 ...

  6. memcached 命令操作详解

    memcached 命令操作详解 一.存储命令 存储命令的格式: <command name> <key> <flags> <exptime> < ...

  7. Linux网络状态工具ss命令使用详解【转】

    ss命令用于显示socket状态. 他可以显示PACKET sockets, TCP sockets, UDP sockets, DCCP sockets, RAW sockets, Unix dom ...

  8. (转)Linux网络状态工具ss命令使用详解

    Linux网络状态工具ss命令使用详解 原文:http://www.landui.com/help/show-5991.html ss 是 socket statistics 的缩写.顾名思义,ss ...

  9. 网络传输层之TCP/UDP详解

    一.运输层协议概述 从通信和信息处理的角度看,运输层向它上面的应用层提供通信服务,它属于面向通信部分的最高层,同时也是用户功能中的最低层. 运输层的任务就是负责主机中两个进程之间的通信,其数据传输的单 ...

  10. python网络编程-OSI七层模型详解

    OSI 七层模型通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯,因此其最主要的功能就是帮助不同类型的主机实现数据传输 . 完成中继功能的节点通常称为中继系统.在OSI七层模型中,处于 ...

随机推荐

  1. 【LeetCode贪心#01】分饼干,贪心算法入门(入了但是还没完全入)

    分饼干 力扣题目链接(opens new window) 假设你是一位很棒的家长,想要给你的孩子们一些小饼干.但是,每个孩子最多只能给一块饼干. 对每个孩子 i,都有一个胃口值 g[i],这是能让孩子 ...

  2. 【NLP学习其3.5】词嵌入的特性,为什么词之间会有联系?

    词嵌入的特性 现在你有了一堆嵌入向量,我们可以开始学习他们之间的特性了 前情提要:https://www.cnblogs.com/DAYceng/p/14962528.html 先把各向量重新命名便于 ...

  3. MySQL 数据库死锁排查

    死锁排查方法 查看进程状态 show processlist; 查看行锁的状态 show status like 'InnoDB_row_lock%'; 查询是否有死锁 show engine inn ...

  4. JAVA对象的生命周期(二)-对象的创建

    目录 对象创建的几种方式 类加载检查. 内存分配 初始化零值 设置对象头 执行init方法 对象创建的几种方式 new clone newInstance 反序列化 String s = " ...

  5. NodeJS开启GZIP功能

    gzip是用于压缩,效果特别好,js.css等文件的压缩率一般高达70% 具体方法如下: 先安装一个依赖 npm install compression --save 然后在已有代码里(一般是app. ...

  6. Task Manager 的设计简述

    讲解 Task Manager 之前,在这里先介绍一些 Task Manager 会使用到的概念术语. 图数据库 Nebula Graph 中,存在一些长期在后台运行的任务,我们称之为 Job.存储层 ...

  7. DataX 离线跨网场景的实施配置

    配置仅限于跨不同网情况,网络互通情况方案和配置会更简单一点 内网A:MySql数据转换成Csv { "job": { "setting": { "sp ...

  8. C++ //统计元素个数 //统计内置数据类型 //统计自定义数据类型

    1 //统计元素个数 2 3 #include<iostream> 4 #include<string> 5 #include<vector> 6 #include ...

  9. javascript之call用法实例

    call方法: 调用一个对象的一个方法,以另一个对象替换当前对象. 直接上代码: js例子:在A类中调用B类数据 function ClassA(){     this.name = 'ClassA' ...

  10. MySQL 如何以当前日期时间作为字段初始默认值?

    1.以当前时间作为默认值 使用 DEFAULT CURRENT_TIMESTAMP 声明字段,插入记录时不用指定 dt,自动置入当前时间 CREATE TABLE t1 ( dt DATETIME D ...