MySQL中间件之ProxySQL(9):ProxySQL的查询缓存功能
返回ProxySQL系列文章:http://www.cnblogs.com/f-ck-need-u/p/7586194.html
ProxySQL支持查询缓存的功能,可以将后端返回的结果集缓存在自己的内存中,在某查询的缓存条目被清理(例如过期)之前,前端再发起同样的查询语句,将直接从缓存中取数据并返回给前端。如此一来,ProxySQL处理的性能会大幅提升,也会大幅减轻后端MySQL Server的压力。
1.开启query cache功能
ProxySQL的查询缓存功能由mysql_query_rules
表中的cache_ttl字段控制,该字段设置每个规则对应的缓存时长,时间单位为毫秒。
当前端发送的SQL语句命中了某规则后(严格地说,是最后应用的那条规则,因为链式规则下会操作多个规则),如果这个规则同时还设置了"cache_ttl"字段的值,则这个SQL语句返回的结果将会被缓存一定时间,过期后将等待专门的线程(purge线程)来清理。
例如:
delete from mysql_query_rules;
select * from stats_mysql_query_digest_reset where 1=0;
insert into mysql_query_rules(rule_id,active,apply,destination_hostgroup,match_pattern,cache_ttl)
values(1,1,1,10,"^select .* test1.t1",20000);
load mysql query rules to runtime;
save mysql query rules to disk;
select rule_id,destination_hostgroup,match_pattern,cache_ttl from mysql_query_rules;
这表示匹配上述规则(查询test1.t1表)的查询结果集将在ProxySQL上缓存20秒。
可以执行下面的语句进行测试,每个语句循环执行10次:
# 在bash下执行
proc="mysql -uroot -pP@ssword1! -h127.0.0.1 -P6033 -e"
for ((i=0;i<10;i++));do
$proc "select * from test1.t1;"
$proc "select * from test1.t2;"
$proc "select * from test2.t1;"
$proc "select * from test2.t2;"
done
再去查看规则统计表:
Admin> select * from stats_mysql_query_rules;
+---------+------+
| rule_id | hits |
+---------+------+
| 1 | 10 | <--rule_id=1的规则命中10次
+---------+------+
Admin> select hostgroup,count_star,sum_time,digest_text from stats_mysql_query_digest;
+-----------+------------+----------+------------------------+
| hostgroup | count_star | sum_time | digest_text |
+-----------+------------+----------+------------------------+
| -1 | 9 | 0 | select * from test1.t1 | <-- 9次,hg="-1"
| 10 | 10 | 3640 | select * from test2.t1 |
| 10 | 10 | 3686 | select * from test2.t2 |
| 10 | 10 | 3986 | select * from test1.t2 |
| 10 | 1 | 1236 | select * from test1.t1 | <-- 1次,hg="10"
+-----------+------------+----------+------------------------+
其中,hostgroup=-1
表示从缓存中取数据。
从上面的结果中,可以看出select * from test1.t1;
语句除了被正常路由到后端执行的一次外,其它9次都是直接从缓存中获取数据的,且缓存取数据的语句执行总时间sum_time=0。
并不是所有的查询结果都应该缓存,ProxySQL的缓存空间毕竟有限。所以很有必要去stats_mysql_query_digest
表中找出哪些语句应该缓存:执行次数多、总执行时间长、平均执行时间长的语句都应该缓存。这些指标也是合理判断读、写分离的指标。
2.查询缓存相关的统计数据
ProxySQL虽然实现了查询缓存功能,但是查询缓存设计的还不够完整,缺少一些锦上添花的功能,例如能查询到的缓存类指标比较少,控制缓存的方式也比较缺乏。不过作者一直在努力改进,不断完善。
以下是和查询缓存有关的状态变量:
Admin> SELECT * FROM stats_mysql_global WHERE Variable_Name LIKE '%Cache%';
+--------------------------+----------------+
| Variable_Name | Variable_Value |
+--------------------------+----------------+
| Stmt_Cached | 0 |
| Query_Cache_Memory_bytes | 0 |
| Query_Cache_count_GET | 0 |
| Query_Cache_count_GET_OK | 0 |
| Query_Cache_count_SET | 0 |
| Query_Cache_bytes_IN | 0 |
| Query_Cache_bytes_OUT | 0 |
| Query_Cache_Purged | 0 |
| Query_Cache_Entries | 0 |
+--------------------------+----------------+
各变量的意义如下:
- Query_Cache_Memory_bytes:查询结果集已成功缓存在内存中的总大小,不包含那些元数据;
- Query_Cache_count_GET:从查询缓存中取数据的请求总次数(GET requests);
- Query_Cache_count_GET_OK:成功从缓存中GET到缓存的请求总次数(即命中缓存且缓存未过期);
- Query_Cache_count_SET:缓存到查询缓存中的结果集总数(即有多少个查询的结果集进行了缓存);
- Query_Cache_bytes_IN:写入到查询缓存的总数据量;
- Query_Cache_bytes_OUT:从查询缓存中取出的总数据量;
- Query_Cache_Purged:从缓存中移除(purged)的缓存结果集(缓存记录)数量;
- Query_Cache_Entries:当前查询缓存中还有多少个缓存记录。
无法查询当前缓存空间中的具体的缓存记录信息。
3.ProxySQL查询缓存的细节
如下图:
ProxySQL通过变量mysql_query_cache_size_MB
控制为查询缓存开辟多大的空间,通过变量mysql-threshold_resultset_size
定义ProxySQL能缓存的单个最大结果集大小。
Admin> show variables like '%size%';
+--------------------------------+-----------+
| Variable_name | Value |
+--------------------------------+-----------+
| mysql-eventslog_filesize | 104857600 |
| mysql-threshold_resultset_size | 4194304 | <<<<
| mysql-query_cache_size_MB | 256 | <<<<
| mysql-stacksize | 1048576 |
+--------------------------------+-----------+
ProxySQL通过SET调用将后端返回的结果集放进查询缓存空间,通过GET调用从查询缓存空间取出缓存数据返回给前端。当GET调用发现缓存记录已过期,会将其放进purge队列中。
purge线程会定时清理purge队列中的过期记录,还会定时扫描缓存空间以找出过期记录。当查询缓存空间已经满了(mysql-query_cache_size_MB
),下一次SET调用也会触发purge线程来清理已经过期的缓存记录。所以,SET调用永远不会失败。但需要注意的是,如果已缓存内容占用的缓存空间低于3%,则purge线程不会清理任何内容,即使它们已经过期了。
缓存记录的数据结构如下:
key:value:length:expire_ms:access_ms:ref_count
其中:
- key/value分别是缓存的id和实际缓存的数据,key是根据
username + schemaname + SQL statement
做hash运算得到的值,这可以保证用户只会访问到它自己的、指定schema的结果集。 - length用于记录缓存记录的长度。因为
mysql-threshold_resultset_size
变量的原因,超出该变量阈值的那部分额外结果集不会放进缓存。 - expire_ms:用来记录每个缓存记录还有多长时间过期。
- access_ms:记录每个缓存记录最近一次被访问离现在已多久。
- ref_count:记录各缓存记录当前被引用数量。每次GET调用某缓存记录,该缓存记录的ref_count都会加1,调用完成后减1。这是为了避免正在调用的缓存记录正好过期又正好被purge线程发现而被清理。
所以,后面的3个字段都是为了让缓存记录过期而设计的。不过,目前ProxySQL还不支持根据access_ms来判断是否清理,例如缓存空间已满,且access_ms的时间已过去很久,但只要未过期,就不会被清理。这个字段可能是为以后的LRU(或其它类似缓存清理算法)做准备的。
4.容易误解的查询缓存
每个查询缓存记录的key是根据username + schemaname +SQL
做hash运算出来的,这里的SQL是完整的包含参数SQL语句,而非参数化后的语句,如果SQL语句进行了重写,则使用重写后的完整的SQL语句参与hash运算。这很重要。
例如:
select * from tab where id between 10 and 20;
select * from tab where id between 10 and 19;
select * from tab where id=15;
select * from tab where id between 10 and 19;
第一个语句会缓存id=10到id=20之间的结果集,但第二个语句和第三个语句不会从这个缓存记录中取数据,而是从后端查询后设置自己的缓存记录,即使第二个语句参数化后的语句和第一个完全一样(它们是同一类语句,如下代码所示),所需要的数据也已经被第一个语句缓存。第四个语句会命中第二个语句的缓存。
select * from tab where id between ? and ?
但因为第二个语句和第一个语句命中的规则是同一个,所以这类语句的执行总次数会递增。
如下图:
MySQL中间件之ProxySQL(9):ProxySQL的查询缓存功能的更多相关文章
- ProxySQL(9):ProxySQL的查询缓存功能
文章转载自: https://www.cnblogs.com/f-ck-need-u/p/9314459.html ProxySQL支持查询缓存的功能,可以将后端返回的结果集缓存在自己的内存中,在某查 ...
- MySQL中间件之ProxySQL(13):ProxySQL集群
返回ProxySQL系列文章:http://www.cnblogs.com/f-ck-need-u/p/7586194.html ProxySQL有原生的集群功能,但是这个原生的集群功能还正在试验阶段 ...
- Mysql 查询缓存总结
Mysql 查询缓存总结 MySQL查询缓存解释 缓存完整的SELECT查询结果,也就是查询缓存.保存查询返回的完整结果.当查询命中该缓存,mysql会立刻返回结果,跳过了解析.优化和执行阶段, 查询 ...
- Mysql查询缓存Query_cache的功用
MySQL的查询缓存并非缓存执行计划,而是查询及其结果集,这就意味着只有相同的查询操作才能命中缓存,因此MySQL的查询缓存命中率很低,另一方面,对于大结果集的查询,其查询结果可以从cache中直接读 ...
- mysql(五)查询缓存
mysql的逻辑架构图如下: 当开启查询缓存时,mysql会将查询结果缓存到查询缓存区域,结果对应的key是使用查询语句,数据库名称,客户端协议的版本等因素算出的一个hash值. 在下次查询时,根据一 ...
- MySQL加速查询速度的独门武器:查询缓存
[导读] 与朋友或同事谈到MySQL查询缓存功能的时候,个人喜欢把查询缓存功能Query Cache比作荔枝, 是非常营养的东西,但是一次性吃太多了,就容易上火而流鼻血,虽然不是特别恰当的比喻,但是有 ...
- 查询缓存及索引:MySQL系列之九
一.MySQL的架构 连接器 连接池,安全认证.线程池.连接限制.检查内存.缓存 SQL接口 DML.DDL SQL解析器,对SQL语句的权限检查.解析为二进制程序 优化器,优化访问路径 缓存cach ...
- RDS for MySQL查询缓存 (Query Cache) 的设置和使用
https://help.aliyun.com/knowledge_detail/41717.html?spm=5176.7841698.2.11.aCvOXJ RDS for MySQL查询缓存 ( ...
- Mysql查询缓存研究
转载声明:本文为DBA+社群原创文章,转载必须连同本订阅号二维码全文转载,并注明作者名字及来源:DBA+社群(dbaplus). http://mp.weixin.qq.com/s?__biz=MzI ...
随机推荐
- U盘安装centos7 关键步骤
出现安装界面 按tab键或e键进行修改 一般默认第二行为: vmlinuz intrd=initrd.img inst.stage2=hd:LABEL=CentOS\x207\x20x86_64 rd ...
- Python开发——15.协程与I/O模型
一.协程(Coroutine) 1.知识背景 协程又称微线程,是一种用户态的轻量级线程.子程序,或者称为函数,在所有语言中都是层级调用,比如A调用B,B在执行过程中又调用了C,C执行完毕返回,B执行完 ...
- REdis Asynchronous AOF fsync is taking too long
redis.conf中的no-appendfsync-on-rewrite默认值为no,表示在重写AOF文件或RDB文件时阻塞fsync. 如果重写AOF或RDB文件时长过长,则在日志中可以看到如下信 ...
- bootstrap中的dropdown组件扩展hover事件
bootstrap的下拉组件,需要点击click时,方可展示下拉列表.因此对于喜欢简单少操作的大家来说,点击一下多少带来不便,因此,引入hover监听,鼠标经过自动展示下拉框.其实在bootstrap ...
- Exp8 Web基础 20154320 李超
1.实验后回答问题 (1)什么是表单. 表单是一个包含表单元素的区域,表单元素是允许用户在表单中输入信息的元素,表单在网页中主要负责数据采集功能,一个表单有三个基本组成部分:表单标签.表单域.表单按钮 ...
- 从今天开始慢慢阅读java9源码决心的声明。
我从很早的时候就好奇java的源码了,因为有使用者就有制作者. 在校期间使用了java两年多的我却不知道java里面的任何东西. 这个寒假前我无意之间看到了java9出现的新闻,网上查询到原来源码就隐 ...
- eclispe安装tomcate没有srver解决
eclipse没有server选项解决方法 找到Help->InstallNew Software->"Kepler" repository(http:// ...
- Python学习过程中各个难点---函数篇
对于函数,我一直分不清局部变量与全局变量,今天又好好研究了下,终于搞清楚了. 例子: 其次对于global这个关键字我也是一知半解的状态,之前整个人都是懵懵的,现在搞明白了 匿名函数: 匿名函数使用关 ...
- 一窍懂PID
这是学习PID时的理解,做个笔记! 一:首选,说一下一些基本概念,为了更好理解. PID:就是对输入偏差进行比例积分微分运算,运算的叠加结果去控制执行机构. P(proportion):比例,就是对输 ...
- RPC知识
说明:RPC框架的目标就是让远程服务调用更加简单.透明,RPC框架负责屏蔽底层的传输方式(TCP或UDP).序列化(XML/json/二进制)和通信细节.服务调用者可以像调用本地接口一样调用远程的服务 ...