前段时间订阅了《Mysql实战45讲》(从原理到实战),新的一年为自己充充电。对于这部分内容,我所知道的只来源于我大学里学习的课程《数据库原理》,在大学里学习的只是简单的查询,增加,删除,索引,锁,触发器,视图等内容。几乎没有基础的架构知识。因此在这里巩固一下原理,学习一下数据库Mysql在原理上究竟是怎样的。

首先我们一起看一个Mysql的基本架构示意图:

1、Mysql可以分为Server层和存储引擎层两部分。

2、Server层:包含连接器,查询缓存,分析器,优化器,执行器等,涵盖了MySQL的大多数核心功能区以及所有的内置函数。

①内置函数:日期,时间,数学和加密函数等;

②所有跨存储引擎的功能都在这一层实现,例如存储过程,触发器,视图等;

3、存储引擎层:负责数据的存储和提取。

①架构模式:插件式的,支持InnoDB(目前也是最常用的,MySQL5.5后默认存储引擎)、MyISAM、Memory等多个存储引擎。

②create table 时不指定引擎类型,默认使用的就是InnoDB.如果使用其他类型,可以利用create table语句中使用engine=memory,等来指定使用内存引擎来创建表。不同的存储引擎数据存储方式不同,支持的功能也不同。

4、不同的存储引擎共用一个server层,结合一个例子我们从总体上了解一下各部件的功能。

mysql> select * from T where ID=;

 开启探索之旅:

一  连接器:负责跟客户端建立连接,获取权限,维持和管理连接,这个连接器位于server层,我们通过连接器可以让客户端和server层连接起来,从而登录到mysql。连接命名一般就这样搞:

mysql -h$ip -P$port -u$user -p

  在命令输完之后,我们需要在交互界面输入密码。虽然在-p后面我们可以把密码直接写上,但是安全性你懂得,如果我们连接的是生产服务器,强烈建议不要这样干!

连接过程是怎样的呢?

  链接命令中的mysql是客户端工具,用来跟服务器建立连接。(本菜鸟一直使用图形话的工具很少思考这方面的内容,实在是羞愧啊!只看到了表面,很少思考内在的东西!)

经典的TCP握手之后,服务器开始验证身份。我们这个时候要用到输入的用户名和密码:

①如果用户名和密码不对,我们会被反馈“Access denied for user”的错误,然后就死翘翘了,(客户端程序结束执行)。

②如果用户名和密码正确,连接器回到权限表里找到我们所拥有的权限。之后在这个连接面里的权限判断逻辑,都会依赖于此时读到的权限。(如果一个用户成功建立连接后,即使你用管理员账号对这个用户的权限做了修改,也不会影响到已经存在连接的权限,修改完成后,只有在新建的连接才会使用新的权限设置);

连接完成之后呢?

  ①如果你没有后续的动作,这个连接就会空闲下来,使用show processlist 命令中看到它。

  ②客户端如果太长时间没用动静,连接器就会自动断开,这个时间是由wait_timeout控制的,默认是8小时。

  如果在连接被断开之后,客户端再次发送请求的话,就会收到一个错误的提醒:Lost connection to Mysql server during query。这时候如果要继续,就需要重连,然后在执行请求了。

长连接和短连接:

  长连接:在数据库里面,长连接是指连接成功之后,如果客户端持续有请求,则一直使用同一个连接。

  短连接:指的是每次执行完很少的几次查询就断开连接,下次查询再重新建立一个。

  建立连接的过程很复杂,建议在使用中尽量减少建立连接的动作,也就是尽量使用长连接;

问题:但是如果全部使用长连接的话,你可能会发现Mysql占用内存特别快。

  原因:MySQL在执行的时候临时使用的内存是管理在连接对象里面的,这些资源会在连接断开的时候释放,所以如果长连接列累积下来,可能会导致内存占用太大,被系统强制杀死(OOM):

  表现:MySQL异常重启。

  解决方案:①定期断开长连接,使用一段时间,或者程序里面判断执行过一个占内存的大查询后,断开连接,之后要查询再重连。

  ②如果使用的是MySQL 5.7或者更高的版本,可以在每次执行一个比较大的操作后,通过执行mysql_reset_connection来重新初始化链接资源。这个过程不需要重连和重新做权限验证,但是会将连接恢复到刚刚创建完时的状态。

二  查询缓存

查询缓存:在连接建立完成之后,我们就可以执行select语句了。具体过程是怎样的呢?

  MySQL拿到一个查询请求之后,会到查询缓存看看,之前是否执行过这样的一条语句,之前执行过的语句及其结果可能会以key-value对的形式,被直接存放到内存中,key是查询的语句,value是查询的结果,如果你的查询能够直接在这个缓存中找到key,那么这个value就会被直接返回给客户端。如果语句不在查询缓存中,就会继续后面的执行阶段,执行完成后,执行结果会被存入到查询缓存中。你可以看到,如果查询命中缓存,MySQL不需要执行后面的复杂操作,就可以直接返回结果,这个效率会很高。

但是大多数情况下我会建议你不要使用查询缓存,为什么呢?

  因为查询缓存往往弊大于利。 查询缓存的失效非常频繁,只要有对一个表的更新,这个表上所有的查询缓存都会被清空。因此很可能你费劲地把结果存起来,还没使用呢,就被一个更新全清空了。对于更新压力大的数据库来说,查询缓存的命中率会非常低。除非你的业务就是有一张静态表,很长时间才会更新一次。比如,一个系统配置表,那这张表上的查询才适合使用查询缓存。

好在MySQL也提供了这种“按需使用”的方式。你可以将参数query_cache_type设置成DEMAND,这样对于默认的SQL语句都不使用查询缓存。而对于你确定要使用查询缓存的语句,可以用SQL_CACHE显式指定,像下面这个语句一样:

 mysql> select SQL_CACHE * from T where ID=10;

需要注意的是,MySQL 8.0版本直接将查询缓存的整块功能删掉了,也就是说8.0开始彻底没有这个功能了。

三 分析器(关于词法分析和语法分析的内容可以看《编译原理》)

如果没有命中缓存,就要开始真正的执行SQL语句了,首先SQL语句需要知道你在做什么,因此需要对SQL语句做出解析。

分析器做的工作如下:

mysql> select * from T where ID=;(以这个语句为例子)

词法分析:你输入的是由多个字符串和空格组成的一条SQL语句,Mysql需要识别出里面的字符分别是什么,代表什么。MySQL从你输入的“select”这个关键子识别出来,这是一条查询语句,他也要把字符串“T”识别成“表名T”,把字符串“ID”识别成“列ID”。

语法分析:根据词法分析的结果,语法分析器会根据语法规则,判断你输入的这个SQL语句是否满足MySQL语法。如果你输入的语句不对,你会收到“you have an error in your SQL syntax”的错误提醒,比如下面这个语句select少打了一个字母"S".

mysql> elect * from t where ID=1;
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL
server version for the right syntax to use near 'elect * from t where ID=1' at line 1

一般来说语法错误会提示第一个出现错误的位置,所以你要关注的是紧接“use near”的内容。

四 优化器

经过了分析器,MySQL就知道你要做什么了,在开始执行之前,还要经过优化器的处理。

  1.   优化器是在表里面有多个索引的时候,决定使用哪个索引;
  2.   在一个语句有多表关联(join)的时候,决定各个表的连接顺序。

比如你执行下面这样的语句,这个语句是执行两个表的join:

mysql> select * from t1 join t2 using(ID) where t1.c=10 and t2.d=20;
  • 既可以先从表t1里面取出c=10的记录的ID值,再根据ID值关联到表t2,再判断t2里面d的值是否等于20。
  • 也可以先从表t2里面取出d=20的记录的ID值,再根据ID值关联到t1,再判断t1里面c的值是否等于10。

这两种执行方法的逻辑结果是一样的,但是执行的效率会有不同,而优化器的作用就是决定选择使用哪 一个方案。 优化器阶段完成后,这个语句的执行方案就确定下来了,然后进入执行器阶段.

五 执行器

MySQL通过分析器知道你要干啥了,通过优化器知道该怎么去干了。于是就进入到执行器阶段了,开始干活!

其中的流程如下:

  1. 判断你是否对这个表T有没有查询的权限,如果没有,就会返回没有权限的错误,如下所示:

    mysql> select * from T where ID=10;ERROR 1142 (42000): SELECT command denied to user 'b'@'localhos' for table 'T'
  2. 判断如果你有权限,那就打开表继续执行。打开表的时候,执行器就会根据表的引擎定义,去使用这个引擎提供的接口。例如我们的这个例子中的表T中,ID字段没有索引,那么执行器的执行流程是这样的:

    1、调用InnoDB引擎接口取这个表的第一行,判断ID的值是不是10,如果不是则跳过,如果是则将这行存在结果集中;

    2、调用引擎接口取“下一行”,重复相同的判断逻辑,直到取到这个表的最后一行;

    3、执行器将上述遍历过程中所有满足条件的行组成记录集作为结果集返回给客户端。

至此这个语句结束了。

对于有索引的表,执行的逻辑也差不多,第一次调用的是“取满足条件的第一行”这个接口,之后循环取“满足条件的下一行”这个接口,这写接口都是引擎中定义好的。

你会在数据库的慢查询日志中看到看一个rows_examined字段,表示这个语句执行过程中扫描了多少行,这个值就是在执行器每次调用引擎获取数据行的时候累加的。

在有些场景下,执行器调用一次,在引擎内部则扫描了很多行,因此引擎扫描行数跟rows_examined并不是完全相同的。

逻辑架构大体就是这样子了。

MySQL基础架构的更多相关文章

  1. MySql基础架构以及SQL语句执行流程

    01. mysql基础架构 SQL语句是如何执行的 学习一下mysql的基础架构,从一条sql语句是如何执行的来学习. 一般我们写一条查询语句类似下面这样: select user,password ...

  2. MySQL基础架构分析

    文章已托管到GitHub,大家可以去GitHub查看阅读,欢迎老板们前来Star! 搜索关注微信公众号 码出Offer 领取各种学习资料! MySQL基础架构 一.引言 我们在学习MySQL的时候,迈 ...

  3. MySQL基础架构之查询语句执行流程

    这篇笔记主要记录mysql的基础架构,一条查询语句是如何执行的. 比如,在我们从student表中查询一个id=2的信息 select * from student where id=2; 在解释这条 ...

  4. 1.MySQL基础架构

    好久没发博客了,终于又学完了一点知识并且进行了整理.就从这个MySQL系列开始继续坚持每个月产出几篇. 声明一下,这次的MySQL系列是针对已有一定基础的小伙伴的,关于SQL的使用,一些概念的介绍就不 ...

  5. MySQL运行原理与基础架构

    1.MySQL基础 MySQL是一个开放源代码的关系数据库管理系统.原开发者为瑞典的MySQL AB公司,最早是在2001年MySQL3.23进入到管理员的视野并在之后获得广泛的应用. 2008年My ...

  6. MySQL 笔记整理(1) --基础架构,一条SQL查询语句如何执行

    最近在学习林晓斌(丁奇)老师的<MySQL实战45讲>,受益匪浅,做一些笔记整理一下,帮助学习.如果有小伙伴感兴趣的话推荐原版课程,很不错. 1) --基础架构,一条SQL查询语句如何执行 ...

  7. MySQL:基础架构和工作流程

    [参考文章]:01|基础架构:一条查询语句的执行流程 1. 基本架构 大体来说,MySQL可以分为Server层和存储引擎两部分. Server层包括链接器,分析器,优化器,执行器等,涵盖大多数核心服 ...

  8. MySQL 基础知识(基本架构、存储引擎差异)

    前言: // MySQL 并发.异步IO.进程劫持 最近在看高性能 MySQL,记录写学习笔记: 高性能 MySQL 学习笔记(一) 架构与历史 笔记核心内容:MySQL 服务器基础架构.各种存储引擎 ...

  9. 高性能MySQL之基础架构

    一.背景 为什么我们需要先学习MYSQL的基础架构先呢? 原因很简单,当我们需要了解一件事物的时候,我们只有站在宏观的层面,才能层层剥丝抽茧的去理解问题.举个例子,我们要看一个框架的源码,一开始就想进 ...

随机推荐

  1. Android小玩意儿-- 从头开发一个正经的MusicPlayer(三)

    MusicService已经能够接收广播,通过广播接收的内容来做出相应的MediaPlayer对象的处理,包括播放,暂停,停止等,并当MediaPlayer对象的生命周期发生变化的时候,同样通过发送广 ...

  2. 实战角度比较EJB2和EJB3的架构异同

    ] EJB编程模型的简化 首先,EJB3简化的一个主要表现是:在EJB3中,一个EJB不再象EJB2中需要两个接口一个Bean实现类,虽然我们以前使用JBuilder这样可视化开发工具自动生成了EJB ...

  3. js里面Object的一些方法

    1.Object.freeze() 阻止修改现有属性的特性和值,并阻止添加新属性两种用法:Object.freeze( { } ) 和 Object.freeze( object ) <scri ...

  4. HDU 5381 The sum of gcd (技巧,莫队算法)

    题意:有一个含n个元素的序列,接下来有q个询问区间,对每个询问区间输出其 f(L,R) 值. 思路: 天真单纯地以为是道超级水题,不管多少个询问,计算量顶多就是O(n2) ,就是暴力穷举每个区间,再直 ...

  5. 嵌入式C语言-学习书籍推荐(pdf附上百度云链接)

    先推荐学习视频网站: https://www.bilibili.com/video/av22631677?from=search&seid=800092160484173881 书籍只推荐2本 ...

  6. python小随笔

    关于pip安装 .\pip.exe install --ignore-installed --upgrade tensorflow-gpu python可视化库 Seaborn:是一个基于matplo ...

  7. 假设在一个 32 位 little endian 的机器上运行下面的程序,结果是多少?

    假设在一个 32 位 little endian 的机器上运行下面的程序,结果是多少? #include <stdio.h> int main(){ , b = , c = ; print ...

  8. In line copy and paste to system clipboard

    On the Wiki Wiki Activity Random page Videos Photos Chat Community portal To do    Contribute  Watch ...

  9. 【转载】form表单的两种提交方式,submit和button的用法

    1.当输入用户名和密码为空的时候,需要判断.这时候就用到了校验用户名和密码,这个需要在jsp的前端页面写:有两种方法,一种是用submit提交.一种是用button提交.方法一: 在jsp的前端页面的 ...

  10. MySQL配置索引页的合并阈值

    MySQL配置索引页的合并阈值 如果删除行或者通过UPDATE操作缩短行 可以为索引页面配置MERGE_THRESHOLD值. 当delete与update缩短了行长度时,索引页的"page ...