01MySQL内核分析-The Skeleton of the Server Code

摘要

这个官方文档一段对MySQL内核分析的一个向导。是对MySQL一条insert语句写入到MySQL数据库的分析。

但是，对于MySQL 5.7版本来说，基本上都是写入到innodb引擎。但也还是有借鉴意义，大的框架没有太大变化。

后面的文档，会通过mysqld --debug 和gdb等工具，通过分析mysqld.trace来分析insert语句在MySQL 5.7中怎么写入数据库。

官方文档给出的一段结构，如下:

/sql/mysqld.cc

/sql/sql_parse.cc

/sql/sql_prepare.cc

/sql/sql_insert.cc

/sql/ha_myisam.cc

/myisam/mi_write.c

上述梳理一个过程，是说从客户段执行一条简单的insert语句，然后到达MySQL服务器端，并通过MyISAM存储层。写入到MyISAM文件的过程。

由于，我们现在的主流都是InnoDB存储引擎，所以我们分析的写入到存储层应该是InnoDB的源代码。但是上述的一个框架也有借鉴意义。虽然，走的是InnoDB存储引擎插入数据，但是也还是需要通过SQL层的ha_*这样的接口进行接入。

正题开始！！！！！！！！！！！！！！！！！！！！！！！

第一步，进入MySQL大门的地方。梦开始的地方。众所周知，C语言都是需要main方法作为主入口。而MySQL的主入口如下:

代码位置 /sql/mysqld.cc

  int main(int argc, char **argv)

  {

    _cust_check_startup();

    (void) thr_setconcurrency(concurrency);

    init_ssl();

    server_init();                             // 'bind' + 'listen'

    init_server_components();

    start_signal_handler();

    acl_init((THD *)0, opt_noacl);

    init_slave();

    create_shutdown_thread();

    create_maintenance_thread();

    handle_connections_sockets(0);             // !  这里也代表着我们进入下一个门的地方

    DBUG_PRINT("quit",("Exiting main thread"));

    exit(0);

  }

这里可以看到很多的init_*或者server_init()。通过名字我们可以猜测出，这里做了很多初始化的工作。例如:启动过程中一些初始化的检查和MySQL配置变量的加载和一些组件的初始化等。

这里重要的函数是handle_connections_sockets

继续跟踪 /sql/mysqld.cc

 handle_connections_sockets (arg __attribute__((unused))

  {

     if (ip_sock != INVALID_SOCKET)

     {

       FD_SET(ip_sock,&clientFDs);

       DBUG_PRINT("general",("Waiting for connections."));

       while (!abort_loop)

       {

         new_sock = accept(sock, my_reinterpret_cast(struct sockaddr*)

           (&cAddr),             &length);

         thd= new THD;

         if (sock == unix_sock)

         thd->host=(char*) localhost;

         create_new_thread(thd);            // !

         }

从简易的思维，忽视其他的判断语句。可以看到这里做的是典型的client/server架构。服务器有一个主线程，它总是侦听来自新客户机的请求。一旦它接收到这样的请求，它将分配资源。特别是，主线程将生成一个新线程来处理连接。然后主服务器将循环并侦听新连接——但我们将保留它并跟踪新线程。

这里创建新线程的方法是:create_new_thread(thd);

继续跟踪 /sql/mysqld.cc

  create_new_thread(THD *thd)

  {

    pthread_mutex_lock(&LOCK_thread_count);

    pthread_create(&thd->real_id,&connection_attrib,

        handle_one_connection,                        // !

        (void*) thd));

    pthread_mutex_unlock(&LOCK_thread_count);

  }

可以看到这里获得一个新线程加入一个互斥锁，避免冲突。

继续跟踪 /sql/mysqld.cc

handle_one_connection(THD *thd)

  {

    init_sql_alloc(&thd->mem_root, MEM_ROOT_BLOCK_SIZE, MEM_ROOT_PREALLOC);

    while (!net->error && net->vio != 0 && !thd->killed)

    {

      if (do_command(thd))            // !

        break;

    }

    close_connection(net);

    end_thread(thd,1);

    packet=(char*) net->read_pos;

从这里开始，我们即将脱离mysqld.cc文件，因为我们获得了thread，且分配一小段内存资源，给与我们来处理我们的SQL语句了。

我们会走向何方呢，可以开始观察do_command(thd)方法。

继续跟踪/sql/sql_parse.cc

bool do_command(THD *thd)

{

  net_new_transaction(net);

  packet_length=my_net_read(net);

  packet=(char*) net->read_pos;

  command = (enum enum_server_command) (uchar) packet[0];

  dispatch_command(command,thd, packet+1, (uint) packet_length);

// !

}

其中从这里可以看到，do_command(THD *thd)把它串联起来的是一个叫作THD的东西，也就是thread。所以后面的工作和行为，基本都是通过thread进行牵线搭桥的。

my_net_read函数位于另一个名为net_servlet .cc的文件中。该函数从客户端获取一个包，解压缩它，并去除头部。

一旦完成，我们就得到了一个名为packet的多字节变量，它包含客户端发送的内容。第一个字节很重要，因为它包含标识消息类型的代码。

说明了packet第一个字节很重要。debug也有证据进行一个佐证。

packet_header: Memory: 0x7f7fc000a4b0  Bytes: (4)

21 00 00 00

然后把packet第一个字节和余下的部分传递给dispatch_command

继续跟踪/sql/sql_parse.cc

bool dispatch_command(enum enum_server_command command, THD *thd,

       char* packet, uint packet_length)

{

  switch (command) {

    case COM_INIT_DB:          ...

    case COM_REGISTER_SLAVE:   ...

    case COM_TABLE_DUMP:       ...

    case COM_CHANGE_USER:      ...

    case COM_EXECUTE:

         mysql_stmt_execute(thd,packet);

    case COM_LONG_DATA:        ...

    case COM_PREPARE:

         mysql_stmt_prepare(thd, packet, packet_length);   // !

    /* and so on for 18 other cases */

    default:

     send_error(thd, ER_UNKNOWN_COM_ERROR);

     break;

    }

这里sql_parser .cc中有一个非常大的switch语句

switch语句中代码有:code for prepare, close statement, query, quit, create database, drop database, dump binary log, refresh, statistics, get process info, kill process, sleep, connect, and several minor commands

除了COM_EXECUTE和COM_PREPARE两种情况外，我们删除了所有情况下的代码细节。

可以看到

COM_EXECUTE 会调用mysql_stmt_execute(thd,packet);
COM_PREPARE 会调用mysql_stmt_prepare(thd, packet, packet_length);

这里就像一个中转站一般，看我们去向什么地方。这里去的门是:COM_PREPARE:mysql_stmt_prepare

跟踪 /sql/sql_prepare.cc

下面是一段prepare的注释

"Prepare:

Parse the query

Allocate a new statement, keep it in 'thd->prepared statements' pool

Return to client the total number of parameters and result-set

metadata information (if any)"

继续回到主线COM_EXECUTE

跟踪/sql/sql_parse.cc

  bool dispatch_command(enum enum_server_command command, THD *thd,

       char* packet, uint packet_length)

  {

  switch (command) {

    case COM_INIT_DB:          ...

    case COM_REGISTER_SLAVE:   ...

    case COM_TABLE_DUMP:       ...

    case COM_CHANGE_USER:      ...

    case COM_EXECUTE:

         mysql_stmt_execute(thd,packet);                   // !

    case COM_LONG_DATA:        ...

    case COM_PREPARE:

         mysql_stmt_prepare(thd, packet, packet_length);

    /* and so on for 18 other cases */

    default:

     send_error(thd, ER_UNKNOWN_COM_ERROR);

     break;

    }

现在``COM_EXECUTE 中的mysql_stmt_execute`是我们关注的重点，我们来看看

跟踪/sql/sql_prepare.cc代码

  void mysql_stmt_execute(THD *thd, char *packet)

  {

    if (!(stmt=find_prepared_statement(thd, stmt_id, "execute")))

    {

      send_error(thd);

      DBUG_VOID_RETURN;

    }

    init_stmt_execute(stmt);

    mysql_execute_command(thd);           // !

  }

这里做一个判断，看是否是execute，然后初始化语句，并开始执行mysql_execute_command(thd);可以看到，是通过thread来调用动作。

跟踪/sql/sql_parse.cc代码

  void mysql_execute_command(THD *thd)

       switch (lex->sql_command) {

       case SQLCOM_SELECT: ...

       case SQLCOM_SHOW_ERRORS: ...

       case SQLCOM_CREATE_TABLE: ...

       case SQLCOM_UPDATE: ...

       case SQLCOM_INSERT: ...                   // !

       case SQLCOM_DELETE: ...

       case SQLCOM_DROP_TABLE: ...

       }

lex 解析sql语句。然后进入SQLCOM_INSERT。

跟踪/sql/sql_parse.cc代码

case SQLCOM_INSERT:

{

  my_bool update=(lex->value_list.elements ? UPDATE_ACL : 0);

  ulong privilege= (lex->duplicates == DUP_REPLACE ?

                    INSERT_ACL | DELETE_ACL : INSERT_ACL | update);

  if (check_access(thd,privilege,tables->db,&tables->grant.privilege))

    goto error;

  if (grant_option && check_grant(thd,privilege,tables))

    goto error;

  if (select_lex->item_list.elements != lex->value_list.elements)

  {

    send_error(thd,ER_WRONG_VALUE_COUNT);

    DBUG_VOID_RETURN;

  }

  res = mysql_insert(thd,tables,lex->field_list,lex->many_values,

                     select_lex->item_list, lex->value_list,

                     (update ? DUP_UPDATE : lex->duplicates));

// !

  if (thd->net.report_error)

    res= -1;

  break;

}

对于插入数据，我们要做的第一件事情是：检查用户是否具有对表进行插入的适当特权，服务器通过调用check_access和check_grant函数在这里进行检查。

有了权限才可以做【插入】动作。

我们可以导航 /sql 目录，如下:

Program Name          SQL statement type

------------          ------------------

sql_delete.cc         DELETE

sql_do.cc             DO

sql_handler.cc        HANDLER

sql_help.cc           HELP

sql_insert.cc         INSERT            // !

sql_load.cc           LOAD

sql_rename.cc         RENAME

sql_select.cc         SELECT

sql_show.cc           SHOW

sql_update.cc         UPDATE

sql_insert.cc是具体执行插入的操作。

上面的mysql_insert() 的方法具体实现，在sql_insert.cc文件中。

跟踪 /sql/sql_insert.cc代码

 int mysql_insert(THD *thd,TABLE_LIST *table_list, List<Item> &fields,

        List<List_item> &values_list,enum_duplicates duplic)

  {

    table = open_ltable(thd,table_list,lock_type);

    if (check_insert_fields(thd,table,fields,*values,1) ||

      setup_tables(table_list) ||

      setup_fields(thd,table_list,*values,0,0,0))

      goto abort;

    fill_record(table->field,*values);

    error=write_record(table,&info);                 // !

    query_cache_invalidate3(thd, table_list, 1);

    if (transactional_table)

      error=ha_autocommit_or_rollback(thd,error);

    query_cache_invalidate3(thd, table_list, 1);

    mysql_unlock_tables(thd, thd->lock);

    }

这里就要开始，打开一张表。然后各种检查，看插入表的字段是否有问题。不行就abort。

然后，开始填充记录数据。最终调用write_record 写记录的方法。

由于write_record 会对应不同的存储引擎，所以这里有分支的。我这里讲解两种

继续跟踪/sql/sql_insert.cc

  int write_record(TABLE *table,COPY_INFO *info)

  {

    table->file->write_row(table->record[0];           // !

  }

终于，要写文件了。调用那个存储引擎呢？看handler.h

  /* The handler for a table type.

     Will be included in the TABLE structure */

  handler(TABLE *table_arg) :

table(table_arg),active_index(MAX_REF_PARTS),

    ref(0),ref_length(sizeof(my_off_t)),

block_size(0),records(0),deleted(0),

    data_file_length(0), max_data_file_length(0),

index_file_length(0),

    delete_length(0), auto_increment_value(0), raid_type(0),

    key_used_on_scan(MAX_KEY),

    create_time(0), check_time(0), update_time(0), mean_rec_length(0),

    ft_handler(0)

    {}

  ...

  virtual int write_row(byte * buf)=0;

写入之MyISAM的代码路径

官方文档默认调用的是 ha_myisam::write_row

代码 /sql/ha_myisam.cc

如下:

int ha_myisam::write_row(byte * buf)

{

  statistic_increment(ha_write_count,&LOCK_status);

   /* If we have a timestamp column, update it to the current time */

   if (table->time_stamp)

    update_timestamp(buf+table->time_stamp-1);

   /*

  If we have an auto_increment column and we are writing a changed row

    or a new row, then update the auto_increment value in the record.

  */

  if (table->next_number_field && buf == table->record[0])

    update_auto_increment();

  return mi_write(file,buf);     // !

}

这些以字母ha开头的程序是处理程序的接口，而这个程序是myisam处理程序的接口。我们这里就开始调用MyISAM了。

可以看到这里调用了mi_write(file,buf);

跟踪/myisam/mi_write.c

int mi_write(MI_INFO *info, byte *record)

{

  _mi_readinfo(info,F_WRLCK,1);

  _mi_mark_file_changed(info);

  /* Calculate and check all unique constraints */

  for (i=0 ; i < share->state.header.uniques ; i++)

  {

    mi_check_unique(info,share->uniqueinfo+i,record,

      mi_unique_hash(share->uniqueinfo+i,record),

      HA_OFFSET_ERROR);

  }

  ... to be continued in next snippet

这里有很多唯一性的校验，继续看下面

 ... continued from previous snippet

  /* Write all keys to indextree */

  for (i=0 ; i < share->base.keys ; i++)

  {

    share->keyinfo[i].ck_insert(info,i,buff,

      _mi_make_key(info,i,buff,record,filepos)

  }

  (*share->write_record)(info,record);

  if (share->base.auto_key)

    update_auto_increment(info,record);

}

这里就是我们写入到文件的地方。至此，MySQL的插入操作结束。

路径为:

main in /sql/mysqld.cc

handle_connections_sockets in /sql/mysqld.cc

create_new_thread in /sql/mysqld.cc

handle_one_connection in /sql/sql_parse.cc

do_command in /sql/sql_parse.cc

dispatch_command in /sql/sql_parse.cc

mysql_stmt_execute in /sql/sql_prepare.cc

mysql_execute_command in /sql/sql_parse.cc

mysql_insert in /sql/mysql_insert.cc

write_record in /sql/mysql_insert.cc

ha_myisam::write_row in /sql/ha_myisam.cc

mi_write in /myisam/mi_write.c

1.进入主函数入口

2.建立socket connection的请求

3.创建一个新的线程

4.处理线程，分配内存资源

5.do_command，是获取packet第一字节，看做什么操作，并接受余下字节。

6.dispatch_command，分发操作，这里分发的是insert。

7.mysql_stmt_execute，检查是否为execute，初始化，准备做execute动作。

8.mysql_execute_command ，lex解析SQL语句，进入到SQLCOM_INSERT

9.mysql_insert ，开始做插入操作。调用write_record

10.write_record，准备写入，看调用哪个存储引擎，写入前期准备工作

11.ha_myisam::write_row，ha_myisam进行插入写入。

12.mi_write，最后做写入操作。

文献参考:https://dev.mysql.com/doc/internals/en/guided-tour-skeleton.html

01MySQL内核分析-The Skeleton of the Server Code的更多相关文章

《Linux内核分析》第三周构建一个简单的Linux系统MenuOS
[刘蔚然原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000] WEEK THREE ...
【课程总结】Linux内核分析课程总结
程涵原创博客 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 每周实验报告: 反汇编一个简单的C程序 ...
“Linux内核分析”实验三报告
构造一个简单的Linux系统张文俊+原创作品转载请注明出处+<Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-10000290 ...
《Linux内核分析》第三周学习小结构造一个简单的Linux系统OS
郝智宇无转载 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 第三周构造一个简单的Linux系统Me ...
Linux内核分析 NO.3
跟踪分析Linux内核的启动过程于佳心原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-100002 ...
Linux内核分析——第三周学习笔记
20135313吴子怡.北京电子科技学院 chapter1 知识点梳理一.Linux内核源代码简介 (视频中对目录下的文件进行了简介,记录如下) arch目录占有相当庞大的空间 arch/x86目 ...
linux内核分析作业8：理解进程调度时机跟踪分析进程调度与进程切换的过程
1. 实验目的选择一个系统调用(13号系统调用time除外),系统调用列表,使用库函数API和C代码中嵌入汇编代码两种方式使用同一个系统调用分析汇编代码调用系统调用的工作过程,特别是参数的传递的方 ...
Linux内核分析作业7：Linux内核如何装载和启动一个可执行程序
1.可执行文件的格式在 Linux 平台下主要有以下三种可执行文件格式: 1.a.out(assembler and link editor output 汇编器和链接编辑器的输出) ...
linux内核分析作业6：分析Linux内核创建一个新进程的过程
task_struct结构: struct task_struct { volatile long state;进程状态 void *stack; 堆栈 pid_t pid; 进程标识符 u ...

随机推荐

JavaScript几种继承方式的总结
1.原型链继承直接将子类型的原型指向父类型的实例,即"子类型.prototype = new 父类型();",实现方法如下: //父类构造函数 function father(n ...
Springboot 内置tomcat 基本配置收集整理
配置一: server:# tomcat 配置 tomcat: # 接收队列长度 accept-count: 1000 # 最小空闲线程数 min-spare-threads ...
bypass disable_function的方法及蚁剑插件bypass-php-function使用
bypass disable_function的方法及蚁剑插件bypass-php-function使用在学习php时,发现有许多函数会对网站或系统造成很大危险隐患,常见的危险函数有: phpinf ...
js运算符和if语句，switch语句
逻辑运算符类型运算符算数运算符 + - * / % ++ -- 赋值运算符 = 比较运算符 > < >= <= == != ...
使用Mac的Remote Desktop Manager连接ubuntu16.04 & Win10的远程桌面
疫情严重,公司实行远程办公.自己只有mac电脑,苦于3个系统间跨平台建立远程桌面. 今天,终于尝试成功!特来记录,以防别人踩坑! Mac远程软件安装 Remote Desktop Manager软件非 ...
Java实现蓝桥杯历届试题合根植物
问题描述 w星球的一个种植园,被分成 m * n 个小格子(东西方向m行,南北方向n列).每个格子里种了一株合根植物. 这种植物有个特点,它的根可能会沿着南北或东西方向伸展,从而与另一个格子的植物合成 ...
Java实现 LeetCode 561 数组拆分 I（通过排序算法改写PS：难搞）
561. 数组拆分 I 给定长度为 2n 的数组, 你的任务是将这些数分成 n 对, 例如 (a1, b1), (a2, b2), -, (an, bn) ,使得从1 到 n 的 min(ai, bi ...
java实现第六届蓝桥杯三角形面积
三角形面积题目描述如图1所示.图中的所有小方格面积都是1. 那么,图中的三角形面积应该是多少呢? 请填写三角形的面积.不要填写任何多余内容或说明性文字. 28 简单的数学平面几何问题: 大正方形面 ...
java实现第四届蓝桥杯马虎的算式
马虎的算式题目描述小明是个急性子,上小学的时候经常把老师写在黑板上的题目抄错了. 有一次,老师出的题目是:36 x 495 = ? 他却给抄成了:396 x 45 = ? 但结果却很戏剧性,他的答 ...
Java重置Mysql主键自增长值
MySql 主键自增重置器(统一处理多个表) resetAutoincrement 是一款基于 Java 开发的程序,其功能为重置 mysql 数据库表的主键自增的值为最近的一个. 介绍开发背景主要 ...

01MySQL内核分析-The Skeleton of the Server Code

摘要

写入之MyISAM的代码路径

01MySQL内核分析-The Skeleton of the Server Code的更多相关文章

随机推荐

热门专题