数据迁徙是每个后端都会遇到的工作之一,本文介绍了一些常见的数据迁徙方法与工具

mysqldump:数据结构不变的数据迁徙

  1. 导出数据

    mysqldump -u root -p DATABASE_NAME table_name > dump.sql
  2. 恢复数据

    mysql -u root -p DATABESE_NAME < dump.sql

    或者连接mysql客户端

    mysql> source dump.sql

使用pymysql连接数据库

  1. 可以直接用用户名密码连接的数据库

    class GeneralConnector:
    def __init__(self, config, return_dic=False):
    self.return_dic = return_dic
    self.config = config def __enter__(self):
    self.conn = pymysql.connect(**self.config, port=3306)
    if self.return_dic:
    # 一行数据会变成一个字典
    self.cursor = self.conn.cursor(pymysql.cursors.DictCursor)
    else:
    self.cursor = self.conn.cursor()
    return self.cursor def __exit__(self, *args):
    self.cursor.close()
    self.conn.commit()
    self.conn.close()

    使用:

    # local_db = {
    # 'user': 'root',
    # 'passwd': '',
    # 'host': '127.0.0.1',
    # 'db': 'local_db'
    # }
    with GeneralConnector(const.local_db, return_dic=True) as cursor:
    cursor.execute('SELECT `col1`, `col2` FROM test;')
    return cursor.fetchall()
  2. 连接处于需要SSH连接的服务器的数据库

    class SSHConnector:
    def __init__(self, server, config, return_dic=False):
    self.return_dic=return_dic
    self.server = server
    self.config = config def __enter__(self):
    self.conn = pymysql.connect(**self.config, port=self.server.local_bind_port)
    if self.return_dic:
    # 一行数据会变成一个字典
    self.cursor = self.conn.cursor(pymysql.cursors.DictCursor)
    else:
    self.cursor = self.conn.cursor()
    return self.cursor def __exit__(self, *args):
    self.cursor.close()
    self.conn.commit()
    self.conn.close()

    使用:

    # SERVER = SSHTunnelForwarder(
    # (remote_host, ssh_port),
    # ssh_username=USERNAME,
    # ssh_pkey=SSH_KEY,
    # ssh_private_key_password=SSH_KEY_PASSWD,
    # remote_bind_address=('127.0.0.1', 3306) # mysql服务位置
    # )
    # server_db = {
    # 'user': 'root',
    # 'passwd': '',
    # 'host': '127.0.0.1',
    # 'db': 'server_db'
    # }
    # 创建一个隧道将服务端的mysql绑定到本地3306端口
    with const.SERVER as server:
    with SSHConnector(server, const.server_db) as cursor:
    cursor.execute('show tables;')
    data = cursor.fetchall()
    print(data)

cursor的各种操作

  1. cursor.execute(sql_statement)

    执行一条sql语句

  2. cursor.fetchall()

    获取cursor的所有结果,常跟在select语句后使用

  3. cursor.fetchone()

    获取cursor的第一条结果

  4. cursor.lastrowid

    最后一条数据的id

  5. cursor.executemany(insert_statement, data_list)

    批量插入一批数据,如

    with const.SERVER as server:
    with connector.Connector(server, const.db_1) as cursor:
    cursor.execute('select * from preference')
    preferences = cursor.fetchall() with connector.Connector(server, const.db_2) as cursor:
    cursor.executemany('insert into preference (`id`,`theme`,`user_id`) values (%s,%s,%s)',preferences)

从cursor获取list类型的结果

cursor.execute('SELECT `name` FROM user;')

直接使用fetchall(),只能得到tuple包裹的数据

cursor.fetchall()
# (('Jack',), ('Ben'))

现在希望得到一个list结果集,做到像Django中flat=True那样的效果

有两种方法

  1. 列表解析式(list comprehension)

    name_list = [x[0] for x in cursor.fetchall()]

    这个方法的缺点在于会先使用fetchall()将结果集读到内存,再做列表转换,并不高效。

  2. itertools工具

    name_list = list(itertools.chain.from_iterable(cursor))

    推荐使用这个方式,第一它不会将所有结果fetch到内存中,第二使用itertools生成列表比列表解析式要快

如何在数据迁徙中使用Django的model

  1. 需要拷贝Django的settings文件,删掉不需要的配置,并设置好迁徙目标数据库

  2. 需要拷贝用到此model的文件

  3. 需要在settings.INSTALLED_APPS中引入models.py文件所在的目录

  4. 在迁徙脚本头部启动Django

    import os
    import django
    import sys
    sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
    os.environ.setdefault("DJANGO_SETTINGS_MODULE", "translate.settings")
    django.setup()

通过SSH隧道的本地转发实现Django连接远程数据库

  1. 创建一个ssh隧道,将远程数据库映射到本地端口

    ssh -L local_port:localhost:<remote mysql port> <username>@<remote host>

    ssh连接进行时,可以通过访问本地端口来访问远程数据库

  2. 在Django的settings中配置数据库

    DATABASES = {
    'default': {
    'ENGINE': 'django.db.backends.mysql',
    'NAME': db_name,
    'USER': remote_mysql_user, # 远程数据库账号密码
    'PASSWORD': remote_mysql_password,
    'HOST': "localhost",
    'PORT': local_port, # 远程数据库映射到本地的端口
    'OPTIONS': {'init_command': 'SET default_storage_engine=INNODB;'}
    }
    }

至此,在使用Django的model时,将通过ssh隧道访问远程数据库

注意事项

  1. 事先了解迁徙数据量,并且取5%~10%的数据测试迁徙速度
  2. 由测试数据预估总迁徙用时,如果总迁徙用时大于一小时,一定要把迁徙脚本放到服务器运行,这样迁徙过程不易中断,且服务器性能远比个人电脑更优
  3. 尽量使用批量插入减少写数据库的次数,使用cursor.executemany或者Django的bulk_create
  4. 迁徙过程要写好log,这样能够知道数据迁徙到了哪一步,如意外终端也能找到断点继续运行
  5. 创建时间字段加上auto_add_now会自动记录数据的创建时间,在插入数据的时候对这个字段赋值无效

mysql数据迁徙详解的更多相关文章

  1. MySQL 联合索引详解

    MySQL 联合索引详解   联合索引又叫复合索引.对于复合索引:Mysql从左到右的使用索引中的字段,一个查询可以只使用索引中的一部份,但只能是最左侧部分.例如索引是key index (a,b,c ...

  2. MySQL关闭过程详解和安全关闭MySQL的方法

    MySQL关闭过程详解和安全关闭MySQL的方法 www.hongkevip.com 时间: -- : 阅读: 整理: 红客VIP 分享到: 红客VIP(http://www.hongkevip.co ...

  3. 【转】Nginx+php-fpm+MySQL分离部署详解

    转:http://www.linuxidc.com/Linux/2015-07/120580.htm Nginx+php-fpm+MySQL分离部署详解 [日期:2015-07-26] 来源:Linu ...

  4. Mysql加锁过程详解(8)-理解innodb的锁(record,gap,Next-Key lock)

    Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...

  5. Mysql加锁过程详解(9)-innodb下的记录锁,间隙锁,next-key锁

    Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...

  6. Mysql加锁过程详解(1)-基本知识

    Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...

  7. Mysql加锁过程详解(2)-关于mysql 幻读理解

    Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...

  8. Mysql加锁过程详解(3)-关于mysql 幻读理解

    Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...

  9. Mysql加锁过程详解(4)-select for update/lock in share mode 对事务并发性影响

    Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...

随机推荐

  1. Docker系列(一):容器监控工具Weave Scope安装

    项目进行容器化之后,配套的基础设施包括监控.编排.管理等都需要进行一并完善.这里也是自己一边学习一边进行记录. Weave Scope 的最大特点是会自动生成一张 Docker 容器地图,让我们能够直 ...

  2. ThinkPHP框架快速开发网站

    使用ThinkPHP框架快速搭建网站 这一周一直忙于做实验室的网站,基本功能算是完成了.比较有收获的是大概了解了ThinkPHP框架.写一些东西留作纪念吧.如果对于同样是Web方面新手的你有一丝丝帮助 ...

  3. 全网最新最简单的 OpenJDK13 代码编译

    目录 开始咯 1.下载源码 2.安装编译需要的依赖 3.安装 jdk 12 4.检查配置 5.开始编译 6.验证是否成功 回顾 个人博客原文:全网最新最简单的 OpenJDK13 代码编译 最近因写文 ...

  4. java第4天:String static Arrays类,Math类

    1 字符串的概述和特点 字符串一旦创建,是不可变的. 有双引号的就是字符串 *** 2 字符串的三种构造方法 2-1 第一种: 格式:String str = new String();| :-| 2 ...

  5. Java8 Lambda表达式详解手册及实例

    先贩卖一下焦虑,Java8发于2014年3月18日,距离现在已经快6年了,如果你对Java8的新特性还没有应用,甚至还一无所知,那你真得关注公众号"程序新视界",好好系列的学习一下 ...

  6. 未来实现API管理系统的几个关键词

    下面将通过几个关键词的形式说明API管理的重要性和未来的实现方式. 1.生命周期管理 在整个API生命周期中更深入地集成所有工具将进一步提高生命周期循环的速度,而且更重要的是提供满足消费者需求的API ...

  7. 直通BAT面试题库锦集

    01 python面试题(汇总) 02 面向对象 03 网络和并发编程 04 模块 05 设计模式 06 前端 07 Django框架 08 Flask 09 tornado 10 DB

  8. 【TencentOS tiny】深度源码分析(6)——互斥锁

    互斥锁 互斥锁又称互斥互斥锁,是一种特殊的信号量,它和信号量不同的是,它具有互斥锁所有权.递归访问以及优先级继承等特性,在操作系统中常用于对临界资源的独占式处理.在任意时刻互斥锁的状态只有两种,开锁或 ...

  9. Spring Boot2 系列教程(十二)@ControllerAdvice 的三种使用场景

    严格来说,本文并不算是 Spring Boot 中的知识点,但是很多学过 SpringMVC 的小伙伴,对于 @ControllerAdvice 却并不熟悉,Spring Boot 和 SpringM ...

  10. Windows 8.1硬盘安装Ubuntu 14.04双系统参考教程及多硬盘注意事项

    本文来自:http://www.linuxidc.com/Linux/2015-08/122140.htm,此处仅做收藏. Windows 8.1硬盘安装Ubuntu 14.04双系统参考教程及多硬盘 ...