pt-archiver（数据导入导出工具）

数据导入导出工具pt-archiver

工具可以将MySQL的表数据导出到一个新表或者一个文件,也有自己的应用场景，比如数据归档，删除数据，数据合并等。

具体用法：

pt-archiver [OPTIONS] --source DSN --where WHERE

PT工具链接参数DSN一般适用于所有toolkit工具。

DSN的详细参数：

a:查询

A:字符集

b：true代表禁用binlog

D：数据库

u：数据库链接账号

p：数据库链接密码

h：主机IP

F：配置文件位置

i：是否使用某索引

m：插件模块

P：端口号

S：socket文件

t：表

具体使用，从一张表导入到另外一张表，要注意的是新表必须是已经建立好的一样的表结构，不会自动创建表，而且where条件是必须指定的：

[root@mxqmongodb2 bin]# ./pt-archiver --source h=172.16.16.35,P=,D=tpcc,t=new_orders,u=root,p= --dest h=172.16.16.35,P=,D=test,t=new_orders,u=root,p= --no-check-charset --where 'no_o_id>3800' --progress  --no-delete --limit= --statistics

TIME ELAPSED COUNT

--21T11::

--21T11::

--21T11::

--21T11::

--21T11::

--21T11::

--21T11::

--21T11::

--21T11::

--21T11::

--21T11::

Started at --21T11::, ended at --21T11::

Source: D=tpcc,P=,h=172.16.16.35,p=...,t=new_orders,u=root

Dest: D=test,P=,h=172.16.16.35,p=...,t=new_orders,u=root

SELECT

INSERT

DELETE

Action Count Time Pct

commit  568.6790 98.71

inserting  4.9776 0.86

select  0.0689 0.01

other  2.4091 0.42

我们打开general_log，发现这个操作是一条一条执行的，每一条数据都是一个事物。例如下面：

--21T03::.328427Z  Query INSERT INTO `test`.`new_orders`(`no_o_id`,`no_d_id`,`no_w_id`) VALUES ('','','')

--21T03::.328819Z  Query commit

--21T03::.362113Z  Query commit

--21T03::.362565Z  Query INSERT INTO `test`.`new_orders`(`no_o_id`,`no_d_id`,`no_w_id`) VALUES ('','','')

--21T03::.362977Z  Query commit

而且整个处理过程不会对原表进行锁定，对于作为导出工具来说很优秀了。

具体使用，将表中数据导出到文件：

可以看下导出到文件：

[root@mxqmongodb2 bin]# ./pt-archiver --source h=172.16.16.35,P=,D=tpcc,t=new_orders,u=root,p= --no-check-charset --where 'no_o_id>3800' --progress  --no-delete --file "/home/sa/pt-archiver.dat" --limit=

TIME ELAPSED COUNT

--21T13::

--21T13::

--21T13::

--21T13::

--21T13::

--21T13::

--21T13::

--21T13::

--21T13::

--21T13::

--21T13::

我们要注意的是--no-delete这个参数，默认情况下是不指定这个参数会直接将数据删除，我们最好还是指定一下。

看一下日志，他是通过主键取数据，每次取1000条，而且分割成不同的批次来取：

--21T05::.332458Z  Query SELECT /*!40001 SQL_NO_CACHE */ `no_o_id`,`no_d_id`,`no_w_id` FROM `tpcc`.`new_orders` FORCE INDEX(`PRIMARY`) WHERE (no_o_id>) AND ((`no_w_id` > '') OR (`no_w_id` = '' AND `no_d_id` > '') OR (`no_w_id` = '' AND `no_d_id` = '' AND `no_o_id` > '')) ORDER BY `no_w_id`,`no_d_id`,`no_o_id` LIMIT

--21T05::.332963Z  Query commit

--21T05::.333220Z  Quit

再看一下导出的文件，发现是固定格式的文件：

[root@mxqmongodb2 sa]# head - pt-archiver.dat

最后看一下删除数据：

mysql> select count(*) from test.new_orders where no_o_id>;

+----------+

| count(*) |

+----------+

|  |

+----------+

 row in set (0.00 sec)

删除：

[root@mxqmongodb2 bin]# ./pt-archiver --source h=172.16.16.35,P=,D=test,t=new_orders,u=root,p= --no-check-charset --where 'no_o_id>3900' --purge --limit=

mysql> select count(*) from test.new_orders where no_o_id>;

+----------+

| count(*) |

+----------+

|  |

+----------+

 row in set (0.00 sec)

然后看一下日志文件：

--21T05::.655361Z  Query SELECT /*!40001 SQL_NO_CACHE */ `no_o_id`,`no_d_id`,`no_w_id` FROM `test`.`new_orders` FORCE INDEX(`PRIMARY`) WHERE (no_o_id>) AND ((`no_w_id` > '') OR (`no_w_id` = '' AND `no_d_id` > '') OR (`no_w_id` = '' AND `no_d_id` = '' AND `no_o_id` >= '')) ORDER BY `no_w_id`,`no_d_id`,`no_o_id` LIMIT

--21T05::.656582Z  Query DELETE FROM `test`.`new_orders` WHERE (`no_w_id` = '' AND `no_d_id` = '' AND `no_o_id` = '')

--21T05::.657058Z  Query commit

--21T05::.710106Z  Query DELETE FROM `test`.`new_orders` WHERE (`no_w_id` = '' AND `no_d_id` = '' AND `no_o_id` = '')

--21T05::.710659Z  Query commit

--21T05::.756656Z  Query DELETE FROM `test`.`new_orders` WHERE (`no_w_id` = '' AND `no_d_id` = '' AND `no_o_id` = '')

--21T05::.757106Z  Query commit

--21T05::.814019Z  Query DELETE FROM `test`.`new_orders` WHERE (`no_w_id` = '' AND `no_d_id` = '' AND `no_o_id` = '')

--21T05::.814538Z  Query commit

--21T05::.869874Z  Query DELETE FROM `test`.`new_orders` WHERE (`no_w_id` = '' AND `no_d_id` = '' AND `no_o_id` = '')

--21T05::.870439Z  Query commit

--21T05::.926640Z  Query SELECT 'pt-archiver keepalive'

--21T05::.927001Z  Query DELETE FROM `test`.`new_orders` WHERE (`no_w_id` = '' AND `no_d_id` = '' AND `no_o_id` = '')

是先分批量查出来，然后逐条进行删除。

pt-archiver（数据导入导出工具）的更多相关文章

HData——ETL 数据导入/导出工具
HData是一个异构的ETL数据导入/导出工具,致力于使用一个工具解决不同数据源(JDBC.Hive.HDFS.HBase.MongoDB.FTP.Http.CSV.Excel.Kafka等)之间数据 ...
MySQL多线程数据导入导出工具Mydumper
http://afei2.sinaapp.com/?p=456 今天在线上使用mysqldump将数据表从一个库导入到另外一个库,结果速度特别慢,印象中有个多线程的数据导入导出工具Mydumper,于 ...
Oracle exp/imp数据导入导出工具基本用法
一.获取帮助 exp/imp help=y 二.数据导出 1.将数据库完全导出,设置full选项exp system/manager@orcl file=d:\db.dmp full=y 2.导出数据 ...
HBase数据导入导出工具
hbase中自带一些数据导入.导出工具 1. ImportTsv直接导入 1.1 hbase中建表 create 'testtable4','cf1','cf2' 1.2 准备数据文件data.txt ...
PLSQL_数据泵Datapump导入导出数据IMPDP / EXPDP（概念）（Oracle数据导入导出工具）（转）
一.摘要在平常备库和数据库迁移的时候,当遇到大的数据库的时候在用exp的时候往往是需要好几个小时,耗费大量时间.oracle10g以后可以用expdp来导出数据库花费的时间要远小于exp花费的时间, ...
Sqoop -- 用于Hadoop与关系数据库间数据导入导出工作的工具
Sqoop是一款开源的工具,主要用于在Hadoop相关存储(HDFS.Hive.HBase)与传统关系数据库(MySql.Oracle等)间进行数据传递工作.Sqoop最早是作为Hadoop的一个第三 ...
sqlserver自带的导入导出工具，分别导入大批量mysql和oracle数据时的感受
sqlserver自带的导入导出工具,分别导入大批量mysql和oracle数据时,mysql经常出现格式转换出错,不好导入导入的数据量比较大时,还不如自己写个工具导入今天在导oracle时,想 ...
MySQL数据导入导出方法与工具mysqlimport
MySQL数据导入导出方法与工具mysqlimport<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office ...
ITTC数据挖掘平台介绍（五）数据导入导出向导和报告生成
一. 前言经过了一个多月的努力,软件系统又添加了不少新功能.这些功能包括非常实用的数据导入导出,对触摸进行优化的画布和画笔工具,以及对一些智能分析的报告生成模块等.进一步加强了平台系统级的功能. 马 ...

随机推荐

SQLite3开发接口函数详解
SQLite3是SQLite一个全新的版本,它虽然是在SQLite 2.8.13的代码基础之上开发的,但是使用了和之前的版本不兼容的数据库格式和API. SQLite3是为了满足以下的需求而开发的: ...
JAVA统计一定范围内的质数个数
public class TestNumber{ public static void main(String[] args){ System.out.println(roundPrimeCount( ...
点击劫持（click jacking）
什么是点击劫持劫持原理劫持案例代码示例优酷频道刷粉的POC腾讯微博刷粉防御什么是点击劫持点击劫持,clickjacking,也被称为UI-覆盖攻击.这个词首次出现在2008年,是由互联网安全专家罗 ...
我的Python升级打怪之路【六】：面向对象（一）
面向对象的概述面向过程:根据业务逻辑从上到下写代码函数式:将其功能代码封装到函数中,日后便无需编写,仅仅调用即可 [执行函数] 面向对象:对函数进行分类和封装.[创建对象]==>[通过对象执 ...
CentOS6.4 安装sftp
1.打开命令终端窗口,按以下步骤操作.使用ssh -V 命令来查看openssh的版本,版本必须大于4.8p1,低于的这个版本需要升级. [root@ecs-3c46 ~]# ssh -v OpenS ...
ZOJ 3769 Diablo III
描述 Diablo III is an action role-playing video game. A few days ago, Reaper of Souls (ROS), the new e ...
java 写入数据到Excel文件中_Demo
=======第一版:基本功能实现======= import com.google.common.collect.Maps; import org.apache.log4j.Logger; impo ...
c#实现gzip压缩解压缩算法：byte[]字节数组，文件，字符串，数据流的压缩解压缩
转载:https://blog.csdn.net/luanpeng825485697/article/details/78165788 我测试了下压缩byte[],是可以的 using System; ...
SQL Cookbook—字符串
1.遍历字符串2.计算字符在字符串中出现的次数3.从字符串中删除不需要的字符4.将字符和数字数据分离5.判别字符串是不是字母数字型的6.提取姓名的大写首字母缩写7.按字符串中的部分内容排序8.按字符串 ...
8、在Shell脚本中使用函数
学习目标Shell的函数 Shell程序也支持函数.函数能完成一特定的功能,可以重复调用这个函数.函数格式如下: 函数名() { 函数体 } 函数调用方式: 函数名参数列表实例:编 ...

pt-archiver（数据导入导出工具）

pt-archiver（数据导入导出工具）的更多相关文章

随机推荐

热门专题