oralce 超过1亿条数据的数据库表清理实践

2018-08-18 16:58 无腿鸟阅读(331) 评论(0) 编辑收藏

问题：当一个表的数据量超过一亿条，要删除其中的5000w条，如何处理。

如果直接使用delete语句，会涉及到到大量的磁盘IO，并产生大量的数据库日志，效率很低，删除速度慢，可能导致事务中断，甚至有服务器硬盘空间撑爆的可能。

本文提供的思路是先将数据表需要保留的数据不带索引导出，然后导入一个新表中，对新表重建索引后将老表、新表进行重命名，这样就完成了删除操作，效率有了很大提升。

主要分为三步，1.数据导出2. 数据导入 3.表以及索引重命名。下面脚本是运行在oracle数据库上。

具体步骤如下：

1.数据导出：

进入数据库：sqlplus ，输入用户名与密码。进入sql运行界面。

创建虚拟目录：create or replace directory exp_dir as '/home/oracle/';

给目录授权，若失败继续：grant read,write on directory exp_dir to oracle;

提交：commit;

退出数据库：exit;

导出全量数据： expdp user/passwd@sername dumpfile=exp_table_eg_his_bak.dmp directory=exp_dir tables= exp_table_eg_his compression=all

dumpfile是指明dump文件名，directory是上面建立的虚拟目录，tables指明要导出的表。compression说明要对数据进行压缩，减少磁盘占用。数据量比较大，导出时间长，建议后台运行。

如果没有数据库用户密码，可使用操作系统oracle的权限以管理员身份进行导出。脚本如下：

expdp \'/ as sysdba \' dumpfile= exp_table_eg_his.bak .dmp directory=exp_dir tables= user.exp_table_eg_his compression=all

注意，exp_table_eg_his前要加user.，用以说明是哪个用户的表。导出全量的数据只是为了备份而已。

导出保留数据 :

expdp user/passwd123@sername dumpfile=exp_table_eg_his_new.dmp directory=exp_dir tables= exp_table_eg_his Query=\"where plat_number like \'2018%\'\" exclude=index

这里需要注意，query查询条件中的“”，‘’都要用\进行转义，否则会报错，exclude参数用来排除索引，oracle的索引是全局的，相同的索引名只能存在一个，为了后续方便导入，需要导出时把索引排除。

2. 数据导入：

impdp user/passwd123@sername directory=exp_dir dumpfile=exp_table_eg_his_new.dmp remap_table= exp_table_eg_his: exp_table_eg_his _new

remap_table用来将导入时将dump的表映射为新的表名。

进入数据库：进入toad

重建索引：

create unique INDEX exp_table_eg_his_ix_new ON exp_table_eg_his_new (plat_number) 。

关于建索引，最好将原表的的索引创建脚本导出，修改下索引名字与表名，这样可以保证索引的参数一致。

3. 重命名表与索引：

表重命名：alter table exp_table_eg_his rename to exp_table_eg_his _bak

alter table exp_table_eg_his _new rename to exp_table_eg_his

索引重命名：

alter index exp_table_eg_his_ix rename to exp_table_eg_his_ix_bak

alter index exp_table_eg_his_ix_new rename to exp_table_eg_his_ix

如果代码中没有显式用到索引名字，在数据库表重命名后索引也可以不用重命名。

删除原his表：drop table exp_table_eg_his_bak。备份表已无用，可以删掉了。

oralce 超过1亿条数据的数据库表清理实践的更多相关文章

超过70亿条数据的mysql 去重
1.数据库层面: 2.业务层面:接口去重.浏览器显示端去重:
过千万、亿条数据的mysql表更新 mysql 线程状态
分段更新 UPDATE question SET `status`=1 WHERE status!=1 LIMIT 3000;UPDATE answer SET `status`=1 WHERE st ...
net.sz.framework 框架 ORM 消消乐超过亿条数据排行榜分析天王盖地虎
序言天王盖地虎, 老婆马上生孩子了,在家待产,老婆喜欢玩消消乐类似的休闲游戏,闲置状态,无聊的分析一下消消乐游戏的一些技术问题: 由于我主要是服务器研发,客户端属于半吊子,所以就分析一下消消乐排行榜 ...
亿条数据在PHP中实现Mysql数据库分表100张
当数据量猛增的时候,大家都会选择库表散列等等方式去优化数据读写速度.笔者做了一个简单的尝试,1亿条数据,分100张表.具体实现过程如下: 首先创建100张表: $i=0; while($i<=9 ...
1亿条数据在PHP中实现Mysql数据库分表100张
当数据量猛增的时候,大家都会选择库表散列等等方式去优化数据读写速度.笔者做了一个简单的尝试,1亿条数据,分100张表.具体实现过程如下: 首先创建100张表: $i=0; while($i<=9 ...
PostgreSQL中COUNT的各条件下（1亿条数据）例子
test=# insert into tbl_time1 select generate_series(1,100000000),clock_timestamp(),now(); INSERT 0 1 ...
mysql 造1亿条记录的单表--大数据表
读写文件背景及木:现有数据1000w单表,为压力测试准备1亿条数据. 步骤: 1.将1000w条记录,除id外都导入到多个文件中: //DELIMITER DROP PROCEDURE if EXI ...
insert 一条数据然后拿出这条数据在数据库中生成的ID
[insert 一条数据然后拿出这条数据在数据库中生成的ID] <insert id="insert" parameterType="management&quo ...
通过js获取前台数据向一般处理程序传递Json数据，并解析Json数据，将前台传来的Json数据写入数据库表中
摘自:http://blog.csdn.net/mazhaojuan/article/details/8592015 通过js获取前台数据向一般处理程序传递Json数据,并解析Json数据,将前台传来 ...

随机推荐

Nginx记录post body内容
nginx在记录http的body内容时,会将中文转义为16进制在nginx 1.11.8 以上版本中log_format 增加了escape=json 参数,可以不转义变量内容: log_form ...
vue项目配置Mock.js
扯在前面最近一直在忙跳槽的事情,博客也好久没有更新了,上次更新还是去年,不出意外的话,从今天起继续今年的博客之旅. 今天继续完善我之前的项目架构,从零开始搭建vue移动端项目到上线,有需要的同学可以 ...
【kafka】安装部署kafka集群（kafka版本：kafka_2.12-2.3.0）
3.2.1 下载kafka并安装kafka_2.12-2.3.0.tgz tar -zxvf kafka_2.12-2.3.0.tgz 3.2.2 配置kafka集群在config/server.p ...
zabbix Server 4.0监控Flume关键参数
zabbix Server 4.0监控Flume关键参数作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. Flume本身提供了http, ganglia的监控服务.当然我们也可以使用 ...
HTML&CSS基础-常用选择器
HTML&CSS基础-常用选择器作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.html源代码 <!DOCTYPE html> <html> & ...
HTML&CSS基础-内边框
HTML&CSS基础-内边框作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.HTML源代码 <!DOCTYPE html> <html> &l ...
Matlab Cordic 一个数开方代码，适用FPGA
function [sqrt_value] = calsqrt(a)NormKn = ceil(log2(a)) - 1;fprintf("Normalization input data ...
MySQL学习总结（InnoDB）
主要内容: 存储结构索引锁事务存储结构表索引组织表:表是根据主键顺序组织存放的.如果表中没有非空惟一索引,引擎会自动创建一个6字节大小的指针. 主键的索引是定义索引的顺序,而不是建表时列的 ...
IDEA实用教程（八）—— 创建JavaWeb项目
七. 创建JavaWeb项目创建工程 1) 第一步 2) 第二步 3) 第三步如果要修改JavaEE版本,请根据下图所示进行修改 4) 第四步 2. 发布工程 1) 第一步 2) 第二步 3) 第 ...
JS之try..catch...
try 测试代码块的错误. catch 语句处理错误. throw 创建并跑出错误. try { //在这里运行代码抛出错误 }catch(err){ //在这里处理错误 } 实例: <p&g ...

oralce 超过1亿条数据的数据库表清理实践

oralce 超过1亿条数据的数据库表清理实践的更多相关文章

随机推荐

热门专题