mysql生成百万级数量测试数据
今天因为项目需要,想测试一下读取百万级数量数据的速度如何,无奈数据库没有现成符合要求的数据,网上百度一番有很都不错的文章,但是需要涉及到一些存储过程和用php代码什么的,虽说可以实现,但是感觉另外再弄这些比较麻烦,没有通用性,于是在几篇文章的参考下,.自己写了一段代码,直接生成的数据还是比较方便的,并且不是重复的数据.网上很多都是重复的,我只是做了一点小的修改,测试数据库是mysql 5.5,存储形式是MyISAM,每次生成的数据量是之前的一倍.测试的量有限,如有什么疑问欢迎评论指正.
首先我的生成table的代码如下:
SET FOREIGN_KEY_CHECKS=0; -- ----------------------------
-- Table structure for user
-- ----------------------------
DROP TABLE IF EXISTS `user`;
CREATE TABLE `user` (
`username_` bigint(255) NOT NULL AUTO_INCREMENT ,
`id_` varchar(255) CHARACTER SET latin1 COLLATE latin1_swedish_ci NULL DEFAULT NULL ,
`password_` varchar(255) CHARACTER SET latin1 COLLATE latin1_swedish_ci NULL DEFAULT NULL ,
PRIMARY KEY (`username_`)
)
ENGINE=MyISAM
DEFAULT CHARACTER SET=latin1 COLLATE=latin1_swedish_ci
AUTO_INCREMENT=4345501 ;
这里应该可以看到我的测试主键是username_,设置的是自动增加.
数据表设计完成之后需要插入一条数据,比方说随便插入个(1,1,1),这里就不再多提.
接下来就是和其他的博客所不同的了,直接贴出代码如下:
INSERT INTO USER (id_, password_)
SELECT
MD5(Rand()),
RAND()
FROM
USER
插入的内容直接替换成了md5函数所生成的字符串,当然这里可以用其他的生成函数,或者一时间为随机数种子什么的,或者直接用sbustr直接截取需要的长度都行,根据需要自行发挥就好.直接运行几次就可以达到想要的数据量,我测试的时候10w数据生成时间在1s左右,100w数据生成的时间在20s以内.具体时间如下如下:
Affected rows: 131072
Time: 1.237s Affected rows: 1048576
Time: 11.436s Affected rows: 2097152
Time: 33.112s
下面简单展示一下数据的效果:
8539769 b7dd0b3c4c05c24c17ffbac782380bfa 0.33960725678094406
8539770 76375a066cb84d6917f10f995e3bcab4 0.8744977376186268
8539771 96f64ceebae73c8ad8c70c8454c5e8de 0.5589919803282172
8539772 a6227053399504e8e43f2f270c7c6867 0.7503682642712893
8539773 499e38f691698a8dc9d6b09d8196a348 0.22606947480334852
8539774 f6707b6ba5613bbc976b0b0cd5608694 0.5420059194248225
8539775 87210a1472a3a0ac0a2fb267be926d29 0.2634874724442954
8539776 3a5160cd046a685d6c5bc1d7eb0df006 0.12820897822101504
8539777 873ca65bf8f16cf625cafe66157beb80 0.0645836108034324
8539778 7db474aa795bc426d96fcc227b85acd4 0.07320807787888504
8539779 0b7e470834663bf483b29879cf92d263 0.8097012590707291
8539780 4d87498d6b55d9e4be89cb49f5a2baa1 0.7254514980366933
8539781 17886ec3f1b8a74abccb5b6907ce418a 0.49626740766341554
8539782 56d0a73f1b7b8ae5e4108d1e1c0fc66a 0.9000175398774608
8539783 5771ffc3dd277f0f90bf70e9e50bdeac 0.6339268653038208
8539784 c6dd5f6242b1467b37e7a7754b49a93a 0.9444528584782527
8539785 b287343de15669e13c58783e0bdab87e 0.2392627999552179
8539786 fd216a8220ca4cf01cf354185d7f3670 0.04591774944767146
8539787 078ed0041a8d3c5cd80da0949f1e49c5 0.7190723165116015
8539788 b4df3c411abfbcad9b133f961aa0d205 0.24911454529419033
8539789 45c80eb49d90ac37383f27b3237391a7 0.26152578858800773
8539790 6917c5ccd8b46d2a76752b3eb3d94e45 0.7269593521272385
8539791 1100438096f9a168a9a64b0e2d5c47af 0.45849586972826706
8539792 cd605186ba36701ef566179b286ab04b 0.16878763229473273
8539793 9b1978f674244e393aafa57ce56c9c31 0.08050246264832324
8539794 29381a8b22bb91ff1bd0339b195b1d32 0.010458376268351801
8539795 90924c96c8ecf6b68a11eb67cd97ea38 0.47418726186658
8539796 4958f79ccfa8ae806870da3cb223f00d 0.9154328656526588
8539797 3fb17b3aafe4c17ecb6bafdc7e2d5fd2 0.12553936720410303
8539798 95ed08bbdb31dcc9aba57330fdab5160 0.14635246260683282
8539799 78993b5fac11a8bc35d68422d4ac06d0 0.6508427612957012
8539800 0b7ace71592830815a30fff7caa039db 0.048840577759631514
8539801 9f6d9871ba97d74d4ba78640ee596fd2 0.07038640237449334
8539802 aaded281f2d0057b578a52ae7c58f074 0.8977767218814946
8539803 e968a6d036fcca9abca2b9d9ef905a2a 0.42428037098076227
参考的一些文章列举在下面,如果有什么更好的建议也随时欢迎联系wangkun.it@qq.com.
mysql中迅速插入百万条测试数据的方法 - MokeyChan - 博客园
http://www.cnblogs.com/endtel/p/5404065.html
mysql 快速生成百万条测试数据 - 小哈-whzhaochao - CSDN博客
http://blog.csdn.net/whzhaochao/article/details/49126037
用一条SQL快速生成10万条测试数据 - SQL Server(mssql)数据库栏目 - 红黑联盟
http://www.2cto.com/database/201109/103397.html
mysql生成百万级数量测试数据的更多相关文章
- Sysbench测试神器:一条命令生成百万级测试数据
1. 基准测试 基准测试(benchmarking)是性能测试的一种类型,强调的是对一类测试对象的某些性能指标进行定量的.可复现.可对比的测试. 进一步来理解,基准测试是在某个时候通过基准测试建立一个 ...
- 教你几招,快速创建 MySQL 五百万级数据,愉快的学习各种优化技巧
我是风筝,公众号「古时的风筝」,一个兼具深度与广度的程序员鼓励师,一个本打算写诗却写起了代码的田园码农! 文章会收录在 JavaNewBee 中,更有 Java 后端知识图谱,从小白到大牛要走的路都在 ...
- MySQL数据库百万级高并发网站实战
在一开始接触PHP接触MYSQL的时候就听不少人说:“MySQL就跑跑一天几十万IP的小站还可以,要是几百万IP就不行了”,原话不记得了,大体 就是这个意思.一直也没有好的机会去验证这个说法,一是从没 ...
- 【转】使用MySQL处理百万级以上数据时,不得不知道的几个常识
---------------------------------------------------------------------------------------------------- ...
- JDBC实现往MySQL插入百万级数据
想往某个表中插入几百万条数据做下测试, 原先的想法,直接写个循环10W次随便插入点数据试试吧,好吧,我真的很天真.... DROP PROCEDURE IF EXISTS proc_initData; ...
- 使用MySQL处理百万级以上数据时,不得不知道的几个常识
最近一段时间参与的项目要操作百万级数据量的数据,普通SQL查询效率呈直线下降,而且如果where中的查询条件较多时,其查询速度简直无法容忍.之前数据量小的时候,查询语句的好坏不会对执行时间有什么明显的 ...
- 利用JDBC或者事物或者调用存储过程实现往MySQL插入百万级数据
转自:http://www.cnblogs.com/fnz0/p/5713102.html 想往某个表中插入几百万条数据做下测试, 原先的想法,直接写个循环10W次随便插入点数据试试吧,好吧,我真的很 ...
- mysql sql 百万级数据库优化方案
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索 ...
- 关于mysql处理百万级以上的数据时如何提高其查询速度的方法
1.应尽量避免在 where 子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描. 2.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉 ...
随机推荐
- 开涛spring3(6.9) - 对JDBC的支持 之 7.1 概述
7.1 概述 7.1.1 JDBC回顾 传统应用程序开发中,进行JDBC编程是相当痛苦的,如下所示: //cn.javass.spring.chapter7. TraditionalJdbcTes ...
- Python之日志处理(logging模块)
本节内容 日志相关概念 logging模块简介 使用logging提供的模块级别的函数记录日志 logging模块日志流处理流程 使用logging四大组件记录日志 配置logging的几种方式 向日 ...
- ionic 使用mobisscrolls,实现日期选择的插件
废话不多说,直接说用法: 1,先下载mobisscrolls的破解版,下载地址,链接:http://pan.baidu.com/s/1boSKf51 密码:5dft 当然你也可以去官网下载,不过官网的 ...
- windows上使用SecureCRT连接linux
前言: SecureCRT是一款支持SSH(SSH1和SSH2)的终端仿真程序,简单地说是Windows下登录UNIX或Linux服务器主机的软件.这样操作的时候不必进入到linux桌面,可以更方便的 ...
- LCA——求解最近公共祖先
LCA 在有根树中,两个节点 u 和 v 的公共祖先中距离最近的那个被称为最近公共祖先(LCA,Lowest Common Ancestor). 有多种算法解决 LCA 或相关的问题. 基于二分搜索的 ...
- 【小练习06】HTML+CSS--教学大讲堂
要求实现如下效果图: 代码演示 <!DOCTYPE html> <html> <head> <meta charset="UTF-8"&g ...
- SQLalchemy模块用法
安装 pip install sqlalchemy #!/usr/bin/env python # -*- coding:utf-8 -*- # 加载模块 from sqlalchemy.ext.de ...
- MySql俩种分页区别(注意)
注意俩个分页的区别哦~ SELECT * FROM city LIMIT 2 OFFSET 1; 从第二条记录开始 取二条记录 如下: SELECT * FROM city LIMIT 3,2; 从第 ...
- OC对象之旅 weak弱引用实现分析
Runtime学习 -- weak应用源码学习 Runtime源码分析,带你了解OC实现过程.其中参考了大量的大神的代码以及文献,里面也有个人的见解,欢迎拍砖,欢迎交流. 两种常见使用场景 /// ...
- Aop初步了解
AOP(aspect-oriented programming) aspect是一种新型的模块化机制,用来描述分散在对象,类或函数中横切关注点.从关注点中分离出横切关注点是面向切面的程序设计的核心概念 ...