mysql生成百万级数量测试数据
今天因为项目需要,想测试一下读取百万级数量数据的速度如何,无奈数据库没有现成符合要求的数据,网上百度一番有很都不错的文章,但是需要涉及到一些存储过程和用php代码什么的,虽说可以实现,但是感觉另外再弄这些比较麻烦,没有通用性,于是在几篇文章的参考下,.自己写了一段代码,直接生成的数据还是比较方便的,并且不是重复的数据.网上很多都是重复的,我只是做了一点小的修改,测试数据库是mysql 5.5,存储形式是MyISAM,每次生成的数据量是之前的一倍.测试的量有限,如有什么疑问欢迎评论指正.
首先我的生成table的代码如下:
SET FOREIGN_KEY_CHECKS=0; -- ----------------------------
-- Table structure for user
-- ----------------------------
DROP TABLE IF EXISTS `user`;
CREATE TABLE `user` (
`username_` bigint(255) NOT NULL AUTO_INCREMENT ,
`id_` varchar(255) CHARACTER SET latin1 COLLATE latin1_swedish_ci NULL DEFAULT NULL ,
`password_` varchar(255) CHARACTER SET latin1 COLLATE latin1_swedish_ci NULL DEFAULT NULL ,
PRIMARY KEY (`username_`)
)
ENGINE=MyISAM
DEFAULT CHARACTER SET=latin1 COLLATE=latin1_swedish_ci
AUTO_INCREMENT=4345501 ;
这里应该可以看到我的测试主键是username_,设置的是自动增加.
数据表设计完成之后需要插入一条数据,比方说随便插入个(1,1,1),这里就不再多提.
接下来就是和其他的博客所不同的了,直接贴出代码如下:
INSERT INTO USER (id_, password_)
SELECT
MD5(Rand()),
RAND()
FROM
USER
插入的内容直接替换成了md5函数所生成的字符串,当然这里可以用其他的生成函数,或者一时间为随机数种子什么的,或者直接用sbustr直接截取需要的长度都行,根据需要自行发挥就好.直接运行几次就可以达到想要的数据量,我测试的时候10w数据生成时间在1s左右,100w数据生成的时间在20s以内.具体时间如下如下:
Affected rows: 131072
Time: 1.237s Affected rows: 1048576
Time: 11.436s Affected rows: 2097152
Time: 33.112s
下面简单展示一下数据的效果:
8539769 b7dd0b3c4c05c24c17ffbac782380bfa 0.33960725678094406
8539770 76375a066cb84d6917f10f995e3bcab4 0.8744977376186268
8539771 96f64ceebae73c8ad8c70c8454c5e8de 0.5589919803282172
8539772 a6227053399504e8e43f2f270c7c6867 0.7503682642712893
8539773 499e38f691698a8dc9d6b09d8196a348 0.22606947480334852
8539774 f6707b6ba5613bbc976b0b0cd5608694 0.5420059194248225
8539775 87210a1472a3a0ac0a2fb267be926d29 0.2634874724442954
8539776 3a5160cd046a685d6c5bc1d7eb0df006 0.12820897822101504
8539777 873ca65bf8f16cf625cafe66157beb80 0.0645836108034324
8539778 7db474aa795bc426d96fcc227b85acd4 0.07320807787888504
8539779 0b7e470834663bf483b29879cf92d263 0.8097012590707291
8539780 4d87498d6b55d9e4be89cb49f5a2baa1 0.7254514980366933
8539781 17886ec3f1b8a74abccb5b6907ce418a 0.49626740766341554
8539782 56d0a73f1b7b8ae5e4108d1e1c0fc66a 0.9000175398774608
8539783 5771ffc3dd277f0f90bf70e9e50bdeac 0.6339268653038208
8539784 c6dd5f6242b1467b37e7a7754b49a93a 0.9444528584782527
8539785 b287343de15669e13c58783e0bdab87e 0.2392627999552179
8539786 fd216a8220ca4cf01cf354185d7f3670 0.04591774944767146
8539787 078ed0041a8d3c5cd80da0949f1e49c5 0.7190723165116015
8539788 b4df3c411abfbcad9b133f961aa0d205 0.24911454529419033
8539789 45c80eb49d90ac37383f27b3237391a7 0.26152578858800773
8539790 6917c5ccd8b46d2a76752b3eb3d94e45 0.7269593521272385
8539791 1100438096f9a168a9a64b0e2d5c47af 0.45849586972826706
8539792 cd605186ba36701ef566179b286ab04b 0.16878763229473273
8539793 9b1978f674244e393aafa57ce56c9c31 0.08050246264832324
8539794 29381a8b22bb91ff1bd0339b195b1d32 0.010458376268351801
8539795 90924c96c8ecf6b68a11eb67cd97ea38 0.47418726186658
8539796 4958f79ccfa8ae806870da3cb223f00d 0.9154328656526588
8539797 3fb17b3aafe4c17ecb6bafdc7e2d5fd2 0.12553936720410303
8539798 95ed08bbdb31dcc9aba57330fdab5160 0.14635246260683282
8539799 78993b5fac11a8bc35d68422d4ac06d0 0.6508427612957012
8539800 0b7ace71592830815a30fff7caa039db 0.048840577759631514
8539801 9f6d9871ba97d74d4ba78640ee596fd2 0.07038640237449334
8539802 aaded281f2d0057b578a52ae7c58f074 0.8977767218814946
8539803 e968a6d036fcca9abca2b9d9ef905a2a 0.42428037098076227
参考的一些文章列举在下面,如果有什么更好的建议也随时欢迎联系wangkun.it@qq.com.
mysql中迅速插入百万条测试数据的方法 - MokeyChan - 博客园
http://www.cnblogs.com/endtel/p/5404065.html
mysql 快速生成百万条测试数据 - 小哈-whzhaochao - CSDN博客
http://blog.csdn.net/whzhaochao/article/details/49126037
用一条SQL快速生成10万条测试数据 - SQL Server(mssql)数据库栏目 - 红黑联盟
http://www.2cto.com/database/201109/103397.html
mysql生成百万级数量测试数据的更多相关文章
- Sysbench测试神器:一条命令生成百万级测试数据
1. 基准测试 基准测试(benchmarking)是性能测试的一种类型,强调的是对一类测试对象的某些性能指标进行定量的.可复现.可对比的测试. 进一步来理解,基准测试是在某个时候通过基准测试建立一个 ...
- 教你几招,快速创建 MySQL 五百万级数据,愉快的学习各种优化技巧
我是风筝,公众号「古时的风筝」,一个兼具深度与广度的程序员鼓励师,一个本打算写诗却写起了代码的田园码农! 文章会收录在 JavaNewBee 中,更有 Java 后端知识图谱,从小白到大牛要走的路都在 ...
- MySQL数据库百万级高并发网站实战
在一开始接触PHP接触MYSQL的时候就听不少人说:“MySQL就跑跑一天几十万IP的小站还可以,要是几百万IP就不行了”,原话不记得了,大体 就是这个意思.一直也没有好的机会去验证这个说法,一是从没 ...
- 【转】使用MySQL处理百万级以上数据时,不得不知道的几个常识
---------------------------------------------------------------------------------------------------- ...
- JDBC实现往MySQL插入百万级数据
想往某个表中插入几百万条数据做下测试, 原先的想法,直接写个循环10W次随便插入点数据试试吧,好吧,我真的很天真.... DROP PROCEDURE IF EXISTS proc_initData; ...
- 使用MySQL处理百万级以上数据时,不得不知道的几个常识
最近一段时间参与的项目要操作百万级数据量的数据,普通SQL查询效率呈直线下降,而且如果where中的查询条件较多时,其查询速度简直无法容忍.之前数据量小的时候,查询语句的好坏不会对执行时间有什么明显的 ...
- 利用JDBC或者事物或者调用存储过程实现往MySQL插入百万级数据
转自:http://www.cnblogs.com/fnz0/p/5713102.html 想往某个表中插入几百万条数据做下测试, 原先的想法,直接写个循环10W次随便插入点数据试试吧,好吧,我真的很 ...
- mysql sql 百万级数据库优化方案
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索 ...
- 关于mysql处理百万级以上的数据时如何提高其查询速度的方法
1.应尽量避免在 where 子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描. 2.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉 ...
随机推荐
- Webdriver+Java实现使用cookie跳过登录
Webdriver+Java实现使用cookie跳过登录 Webdriver模拟登录过程中很有可能遇到验证码,最近认真学习了下如何使用cookie直接跳过登录过程. 一.cookie的定义 来源百 ...
- shell中如何进行算术运算
A=3 B=6 1.let算术运算表达式 let C=$A+$B2.$[算术运算表达式] C=$[$A+$B] 3.$(()) C=$(($A+$NB))
- 发布支持多线程的PowerShell模块 —— MultiThreadTaskRunner
应用场景 多线程在需要批量处理一些任务的时候相当有用,也更加有利于充分利用现有计算机的能力.所有主流的开发语言都支持多线程. 默认情况下,PowerShell作为一个脚本语言,是不支持多线程操作的,虽 ...
- HTML输入框只能输入数字或数字字母组合
JS判断只能是数字和小数点 1.文本框只能输入数字代码(小数点也不能输入) <input onkeyup="this.value=this.value.replace(/\D/g,'' ...
- characterEncodingFilter作用
package com.demo.test; import java.io.IOException; import javax.servlet.Filter; import javax.servlet ...
- boost.property_tree读取中文乱码问题正确的解决方式
开发项目的时候在使用boost,在宽字符下遇到中文乱码问题 上网上看大家都是先转成utf8在进行解析的,例如: http://blog.csdn.net/hu_jiangan/article/deta ...
- Unity3d—做一个年月日选择器(Scroll Rect拖动效果优化)— 无限滚动 + 锁定元素
最近..... 废话不多说上效果图 用的是UGUI 我先说思路 通过判断元素的位置信息来改变Hierarchy的顺序 实现无限滚动 改变位置的同时也要不断的调整Content的位置防止乱跳 元素锁定就 ...
- rovio 视觉里程计的笔记
rovio是一个紧耦合,基于图像块的滤波实现的VIO. 他的优点是:计算量小(EKF,稀疏的图像块),但是对应不同的设备需要调参数,参数对精度很重要.没有闭环,没有mapping thread.经常存 ...
- 关于iphone点击readonly的input虚拟键盘不消失的情况
今天遇到了一个比较棘手的问题,事情是这样的: 咱有一个添加地址的页面,大概长这样: 收货地址后那个"请选择收货地址"是一个readonly的input, 咱一进页面,直接点击这个& ...
- IIS虚拟目录与UNC路径权限初探
最近在一个项目中涉及到了虚拟目录与UNC路径的问题,总结出来分享给大家. 问题描述 某客户定制化项目(官网),有一个图片上传的功能.客户的Web机器有10台,通过F5负载均衡分摊请求. 假设这10台机 ...