三千万数据量下redis2.4的一统计情况

先说一下工作场景，要求做一个服务，满足：处理千万级别数据，单个请求响应时间在20ms以下。由于是存储的数据格式为key:list[]，所以很适合使用redis来存放数据，为了测试一下redis存储的效率问题，才有了这篇文章。

第一步：造数据。思路如下：（1）先产生三千万个key，为了解决随机函数不能很好平均分布的问题，采用两步走的方法来造3000W个key。首先，从key从1到3000万依次产生，解决数量问题。然后，再使用随机函数产生1000W数据，添加到这些key中。（2）为了提高效率，使用50个线程并发造数据，每个线程负责60万数据的入库工作。（3）对于其中的几种长度的key，插入1万条数据。【3000万数据，大约使用3G左右的内存，实体机内存为8G，分配给redis 4G】

第二步：计算访问速度。为了能比较准确地反映查询速度，产生1万个随机的key并进行访问，10000次get，大约用时15625ms，平均1.56ms一次。

查询时，对于key长度为14，且存有10000个数据的list，执行lrange(key,0, -1)，时间为31ms,而key长度为10，且存有10000个相同数据的list，执行lrange(key,0, -1)，时间为16ms。

插入时，list的key长度为14时插入10000个数据，用时23015ms，而key为10时，用时19875ms。

可见key长度增加4，查询时间由16ms上升到31ms，而插入一条记录的时间由1.9875ms上升到2.3015ms。

三点结论：

一：控制key的长度，尽量使用有意义且简短的词。

二：控制list的长度，尽量不要超过一万，如果可能超过一万，需要考虑过期删除机制。

三：redis占用的内存最好不要超过实际内存的50%，否则在插入时会有读取超时的情况。

测试环境操作系统：Linux x86_64 内存8G，redis版本：2.4.18【最新为2.6.14 http://redis.io】

三千万数据量下redis2.4的一统计情况的更多相关文章

c#中@标志的作用 C#通过序列化实现深表复制细说并发编程-TPL 大数据量下DataTable To List效率对比【转载】C#工具类：实现文件操作File的工具类异步多线程 Async .net 多线程 Thread ThreadPool Task .Net 反射学习
c#中@标志的作用参考微软官方文档-特殊字符@,地址 https://docs.microsoft.com/zh-cn/dotnet/csharp/language-reference/toke ...
达观数据CTO纪达麒:小标注数据量下自然语言处理实战经验
自然语言处理在文本信息抽取.自动审校.智能问答.情感分析等场景下都有非常多的实际应用需求,在人工智能领域里有极为广泛的应用场景.然而在实际工程应用中,最经常面临的挑战是我们往往很难有大量高质量的标注语 ...
总结MySQL大数据量下如何进行优化
写在建库前: 在确定数据库业务后.建立数据库表格时,就应对一些常见问题有所考虑,以避免在数据增长一段时间后再做应对,可能造成时间及维护成本增加: 数据的月增量,年增量数据的快速增长点是否需要触发器 ...
大数据量下的SQL Server数据库自身优化
原文: http://www.d1net.com/bigdata/news/284983.html 1.1:增加次数据文件从SQL SERVER 2005开始,数据库不默认生成NDF数据文件,一般情 ...
一文总结高并发大数据量下MySQL开发规范【军规】
在互联网公司中,MySQL是使用最多的数据库,那么在并发量大.数据量大的互联网业务中,如果高效的使用MySQL才能保证服务的稳定呢?根据本人多年运维管理经验的总结,梳理了一些核心的开发规范,希望能给大 ...
浅谈PageHelper插件分页实现原理及大数据量下SQL查询效率问题解决
前因:项目一直使用的是PageHelper实现分页功能,项目前期数据量较少一直没有什么问题.随着业务扩增,数据库扩增PageHelper出现了明显的性能问题.几十万甚至上百万的单表数据查询性能缓慢,需 ...
Mysql优化-大数据量下的分页策略
一.前言通常,我们分页时怎么实现呢? 1 SELECT * FROM table ORDER BY id LIMIT 1000, 10; 但是,数据量猛增以后呢? 1 SELECT * FROM t ...
大数据量下的集合过滤—Bloom Filter
算法背景如果想判断一个元素是不是在一个集合里,一般想到的是将集合中所有元素保存起来,然后通过比较确定.链表.树.散列表(又叫哈希表,Hash table)等等数据结构都是这种思路,存储位置要么是磁盘 ...
mysql大数据量下的分页
mysql大数据量使用limit分页,随着页码的增大,查询效率越低下. 测试实验 1. 直接用limit start, count分页语句, 也是我程序中用的方法: select * from p ...

随机推荐

POJ 2724 Purifying Machine（最大独立集）
POJ 2724 Purifying Machine 题目链接题意:这题题意有点没看懂.看了别人的题解, 给出m串长度为n的01串. 有些串中可能包括,这种串能够表示两个串,为1 和为0. 反复的算 ...
使用Net.Mail、CDO组件、JMail组件三种方式发送邮件
原文:使用Net.Mail.CDO组件.JMail组件三种方式发送邮件一.使用Net.Mail 需要服务器认证,大部分服务器端口为25. { MailMessage mailMsg = mailMs ...
effective C++ 札记规定17 在单独的陈述newed对象插入智能指针
// Test.cpp : 自定义控制台应用程序的入口点. // #include "stdafx.h" #include <iostream> #include &l ...
WebView Android 调用js且须要获取返回结果
Android webView调用js方法非常easy, webView.loadUrl("javascrpt:yourFunction()"); 可是此方法没有办法获取返回结果 ...
了解ASP.NET 5
通过3个Hello World应用来了解ASP.NET 5应用是如何运行的(1) 微软在开发ASP.NET 5(当时被称为ASP.NET vNext)是采用的代号为Project K,所以运行时被称为 ...
SqlServer-COMPUTE BY
原文:SqlServer-COMPUTE BY COMPUTE BY子句可以通过同一个select语句即查看明细行,又查看汇总行.可以计算子组的汇总值,也可以计算整个结果集的汇总值 COMPUTE 子 ...
iscroll4实现轮播图效果
相信很多人和我一样,在使用iscroll的是时候只知道可以手动滑动,不知道iscroll的轮播怎么实现一下就是我做的一个轮播效果,亲测有效: 1.html,当然可以动态添加下面的小圆点 <div ...
【MS SQL】通过执行计划来分析SQL性能
原文:[MS SQL]通过执行计划来分析SQL性能如何知道一句SQL语句的执行效率呢,只知道下面3种: 1.通过SQL语句执行时磁盘的活动量(IO)信息来分析:SET STATISTICS IO O ...
解决easyui datagrid load时缓存问题
修改easyui datagrid内容保存后,使用$("#dg").datagrid("reload");或者$("#dg").datagr ...
手机新闻网站,掌上移动新闻,手机报client,jQuery Mobile手机新闻网站,手机新闻网站demo,新闻阅读器开发
我们坐在地铁,经常来查看新浪手机新闻,腾讯新闻.或者刷微信看新闻更多功能.你有没有想过如何实现这些目标.移动互联网,更活泼. 因为HTML5到,jQuery Moblie到.今天我用jqm为了给你一个 ...

三千万数据量下redis2.4的一统计情况

三千万数据量下redis2.4的一统计情况的更多相关文章

随机推荐

热门专题