一.前言 数据平台已迭代三个版本,从头开始遇到很多常见的难题,终于有片段时间整理一些已完善的文档,在此分享以供所需朋友的 实现参考,少走些弯路,在此篇幅中偏重于ES的优化,关于HBase,Hadoop的设计优化估计有很多文章可以参考,不再赘述. 二.需求说明 项目背景: 在一业务系统中,部分表每天的数据量过亿,已按天分表,但业务上受限于按天查询,并且DB中只能保留3个月的数据(硬件高配),分库代价较高. 改进版本目标: 1. 数据能跨月查询,并且支持1年以上的历史数据查询与导出. 2. 按条件的…
如果从企业应用的生存率来看,选择企业团队信息作为主要业务,HipChat的起点绝非主流:但是如果从赚钱的角度上看,企业市场的高收益确实值得任何公司追逐,这也正是像JIRA和Confluence这样的智能工具制造商Atlassian于2012年收购HipChat的原因. 同时,或许你不知道的是,在Atlassian资源和人脉的帮助下,HipChat已经进入了一个指数增长周期.12亿的信息存储意味着他们现在每隔几个月的信息发送.存储和索引量都会翻一番. 如此快速的增长给曾经充足的基础设施带来了很大的…
过去16年,Google使用一个中心化源码控制系统去管理一个日益庞大的单一共享源码库.它的代码库包含了约10亿个文件(有重复文件和分支)和 3500万行注解,86TB数据,900万唯一源文件中含有大约20亿行代码.2014年,Google的2.5万名程序员每周修改25万个文件中的 1500万行代码(日均120行).相比之下,Linux内核源码库有4万文件和1500万行代码. Google的程序员每个工作日递交1.6万次commits(64%的人),还有 2.4万commits是自动系统完成的.代…
原文:Scaling Pinterest - From 0 To 10s Of Billions Of Page Views A Month In Two Years 译文:两年内从零到每月十亿 PV 的发展来谈 Pinterest 的架构设计 Pinterest正经历了指数级曲线般的增长,每隔一个半月翻翻.在这两年里,Pinterest,从 每月PV量0增长到10亿,从两名成立者和一个工程师成长为四十个工程师,从一台MySQL 服务器增长到180台Web 服务器(Web Engine),240…
MongoDB的扩展能力可以满足你业务需求的增长——这也是为什么它的名字来源于单词humongous(极大的)的原因.当然,这并不是说你在 使用MongoDB的路上并不会碰到一些发展的痛点.Crittercism是一家专门为手机应用程序提供技术支持的初创公司,该公司在过去两年间发展迅 猛,其运营总监Mike Chesnut于最近发表了一篇博文,描述了公司在快速发展的过程中遇到的一些MongoDB陷阱以及从中学到的经验.在今年6月将会举行的MongoDB World大会上,Mike Chesnut…
大数据计算:如何仅用1.5KB内存为十亿对象计数  Big Data Counting: How To Count A Billion Distinct Objects Using Only 1.5K This is a guest post by Matt Abrams (@abramsm), from Clearspring, discussing how they are able to accurately estimate the cardinality of sets with bi…
原文地址:http://developer.51cto.com/art/201502/464640.htm 就在不久之前,AppLovin移动广告平台的单一广告请求数量突破了200亿大关——相当于每一秒钟处理50万项事务——其如火如荼的发展态势帮助众多品牌在激励现有客户的同时.从市场中拉拢到了新的买家.那么AppLovin是如何打造出这样一套有能力应对数百亿请求.但又无需对硬件及运维人员进行显著扩张的基础设施的呢? 在今天的文章中,我们将共同了解该公司如何发现并选择采用各类最佳实践,从而通过技术…
原文:sql索引从入门到精通(十亿行数据测试报告) 导读部分 ------------------------------------------------------------------------------------------------------------- SQL Server 2005 学习笔记系列文章 http://www.sufeinet.com/thread-26-1-1.html 原文地址:http://www.sufeinet.com/thread-419-1…
http://ssdb.io/docs/zh_cn/index.html 用户案例 如果你在生产环境中使用 SSDB, 欢迎你给我发邮件(ssdb#udpwork.com), 我很愿意把你加入到下面的用户列表中. 邮件中请包含如下信息: 产品/公司/团队名称 LOGO(作为附件) 网站链接 公司/产品介绍 SSDB的使用简介, 作用描述 懒投资 懒投资 是由源码资本及中国福布斯富豪夏佐全先生联手投资的优质理财平台. 懒投资使用 SSDB 存储会话 Session, 网站定制, 缓存等数据, 并作…
腾讯开源再次迎来重磅项目,14日,腾讯正式宣布开源高性能图计算框架Plato,这是在短短一周之内,开源的第五个重大项目. 相对于目前全球范围内其它的图计算框架,Plato可满足十亿级节点的超大规模图计算需求,将算法计算时间从天级缩短到分钟级,性能全面领先领先于其它主流分布式图计算框架,并且打破了原本动辄需要数百台服务器的资源瓶颈,现在,最少只需要十台服务器即可完成计算. 腾讯Plato团队负责人于东海表示:"Plato已经支持腾讯内部包括微信在内的众多核心业务,尤其是为腾讯超大规模社交网络图数据…