Google揭开Mesa的神秘面纱——一个具备跨地域复制和近实时特性的可伸缩数据仓库

http://www.infoq.com/cn/news/2014/08/google-data-warehouse-mesa

Google发表了一篇新的论文，该论文描述了他们内部所使用的一个被称为Mesa的新型数据仓库系统。Mesa是一个规模横跨多个数据中心，并可以处理PB级数据的系统。该系统可以对查询作出亚秒级（sub-second）的响应，同时维持了ACID属性。

Mesa主要是围绕Google的广告业务使用场景而设计的。据Google描述，随着他们的广告平台的不断发展，客户对各自的广告活动的可视化提出了更高的要求。对于更具体和更细粒度的信息需求，直接导致了数据规模的急速增长。Google构建了Mesa从而能处理持续增长的数据量，同时它还提供了一致性和近实时查询数据的能力。我们可以从Google的白皮书中了解到Mesa的需求：

原子更新。某一单个的用户行为可能会引起多个关系数据级别的更新，从而影响定义在某个指标集上（例如：点击和成本）跨某个维度集（例如：广告客户和国家）的数千张一致性视图。所以系统状态不会在查询时处于一个只有部分更新生效的状态。

一致性和正确性。出于业务和法律的原因，该系统必须返回一致和正确的数据。即使某个查询牵涉到多个数据中心，我们仍然需要提供强一致性和可重复的查询结果。

可用性。系统不允许出现单点故障。不会出现由于计划中或非计划中的维护或故障所造成的停机，即使出现影响整个数据中心或地域性的断电也不能造成停机。

近实时的更新吞吐率。系统必须支持大约每秒几百万行规模的持续更新，包括添加新数据行和对现有数据行的增量更新。这些更新必须在几分钟内对跨不同视图和数据中心的查询可见。

查询性能。系统必须对那些对时间延迟敏感的用户提供支持，按照超低延迟的要求为他们提供实时的客户报表，而分批提取用户需要非常高的吞吐率。总的来说，系统必须支持将99%的点查询的延迟控制在数百毫秒之内，并且整体查询控制在每天获取万亿行的吞吐量。

可伸缩性。系统规模必须可以随着数据规模和查询总量的增长而伸展。举个例子，它必须支持万亿行规模和PB级的数据。但是即使上述参数再出现显著增长，更新和查询的性能必须仍然得以保持。

在线的数据和元数据转换。为了支持新功能的启用或对现有数据粒度的变更，客户端经常需要对数据模式进行转换或对现有数据的值进行修改。这些变更必须对正常的查询和更新操作没有干扰。

根据Google的描述，所有Google现有的大数据技术都无一能满足所有以上的需求。BigTable无法提供原子性和强一致性。而Megastore、Spanner和F1虽然为跨地域复制的数据提供了强一致性的访问，但是他们无法支持Mesa客户端所有需要的峰值更新吞吐率。

不管怎样，Mesa在其不同的基础设施中充分利用了现有的Google技术组件。它使用了BigTable来存储所有持久化的元数据，使用了Colossus (Google的分布式文件系统)来存储数据文件。此外，Mesa还利用了MapReduce来处理连续的数据。

Mesa概念上的数据模型与传统的关系型数据库极为相似。所有的数据都存储在表中。一个表同样也可以是另一个表的物化视图。每个表拥有一个指定了其结构的模式。因为“到底有多少”是广告业务中如此普遍的一个问题，所以一个例如像“SUM”这样的聚合函数可以作为表定义的一部分来指定。在模式中同样也可以指定一个或多个该表的索引。

在Mesa中，最有意思的一个方面是处理更新的方式。Mesa中存储的数据是多版本的，这使得当新的更新正在处理时，Mesa可以向用户提供前置状态的一致性数据。通常，每隔几分钟，上游系统就会执行一次数据更新的批处理。独立的各个无状态的数据提交者实例，负责对跨（Mesa运行所在的）全部数据中心的更新操作进行协调。提交者为每个更新批处理分配一个新的版本号，并基于Paxos一致算法向版本数据库发布全部与该更新关联的元数据。当一个更新满足提交的条件时，意味着一个给定的更新已经被全球范围内的大量Mesa实例进行了合并，提交者会将该次更新的版本号声明为新的提交版本号，并将该值存储在版本数据库里。查询通常都是根据提交版本号来分发的。

因为查询通常都是根据提交版本号来分发的，所以Mesa不需要在更新和查询之间进行任何的锁操作。更新都是由Mesa实例在批处理中进行异步实施的。这些属性使得Mesa获得了非常高的查询和更新吞吐率，同时也对数据一致性提供了保障。

Google提供了数个关于Mesa的更新和查询性能的基准测试数据。一个简单的数据源，平均每秒可以读取30到60MB的压缩数据、更新3到6百万个不同的行和新增30万个新行。在单独的一天里，Mesa执行了大约5亿次查询，返回了1.7到3.2万亿行，并且平均延迟是10毫秒，而且99%的延迟低于100毫秒。

据Google描述，Mesa中所存储的数据总量在过去的两年内扩增到了原来的五倍。这暗示了Mesa在Google内部的生产环境中已经使用了至少两年之久。

如果你是一个技术极客，并且想对Mesa进行更多的了解，那么你可以参考Google的Mesa白皮书。

Google揭开Mesa的神秘面纱——一个具备跨地域复制和近实时特性的可伸缩数据仓库的更多相关文章

从一个Demo开始，揭开Netty的神秘面纱
本文是Netty系列第5篇上一篇文章我们对于I/O多路复用.Java NIO包和 Netty 的关系有了全面的认识. 到目前为止,我们已经从I/O模型出发,逐步接触到了Netty框架.这个过程中, ...
ASP.NET 运行时详解揭开请求过程神秘面纱
对于ASP.NET开发,排在前五的话题离不开请求生命周期.像什么Cache.身份认证.Role管理.Routing映射,微软到底在请求过程中干了哪些隐秘的事,现在是时候揭晓了.抛开乌云见晴天,接下来就 ...
带你揭开ATM的神秘面纱
相信大家都用过ATM取过money吧,但是有多少人真正是了解ATM的呢?相信除了ATM从业者外了解的人寥寥无几吧,鄙人作为一个从事ATM软件开发的伪专业人士就站在我的角度为大家揭开ATM的神秘面纱吧. ...
揭开Future的神秘面纱——结果获取
前言在前面的两篇博文中,已经介绍利用FutureTask任务的执行流程,以及利用其实现的cancel方法取消任务的情况.本篇就来介绍下,线程任务的结果获取. 系列目录揭开Future的神秘面纱—— ...
揭开Future的神秘面纱——任务执行
前言此文承接之前的博文解开Future的神秘面纱之取消任务补充一些任务执行的一些细节,并从全局介绍程序的运行情况. 系列目录揭开Future的神秘面纱——任务取消揭开Future的神秘面纱— ...
揭开Future的神秘面纱——任务取消
系列目录: 揭开Future的神秘面纱——任务取消揭开Future的神秘面纱——任务执行揭开Future的神秘面纱——结果获取使用案例在之前写过的一篇随笔中已经提到了Future的应用场景和特 ...
SparkSQL大数据实战：揭开Join的神秘面纱
本文来自网易云社区 . Join操作是数据库和大数据计算中的高级特性,大多数场景都需要进行复杂的Join操作,本文从原理层面介绍了SparkSQL支持的常见Join算法及其适用场景. Join背景介 ...
揭开HTTPS的神秘面纱
摘自:https://www.cnblogs.com/hujingnb/p/11789728.html 揭开HTTPS的神秘面纱在说HTTP前,一定要先介绍一下HTTP,这家伙应该不用过多说明了 ...
揭开Redis的神秘面纱
本篇博文将为你解开Redis的神秘面纱,通过阅读本篇博文你将了解到以下内容: 什么是Redis? 为什么选择 Redis? 什么场景下用Redis? Redis 支持哪些语言? Redis下载 Red ...

随机推荐

Dynamics CRM Microsoft SQL Server 指定的数据库具有更高的版本
在做NLB部署时遇到这么个问题,CRMAPP1安装的CRM版本是6.1已经打了SP1补丁,而在CRMAPP2上的CRM安装包是6.0版本,在选择连接现有部署后,最后一步检测就出了问题,如下图所示. 看 ...
【Unity技巧】LOGO闪光效果
写在前面本文参考了风宇冲的博文,在按照这篇博文实现LOGO闪光时,发现了一些问题.最严重的就是背景无法透明,看上去背景始终是黑色的:其次就是各个变量的意义不是非常明确,调节起来不方便:而且在闪光条的 ...
关于js校验，检验常见的比如：电话，数字，邮箱，手机号等等
/** 验证数字:^[0-9]*$ 验证n位的数字:^\d{n}$ 验证至少n位数字:^\d{n,}$ 验证m-n位的数字:^\d{m,n}$ 验证零和非零开头的数字:^(0|[1-9 ...
TOMCAT数据源连接配置
/* *本文档简单介绍系统使用TOMCAT6.0数据源方式连接数据库的配置方法: *1,系统环境: gdczsam4.0 + Tomcat6.0 + JDK1.5 + SQL Server2008 ...
Cocos2D:塔防游戏制作之旅(二)
一个象牙塔的视图如果你并不熟悉此类型的游戏,塔防游戏是一个战略游戏,你需要购买和将武装塔放置在战略位置,去阻止一波又一波的敌人到达并摧毁你的基地每一波敌人都更强,这些更强的对手有着更快的速度和对于 ...
ROS(indigo)_turtlebot仿真示例包括stage和gazebo
ROS(indigo)_turtlebot仿真示例包括stage和gazebo 现上参考网址: turtlebot:http://wiki.ros.org/Robots/TurtleBot stage ...
Uva - 12174 - Shuffle
用滑动窗口的思想,用一个数组保存每个数在窗口中出现的次数.再用一个变量记录在窗口中恰好出现一次的的数的个数,这样可以枚举所有可能的答案,判断它所对应的所有串口,当且仅当所有的串口均满足要求时这个答案可 ...
GDAL中MEM格式的简单使用示例
GDAL库中提供了一种内存文件格式--MEM.如何使用MEM文件格式,主要有两种,一种是通过别的文件使用CreateCopy方法来创建一个MEM:另外一种是图像数据都已经存储在内存中了,然后使用内存数 ...
WdatePicker()时间控制方式（转载+原创）
控制时间在制定范围内: <input class="wzsrk" name="startDateStr" id="startDateStr ...
【Android 应用开发】Android 平台 HTTP网速测试案例 API 分析
作者 : 万境绝尘转载请注明出处 : http://blog.csdn.net/shulianghan/article/details/25996817 工信部规定的网速测试标准 : 除普通网页测速 ...

Google揭开Mesa的神秘面纱——一个具备跨地域复制和近实时特性的可伸缩数据仓库

Google揭开Mesa的神秘面纱——一个具备跨地域复制和近实时特性的可伸缩数据仓库的更多相关文章

随机推荐

热门专题