Facebook背后的软件

Facebook的数据规模使得很多传统的解决方案根本不适用，或者无法分解来处理。保持一个拥有5亿用户的系统一直稳定可靠的运行，并不是一件很容易的事情。这篇文章介绍了一下Facebook使用的软件。

Facebook的扩展性挑战

在我们讨论细节之前，这里有一些Facebook已经做的软件规模：

> Facebook有570000000000每月页面浏览量（据Google Ad
Planner）。

> Facebook的照片量比其他所有图片网站加起来还多（包括Flickr等网站）。

> 每个月超过30亿张照片被上传。

> Facebook的系统服务每秒处理120万张照片。这不包括CDN服务中处理的照片。

> 每月超过25亿条的内容（状态更新，评论等）被共享。

> Facebook有超过30,000服务器（这个数字是去年的！）

Facebook扩展所依赖的软件

Facebook是在某些程度上说仍然是LAMP的站点，但它比普通的LAMP大得多，以纳入其他元素和很多服务，并修改现行的做法。

例如：

>
Facebook也使用PHP，但它已经为它建立一个编译器，以便它可以分为本地代码打开了Web服务器，从而提高性能。

> Facebook也使用Linux，但它特别为网络吞吐量做了优化。

>
Facebook也使用MySQL，但主要是作为一个Key-value的持久性存储，Jions和服务器逻辑操作在Web服务器上操作。因为在那里更容易执行。

>
还有是自编写的系统，如Haystack，一个高度可扩展的对象存储，用来存储Facebook的照片。还有Scribe，一个日志系统，可以运行在Facebook的巨大规模上的日志系统。

OK。现在我们介绍一下全球最大的社会网络网站的所使用的软件吧。

Memcached

memcached的是现在互联网最有名的软件之一了。这是一个分布式内存缓存系统，用来作为Web服务器和MySQL服务器之间的缓存层（因为数据库访问比较慢）。多年以来，Facebook已经提出了一些优化Memcached和一些周边软件的办法。如压缩network
stack。

Facebook的每时每刻都有数10TB的数据缓存在Memcached的数千台服务器上。它可能是世界上最大的Memcached的集群了。

HipHop for PHP

PHP作为一种脚本语言，和本地程序相比是运行缓慢的。 HipHop可以将PHP转换成C++代码，然后再进行编译，可以获得更好的性能。因为Facebook严重依赖PHP，这使得其可以让Web服务器运行的更有效率。

一个工程师小团队在Facebook（一开始只有三人）花了18个月时间开发HipHop，现在已经是可用状态。

Haystack

Haystack是Facebook的高性能照片存储/检索系统（严格来说，是一个对象存储，因此它并不一定要存储照片）。它有许多工作要做;有超过20亿张上传的照片，并且每一个被保存在四个不同的分辨率，因此有超过800亿张照片。

它不仅是对能够处理的上亿的照片，运行表现也是至关重要的。
正如我们前面提到的，Facebook的服务约120万张照片每秒，这个数字不包括CDN上的。这是一个惊人的数字。

BigPipe

BigPipe是Facebook开发的一个动态的网页服务系统。
Facebook使用它来按section(称为“pagelets”)处理每个网页，以获取最佳性能。

例如，在聊天窗口是分开的，新闻Feed也是分开的，等等。这些pagelets可以在一个页面表现的时候同时使用，这是该页面表现的时候获取进来的。即使某些工程的一部分关闭或中端，用户也可以获得一部分网页。

Cassandra

Cassandra是一个不会单点失败的分布式存储系统。这是为NoSQL运动的一个重要组成部分，并已公开的源代码（它甚至成为一个Apache项目）。Facebook在搜索功能中使用它。

除了Facebook，还有一些人也用它，例如Digg的。不过最近Twitter放弃了cassandra。

Scribe

Scribe是一个灵活的日志系统，Facebook在他的内部大量使用。它的能够处理在Facebook的大规模日志记录，并自动处理新的日志记录类别,Facebook有数百个日志类别(categories)。

Hadoop and Hive

Hadoop的是一个开源的map-reduce实现，使得它可以在进行大数据上进行运算。
Facebook的使用这个进行数据分析（而我们都知道，Facebook已经大量的数据）。 Hive就是发源于Facebook，使得对于Hadoop使用的SQL查询成为可能，从而是其更容易对非程序员使用。

Hadoop和Hive是开源的（Apache项目），有为数众多的追随者，例如雅虎和Twitter。

Thrift

Facebook使用的几种不同的语言和不同的services。 PHP是最终用于前端，Erlang是用于聊天，Java和C
++也使用于多种场所，也许还有其他语言。Thrift是一个内部开发的跨语言的框架，联系语言，使他们可以在一起合作，从而使他们之间可以交互。这使得Facebook可以更容易为继续保持其跨语言的发展。

Facebook已经让Thrift开源。更多的语言支持已被添加到Thrift。

Varnish

Varnish是一个HTTP加速器，可以作为一个负载平衡器，并缓存的内容，然后可以以闪电般的速度送达。

Facebook使用的arnish来处理照片和个人资料图片，处理每天数十亿的要求。和其他的东西一样，Varnish是开源的。

保持Facebook 顺畅运行的其他东西。

我们已经提到的软件，组成了Facebook的系统，并帮助运行在大规模上。但是，处理这么大的系统是一个复杂的任务，因此我们将列出一些其他的东西，他们保持了Facebook的平稳运行。

渐进发布和暗启动

Facebook有一个他们所谓的守门人制度（Gatekeeper），允许他们可以给不同的用户运行两套不同的系统。这让Facebook渐进的发布新的功能，A
/ B测试，只为Facebook雇员发布等的某些特性。
Gatekeeper也可以让Facebook实现“暗启动”，这是在用户使用一些功能之前，就激活某些功能（因为用户没有察觉，所以称之为暗启动）。这将作为一个现实世界的压力测试，在正式启动前，帮助揭露一些功能障碍和其他问题。
暗启动通常是在正式启动前两个星期。

Profiling的直播系统

Facebook的仔细监控其系统，有趣的是它也负责监察每一个PHP函数在生产环境的性能。检测各个PHP的环境的配置运行情况。使用开源工具，XHProf 。

渐进的利用关闭功能来提升性能

如果Facebook运行时出现性能问题，有一个办法，就是逐步禁用不太重要的功能，以增强Facebook的大量核心功能表现。

我们没有提及的事情

我们没有提到硬件相关的事情，但这也是提高可伸缩性的重要一环。例如，就像其他大型站点，Facebook利用CDN来处理静态内容。Facebook还有一个the huge data center，可以帮助他扩展更多的服务。

Facebook的开源情节

不仅是Facebook使用（和帮助），如Linux，Memcached的，MySQL和Hadoop的开源软件，以及许多其他情况下，也贡献许多了其内部开发的软件。

Facebook亦开源了Tornado，一个高性能的网络服务器框架，由FriendFeed团队开发。

关于开放源码软件清单，可以在Facebook’s Open Source page找到。

本文来自：颜开的博客——我自然

原文标题：Facebook背后的软件

译文链接：http://www.yankay.com/

原文链接：http://royal.pingdom.com/2010/06/18/the-software-behind-facebook/

Facebook背后的软件的更多相关文章

【附论文】Facebook推面部识别软件精准度高达97.25%
论文下载链接:http://pan.baidu.com/s/1gd86HXp 以下转载自36kr. 认脸对于人来说不是什么难事,除非是韩国小姐才需要最强大脑.但是计算机做同样的事情就要困难得多了.不过 ...
微软、谷歌、亚马逊、Facebook等硅谷大厂91个开源软件盘点（附下载地址）
开源软件中有大量专家构建的代码,大大节省了开发人员的时间和成本,热衷于开源的大厂们总是能够带给我们新的惊喜.2016年9月GitHub报告显示,GitHub已经有超过 520 万的用户和超 30 万的 ...
Facebook开源软件列表
从 Facebook 的 GitHub 账户中可以看到,Facebook 已经开源的开源项目有近 300 个,领域涉及移动.前端.Web.后端.大数据.数据库.工具和硬件等.Facebook 开源项目 ...
Facebook人工智能实验室的前世今生
Facebook人工智能实验室的前世今生是时候停止把Facebook当作纯粹的社交媒体公司来看了.它用无人机提供互联网服务,为了发展虚拟现实而收购Oculus,不懈追求人工智能,Facebook已经 ...
揭秘FaceBook Puma演变及发展——FaceBook公司的实时数据分析平台是建立在Hadoop 和Hive的基础之上，这个根能立稳吗？hive又是sql的Map reduce任务拆分，底层还是依赖hbase和hdfs存储
在12月2日下午的“大数据技术与应用”分论坛的第一场演讲中,来自全球知名互联网公司——FaceBook公司的软件工程师.研发经理邵铮就带来了一颗重磅炸弹,他将为我们讲解FaceBook公司的实时数据处 ...
Vue, React, AngularJS, Angular2 我们对流行JavaScript框架们的选择
转自<奇舞周刊>,好文章mark一下分割线一个有趣的事实是:IBM发表的2017年最值得学习的编程语言名单中,JavaScript榜上有名.这位IT巨头指出,JS在网站中惊人地达到94 ...
Vue, React, AngularJS, and Angular2. 我们对流行JavaScript框架们的选择
2017-08-04 前端大全 (点击上方公众号,可快速关注) 英文:ANTONI ZOLCIAK 译文:众成翻译 www.zcfy.cc/article/vue-react-angularjs-a ...
2017 年比较 Angular、React、Vue 三剑客(转载)
为 web 应用选择 JavaScript 开发框架是一件很费脑筋的事.现如今 Angular 和 React 非常流行,并且最近出现的新贵 VueJS 同样博得了很多人的关注.更重要的是,这只是一些 ...
[译] 2017 年比较 Angular、React、Vue 三剑客
原文地址:Angular vs. React vs. Vue: A 2017 comparison 原文作者:Jens Neuhaus 译文出自:掘金翻译计划本文永久链接:github.com/xi ...

随机推荐

Spring使用经验之Listener综述
Note:Spring使用版本是4.1.6.RELEASE 1. ContextLoaderListener最基本的SpringListener,加载Spring配置文件配置名为contextCon ...
本文演示如何配置ASP.NET Core项目以在Visual Studio（VS）2017中使用Telerik UI for ASP.NET Core。
学习时使用的是VS2017+Core2.1了,不再讨论VS2015和core1.1的东西. 配置ASP.NET Core Web应用程序以使用Telerik UI for ASP.NET Core: ...
CentOS-6.*安装配置SVN
安装说明系统环境:CentOS-6.3 安装方式:yum install (源码安装容易产生版本兼容的问题) 安装软件:系统自动下载SVN软件检查已安装版本 #检查是否安装了低版本的SVN [ro ...
SpringCloud系列七：使用Ribbon实现客户端侧负载均衡
1. 回顾在前面,已经实现了微服务的注册与发现.启动各个微服务时,Eureka Client会把自己的网络信息注册到Eureka Server上. 但是,在生成环境中,各个微服务都会部署多个实例,因 ...
Linux C 中 open close read write 使用实例
这里实现的是将文件cody.txt中的内容拷贝到to_cody.txt中去. 1 /* ======================================================== ...
grub.conf文件说明
default=0 timeout=5 splashimage=(hd0,0)/grub/splash.xpm.gz hiddenmenu title Red Hat Enterprise Linux ...
obj-fit
该 object-fit CSS 属性指定替换元素的内容应该如何适应到其使用的高度和宽度确定的框. 初始值 fill 适用于替换元素遗传是媒体视觉计算值按规定动画类型离散的为了规范 ...
配置AutoMapper映射规则《转》
配置AutoMapper映射规则 AutoMapper是基于约定的,因此在实用映射之前,我们需要先进行映射规则的配置. public class Source { public int SomeVal ...
分布式服务框架 Zookeeper（三）官方入门指南
入门指南:使用ZooKeeper来协调分布式应用这篇文档包含了让你快速上手ZooKeeper的信息.主要是针对那些想要试一把ZooKeeper的开发人员,包含了安装一个单一ZooKeeper服务器的 ...
gen_server边缘
我们以Module代表gen_server的callback模块 1, 实现gen_server behaviour的模块会产生一个新的process么? 毫无疑问,太会了!通过调用proc_lib: ...

Facebook背后的软件

Facebook背后的软件的更多相关文章

随机推荐

热门专题