Web分布式系统设计准则

下面以一个上传和查询图片的例子来说明分布式web结构的设计考虑和常用的提高性能的方法。该例子提供上传图片和下载图片两个简单功能,并且有一下假设条件?:

- 可以存储无上限数量的图片,即存储需要scalability

- 下载图片提供低带宽延时,即速度要快

- 如果客户上传了一张图片,图片将永久保存在数据库,除非客户删除。即可靠性

- 系统容易维护

- 整个系统不能花费太高。

首先,这个例子系统提到了如下web系统设计的基本要求,其最简单的设计逻辑结构如下图。

- Availability 可用性, 即每时每刻保证网站可用。

-  Performance 性能, 即用户的响应要迅速。

- Reliability 可靠性, 即可靠的结果,两次相同的请求得到相同的结果,以及数据的一致性。

- Scalability 可扩展性, 即系统在负载加大时容易扩展。

- Manageability 易管理性,即系统是可以并且容易管理的。

- Cost 花费。即系统的花费靠谱。

Services

- 将不同模块的功能分块,每块提供不同的service(SOA, service oriented architecture),这样有利于管理和切分问题

- 另外考虑读写的性能时间消耗,一般读的速度要大于写的速度。因为读操作可以从cache读,且一般IP网络设置上传和下载速度比为1:3,写操作最后都要写到磁盘。即使全部对磁盘数据库操作,读数据库的性能也要好于写数据库,参见:(Pole Position, an open source tool for DB benchmarking, http://polepos.org/ and results http://polepos.sourceforge.net/results/PolePositionClientServer.pdf.).

- 对系统性能和并发连接数有提升(比如,apache默认连接数是500,若上传和下载在一台服务器上,读操作很快,写则需要占用大量时间,从能导致端口被消耗,并发数减少)

分块后结构图:

冗余设计

为保证系统稳定,并且关键模块在出现错误时迅速恢复,必须采用冗余技术,采用冗余后的基本结构如下图:

分块存储

如果数据过大,将导致单一服务器无法存储所有数据,而且所有数据都保存在一台服务器中使数据检索的性能下降。扩展可以分为竖直单机扩展和水平增加服务器扩展。目前业界倾向于后者。数据分块后的书评扩展基本结构为:

在web系统体系机构中,最challenge的问题是数据读取和存储部分,应用程序请求处理部分可通过负载均衡和水平扩展解决,下面将上述系统简化,重点讨论数据获取的相关技术,简化后的系统结构可简单理解为:

一般而言读数据要比写数据频繁,但写数据要写到磁盘,比读数据耗时,接下来从读写两方面来看数据获取方面在体系结构上的设计技巧,想象如下的场景:

如果这种设计,找到想要的数据无疑大海捞针,为了提高查找和读数据性能,我们一般采用如下技术:

Cache(Memcached, )

上面设计的缺点是单个node的cache容量有限,解决见下图:

上图同样有缺点,当利用load balance时,若相同的request被分配到不同的node,很容易导致不同node的cache不命中,同样低效。

上图增加一个中间的统一大cache解决问题,若未命中,由global cache所在机器负责读硬盘,这可能导致cache频繁的换入换出是命中更低效。

上述结构为global的另外一种结构,即未命中有node自己去远程数据库查询。是gloabl的cache不会被换出,更适合于在global cache中存放频繁经常使用的全局数据。

代理(Squid and Varnish

索引

Load Balance

写操作提高性能的技术可采用异步队列机制(RabbitMQActiveMQBeanstalkD,  ZookeeperRedis.)

分布式可扩展web体系结构设计实例分析的更多相关文章

  1. Elasticsearch是一个分布式可扩展的实时搜索和分析引擎,elasticsearch安装配置及中文分词

    http://fuxiaopang.gitbooks.io/learnelasticsearch/content/  (中文) 在Elasticsearch中,文档术语一种类型(type),各种各样的 ...

  2. mvc结合web应用实例分析

    Mvc的web应用实例分析 Login.jsp——视图部分的输入文件success.jsp——视图部分的输出文件failure.jsp——视图部分的输出文件LoginBean.java——模型部分Lo ...

  3. Spring IOC源码分析(二):Bean工厂体系结构设计

    一. 概述 Spring容器通常指的是ApplicationContext的体系结构设计,即整个Spring框架的IOC功能,是通过ApplicationContext接口实现类来提供给应用程序使用的 ...

  4. Spring框架系列(6) - Spring IOC实现原理详解之IOC体系结构设计

    在对IoC有了初步的认知后,我们开始对IOC的实现原理进行深入理解.本文将帮助你站在设计者的角度去看IOC最顶层的结构设计.@pdai Spring框架系列(6) - Spring IOC实现原理详解 ...

  5. 可扩展Web架构与分布式系统

    原文:可扩展Web架构与分布式系统 开放源代码已经成为一些大型网站的基本原则.而在这些网站成长的过程中,一些优秀的实践经验和规则也出现在他们的结构中.本文旨在介绍一些在大型网站结构设计的过程中需要注意 ...

  6. Linux系统网络性能实例分析

    由于TCP/IP是使用最普遍的Internet协议,下面只集中讨论TCP/IP 栈和以太网(Ethernet).术语 LinuxTCP/IP栈和 Linux网络栈可互换使用,因为 TCP/IP栈是 L ...

  7. RPC原理及RPC实例分析

    在学校期间大家都写过不少程序,比如写个hello world服务类,然后本地调用下,如下所示.这些程序的特点是服务消费方和服务提供方是本地调用关系. 1 2 3 4 5 6 public class ...

  8. RPC-原理及RPC实例分析

    还有就是:RPC支持的BIO,NIO的理解 (1)BIO: Blocking IO;同步阻塞: (2)NIO:Non-Blocking IO, 同步非阻塞; 参考:IO多路复用,同步,异步,阻塞和非阻 ...

  9. [转]Apache漏洞利用与安全加固实例分析

    1.2 Apache文件解析特性 Apache对于文件名的解析是从后往前解析的,直到遇见一个它认识的文件类型为止.因此,如果web目录下存在以类似webshell.php.test这样格式命名的文件, ...

随机推荐

  1. Redis | 第一部分:数据结构与对象 中篇《Redis设计与实现》

    目录 前言 1. 跳跃表 1.1 跳跃表与其节点的定义 1.2 跳跃表的API 2. 整数集合 2.1 整数集合的实现 2.2 整数集合的类型升级 2.3 整数集合的API 3. 压缩列表 3.1 压 ...

  2. springboot配置自动提示插件-IDEA

    社区版的IDEA编辑spring boot项目的properties或者yml文件不会自动提醒.可手动安装IDEA的插件解决. Setting >> Plugins >> 搜索 ...

  3. html+css第三篇

    css reset 原则: 但凡是浏览默认的样式,都不要使用. body,dl,dd,p,h1,h2,h3,h4,h5,h6{margin:0;font-size:12px;} ol,ul{margi ...

  4. Codeforces 1067E - Random Forest Rank(找性质+树形 dp)

    Codeforces 题面传送门 & 洛谷题面传送门 一道不知道能不能算上自己 AC 的 D1E(?) 挺有意思的结论题,结论倒是自己猜出来了,可根本不会证( 开始搬运题解 ing: 碰到这样 ...

  5. Codeforces 1500F - Cupboards Jumps(set)

    Codeforces 题面传送门 & 洛谷题面传送门 nb tea!!!111 首先很显然的一件事是对于三个数 \(a,b,c\),其最大值与最小值的差就是三个数之间两两绝对值的较大值,即 \ ...

  6. DirectX12 3D 游戏开发与实战第九章内容(上)

    仅供个人学习使用,请勿转载. 9.纹理贴图 学习目标: 学习如何将局部纹理映射到网格三角形上 探究如何创建和启用纹理 学会如何通过纹理过滤来创建更加平滑的图像 探索如何使用寻址模式来进行多次纹理贴图 ...

  7. 【Python小试】计算目录下所有DNA序列的Kmer并过滤

    背景 Kmer是基因组组装算法中经常接触到的概念,简单来说,Kmer就是长度为k的核苷酸序列.一般长短为m的reads可以分成m-k+1个Kmer.Kmer的长度和阈值直接影响到组装的效果. Deno ...

  8. Docker镜像相关操作

    批量导入镜像 ll *.tgz|awk '{print $NF}'|sed -r 's#(.*)#docker load -i \1#' |bash 批量打tag docker images | se ...

  9. MapReduce02 序列化

    目录 MapReduce 序列化 概述 自定义序列化 常用数据序列化类型 int与IntWritable转化 Text与String 序列化读写方法 自定义bean对象实现序列化接口(Writable ...

  10. flink-----实时项目---day05-------1. ProcessFunction 2. apply对窗口进行全量聚合 3使用aggregate方法实现增量聚合 4.使用ProcessFunction结合定时器实现排序

    1. ProcessFunction ProcessFunction是一个低级的流处理操作,可以访问所有(非循环)流应用程序的基本构建块: event(流元素) state(容错,一致性,只能在Key ...