从0到1,Java Web网站架构搭建的技术演进
俗话说得好,冰冻三尺非一日之寒,滴水穿石非一日之功,罗马也不是一天就建成的,对于开发人员来说,一个好的架构并不是一蹴而就的。
初始搭建
最开始,就是各种框架一搭,然后扔到 Tomcat 容器中跑,这时候我们的文件、数据库、应用都在一个服务器上。
服务分离
随着系统的上线,用户量也会逐步上升,很快一台服务器已经满足不了系统的负载,这时我们就要在服务器还没有超载时,提前做好准备。
由于我们是单体架构,优化架构在短时间内是不现实的,增加机器是一个不错的选择。这时,我们可能要把应用和数据库服务单独部署,如果有条件也可以把文件服务器单独部署。
反向代理
为了提升服务处理能力,我们在 Tomcat 容器前加一个代理服务器,一般使用 Nginx,当然你如果更熟悉 Apache 也未尝不可。
用户的请求发送给反向代理,然后反向代理把请求转发到后端的服务器。
从严格意义上说,Nginx 是属于 Web 服务器,一般处理静态 HTML、CSS、JS 请求;而 Tomcat 属于 Web 容器,专门处理 JSP 请求,当然 Tomcat 也是支持 Html 的,只是效果没 Nginx 好而已。
反向代理的优势,如下所示:
- 隐藏真实后端服务。
- 负载均衡集群。
- 高可用集群。
- 缓存静态内容实现动静分离。
- 安全限流。
- 静态文件压缩。
- 解决多个服务跨域问题。
- 合并静态请求(HTTP/2.0后已经被弱化)。
- 防火墙。
- SSL 以及 http2。
动静分离
基于以上 Nginx 反向代理,我们还可以实现动静分离,静态请求如 HTML、CSS、JS 等请求交给 Nginx 处理,动态请求分发给后端 Tomcat 处理。
Nginx 升级到 1.9.5+ 可以开启 HTTP/2.0 时代,加速网站访问。当然,如果公司不差钱,CDN 也是一个不错的选择。
服务拆分
在这分布式微服务已经普遍流行的年代,我们没必要踩过多的坑,就很容易进行拆分。
市面上已经有相对比较成熟的技术,比如阿里开源的 Dubbo(官方明确表示已经开始维护了),Spring 家族的 Spring Cloud,当然具体如何去实施,无论是技术还是业务方面都要有很好的把控。
01Dubbo
02SpringCloud
- 服务发现——Netflix Eureka
- 客服端负载均衡——Netflix Ribbon
- 断路器——Netflix Hystrix
- 服务网关——Netflix Zuul
- 分布式配置——Spring Cloud Config
03微服务与轻量级通信
- 同步通信和异步通信
- 远程调用 RPC
- REST
- 消息队列
持续集成部署
服务拆分以后,随之而来的就是持续集成部署,你可能会用到以下工具:Docker、Jenkins、Git、Maven。
基本拓扑结构如下所示:
整个持续集成平台的架构演进,如下图所示:
服务集群
Linux 集群主要分成三大类:
- 高可用集群。
- 负载均衡集群。
- 科学计算集群。
我们最常见的也是生产中最常接触到的就是负载均衡集群。
01负载均衡实现
负载均衡实现的三种方法:
DNS 负载均衡,一般域名注册商的 DNS 服务器不支持,但我用的阿里云解析已经支持。
四层负载均衡(F5、LVS),工作在 TCP 协议下。
七层负载均衡(Nginx、haproxy),工作在 HTTP 协议下。
02分布式 Session
大家都知道,服务一般分为有状态和无状态,而分布式 Session 就是针对有状态的服务。
分布式 Session 的几种实现方式:
- 基于数据库的 Session 共享。
- 基于 resin/tomcat web 容器本身的 Session 复制机制。
- 基于 oscache/Redis/memcached 进行 Session 共享。
- 基于 cookie 进行 Session 共享。
分布式 Session 的几种管理方式:
- Session Replication 方式管理 (即 Session 复制)。
简介:将一台机器上的 Session 数据广播复制到集群中其余机器上。
使用场景:机器较少,网络流量较小。
优点:实现简单、配置较少、当网络中有机器 Down 掉时不影响用户访问。
缺点:广播式复制到其余机器有一定延时,带来一定网络开销。
- Session Sticky 方式管理。
简介:即粘性 Session、当用户访问集群中某台机器后,强制指定后续所有请求均落到此机器上。
使用场景:机器数适中、对稳定性要求不是非常苛刻。
优点:实现简单、配置方便、没有额外网络开销。
缺点:网络中有机器 Down 掉时,用户 Session 会丢失、容易造成单点故障。
- 缓存集中式管理。
简介:将 Session 存入分布式缓存集群中的某台机器上,当用户访问不同节点时先从缓存中拿 Session 信息。
使用场景:集群中机器数多、网络环境复杂。
优点:可靠性好。
缺点:实现复杂,稳定性依赖于缓存的稳定性、Session 信息放入缓存时要有合理的策略写入。
目前生产中使用到的:
- 基于 Tomcat 配置实现的 Mem Cache 缓存管理 Session 实现(麻烦)。
- 基于 Os Cache 和 shiro 组播的方式实现(网络影响)。
- 基于 Spring-Session+Redis 的方式实现(最适合)。
03负载均衡策略
负载均衡策略的优劣及其实现的难易程度有两个关键因素:负载均衡算法,对网络系统状况的检测方式和能力。
rr 轮询调度算法
顾名思义,轮询分发请求。优点是实现简单,缺点是不考虑每台服务器的处理能力。
wrr 加权调度算法
我们给每个服务器设置权值 weight,负载均衡调度器根据权值调度服务器,服务器被调用的次数跟权值成正比。优点是考虑了服务器处理能力的不同。
sh 原地址散列
提取用户 IP,根据散列函数得出一个 key,再根据静态映射表,查出对应的 value,即目标服务器 IP。一单目标机器超负荷,则返回空。
dh 目标地址散列
同上,只是现在提取的是目标地址的 IP 来做哈希。优点是以上两种算法都能实现同一个用户访问同一个服务器。
lc 最少连接
优先把请求转发给连接数少的服务器。优点是使得集群中各个服务器的负载更加均匀。
wlc 加权最少连接
在 lc 的基础上,为每台服务器加上权值。算法为:(活动连接数*256+非活动连接数)÷权重 ,计算出来的值小的服务器优先被选择。优点是可以根据服务器的能力分配请求。
sed 最短期望延迟
sed 跟 wlc 类似,区别是不考虑非活动连接数。算法为:(活动连接数+1)*256÷权重,同样计算出来的值小的服务器优先被选择。
nq 永不排队
改进的 sed 算法,我们想一下什么情况下才能“永不排队”,那就是服务器的连接数为 0 的时候,那么假如有服务器连接数为 0,均衡器直接把请求转发给它,无需经过 sed 的计算。
LBLC 基于局部性的最少连接
均衡器根据请求的目的 IP 地址,找出该 IP 地址最近被使用的服务器,把请求转发之,若该服务器超载,则采用最少连接数算法。
LBLCR 带复制的基于局部性的最少连接
均衡器根据请求的目的 IP 地址,找出该 IP 地址最近使用的“服务器组”,注意,这里不是具体某个服务器,然后采用最少连接数算法,从该组中挑出具体的某台服务器出来,把请求转发之。
若该服务器超载,那么根据最少连接数算法,从在集群的非本服务器组的服务器中,找出一台服务器出来,加入本服务器组,然后把请求转发之。
读写分离
MySQL 主从配置,读写分离并引入中间件,开源的 MyCat,阿里的 DRDS 都是不错的选择。
如果是对高可用要求比较高,但是又没有相应的技术保障,建议使用阿里云的 RDS 或者 Redis 相关数据库,省事省力又省钱。
全文检索
如果有搜索业务需求,引入 solr 或者 elasticsearch 也是一个不错的选择,不要什么都塞进关系型数据库。
缓存优化
引入缓存无非是为了减轻后端数据库服务的压力,防止其"罢工"。
常见的缓存服务有:Ehcache、OsCache、MemCache、Redis,它们都是主流经得起考验的缓存技术实现,特别是 Redis 已大规模运用于分布式集群服务中,并证明了自己优越的性能。
消息队列
异步通知:比如短信验证,邮件验证这些非实时反馈性的逻辑操作。
流量削锋:应该是消息队列中的常用场景,一般在秒杀或团抢活动中使用广泛。
日志处理:系统中的日志是必不可少的,但是如何去处理高并发下的日志却是一个技术活,一不小心可能会压垮整个服务。
工作中我们常用到的开源日志 ELK,为嘛中间会加一个 Kafka 或者 Redis 就是这么一个道理(一群人涌入和排队进的区别)。
消息通讯:点对点通信(个人对个人)或发布订阅模式(聊天室)。
日志服务
消息队列中提到的 ELK 开源日志组件对于中小型创业公司是一个不错的选择。
安全优化
以上种种,没有安全做保证,一切都会归于零:
- 阿里云的 VPN 虚拟专有网络以及安全组配置。
- 自建机房的话,要自行配置防火墙安全策略。
- 相关服务访问,比如 MySQL、Redis、Solr 等如果没有特殊需求尽量使用内网访问并设置鉴权。
- 尽量使用代理服务器,不要对外开放过多的端口。
- HTTPS 配合 HTTP/2.0 也是个不错的选择。
架构师必备词汇
01高可用
- 负载均衡(负载均衡算法)
- 反向代理
- 服务隔离
- 服务限流
- 服务降级(自动优雅降级)
- 失效转移
- 超时重试(代理超时、容器超时、前端超时、中间件超时、数据库超时、NoSql超时)
- 回滚机制(上线回滚、数据库版本回滚、事务回滚)
02高并发
- 应用缓存
- HTTP 缓存
- 多级缓存
- 分布式缓存
- 连接池
- 异步并发
03分布式事务
- 二阶段提交(强一致)
- 三阶段提交(强一致)
- 消息中间件(最终一致性),推荐阿里的 RocketMQ。
04队列
- 任务队列
- 消息队列
- 请求队列
05扩容
- 单体垂直扩容
- 单体水平扩容
- 应用拆分
- 数据库拆分
- 数据库分库分表
- 数据异构
- 分布式任务
06网络安全
- SQL 注入
- XSS 攻击
- CSRF 攻击
- 拒绝服务(DoS,Denial of Service)攻击
架构师必备工具
01操作系统
Linux(必备)、某软的
02负载均衡
DNS、F5、LVS、Nginx、OpenResty、HAproxy、负载均衡SLB(阿里云)
03分布式框架
Dubbo、Motan、Spring-Could
04数据库中间件
DRDS (阿里云)、Mycat、360 Atlas、Cobar (不维护了)
05消息队列
RabbitMQ、ZeroMQ、Redis、ActiveMQ、Kafka
06注册中心
Zookeeper、Redis
07缓存
Redis、Oscache、Memcache、Ehcache
08集成部署
Docker、Jenkins、Git、Maven
09存储
OSS、NFS、FastDFS、MogileFS
10数据库
MySQL、Redis、MongoDB、PostgreSQL、Memcache、HBase
11网络
专用网络 VPC、弹性公网 IP、CDN
本文转载至 http://developer.51cto.com/art/201710/555744.htm
从0到1,Java Web网站架构搭建的技术演进的更多相关文章
- 从 0 到 1,Java Web 网站架构搭建的技术演进
初始搭建 最开始,就是各种框架一搭,然后扔到 Tomcat 容器中跑,这时候我们的文件.数据库.应用都在一个服务器上. 服务分离 随着系统的上线,用户量也会逐步上升,很快一台服务器已经满足不了系统的负 ...
- 【架构】浅谈web网站架构演变过程
浅谈web网站架构演变过程 前言 我们以javaweb为例,来搭建一个简单的电商系统,看看这个系统可以如何一步步演变. 该系统具备的功能: 用户模块:用户注册和管理 商品模块:商品展示和管 ...
- (转)web网站架构演变
浅谈web网站架构演变过程 前言 我们以javaweb为例,来搭建一个简单的电商系统,看看这个系统可以如何一步步演变. 该系统具备的功能: 用户模块:用户注册和管理 商品模块:商品展示和管 ...
- web网站架构
浅谈web网站架构演变过程 前言 我们以javaweb为例,来搭建一个简单的电商系统,看看这个系统可以如何一步步演变. 该系统具备的功能: 用户模块:用户注册和管理 商品模块:商品展示和管 ...
- Web网站架构演变—高并发、大数据
转 Web网站架构演变—高并发.大数据 2018年07月25日 17:27:22 gis_morningsun 阅读数:599 前言 我们以javaweb为例,来搭建一个简单的电商系统,看看这个系 ...
- 五分钟学Java:如何才能学好Java Web里这么多的技术
原创声明 本文作者:黄小斜 转载请务必在文章开头注明出处和作者. 系列文章介绍 本文是<五分钟学Java>系列文章的一篇 本系列文章主要围绕Java程序员必须掌握的核心技能,结合我个人三年 ...
- 班级作业:Java Web环境的搭建
Java Web环境的搭建 一.开发所需工具.(根据你的电脑以及系统选择合适的版本下载) 1.JDK .下载链接:https://www.oracle.com/technetwork/java/jav ...
- 分享:大型Web网站架构演变之9大阶段
前言 我们以Java Web为例,来搭建一个简单的电商系统,看看这个系统可以如何一步步演变. 该系统具备的功能: 用户模块:用户注册和管理 商品模块:商品展示和管理 交易模块:创建交易和管理 正文 阶 ...
- Java Web系统架构概览
大型网站系统架构的演进都是随着业务增长不断演进,所有的出发点都是为了满足业务需求.最初访问量下,功能简单时,单体软件可以解决所有问题:后来访问量逐渐增大,功能愈加丰富,此时单体软件的架构逐渐成为开发和 ...
随机推荐
- Setup JIRA Software 7.6.2 on Oracle Linux 6.8
OS Oracle Linux 6.8 V138414-01.iso Database mysql5.6.30 MySQL-5.6.30-1.el6.x86_64.rpm-bundle.tar JIR ...
- 如何在form初始化时自动隐藏FOLDER列
方法1:直接设定PROMPT列和数据列ITEM的VISIBLE属性为No 方法2:在WHEN-NEW-FORM-INSTANCE触发器里: l_old_itm := :system.cursor_it ...
- 使用tcp.validnode_checking允许、限制机器访问数据库
使用tcp.validnode_checking允许.限制机器访问数据库 在$OREACLE_HOME/network/admin下直接修改sqlnet.ora文件,增加如下内容: tcp. ...
- [Eclipse插件] Eclipse设置Tab键为空格(ctrl+shirt+f格式化生效)!
自定义format格式,用空格替换Tab键,ctrl+shit+f格式化后生效: 设置Eclipse中按Tab键为4个空格,这里标记下! Window-->Preferences-->Ja ...
- Java9 modules (Jigsaw)模块化迁移
要点 通过模块化的方式开发应用程序,实现更好的设计,如关注点分离和封装性. 通过Java平台模块化系统(JPMS),开发者可以定义他们的应用程序模块,决定其他模块如何调用他们的模块,以及他们的模块如何 ...
- 取url中的参数值
string url = "https://i.cnblogs.com/EditPosts.aspx?opt=1";//key不区分大小string key="opt&q ...
- IT人士感悟(转)
我今年39岁了,25岁研究生毕业,工作14年,回头看看,应该说走了不少的弯路,有一些经验和教训.现在开一个小公司,赚的钱刚够养家糊口的.看看这些刚毕业的学生,对前景也很迷茫,想抛砖引玉,谈谈自己的看法 ...
- 动态加入改动删除html表格内容
1.需求 须要实现收银台上加入改动删除商品信息时顾显能够实时看到其变化 2.解决 收银台和顾显通过tcp传输进行数据通信,顾显通过操作html中的表格进行数据加入改动和删除操作 3.代码 mytest ...
- 《深入理解Java虚拟机》笔记6
class文件由无符号数和表两种类型数据构成.表其实相当于一种结构体,内部又嵌套无符号数或者表. 用u1,u2,u4,u8分别代表一个字节,两个字节,四个字节,八个字节的无符号数. 如图中所示,cla ...
- 转: iOS崩溃堆栈符号表使用与用途
转:http://bugly.qq.com/blog/?p=119 iOS崩溃堆栈符号化,定位问题分分钟搞定! 2015.3.16 腾讯Bugly 微信分享 最近一段时间,在跟开发者沟通过程中,萝 ...