简介

Varnish是高性能开源的反向代理服务器和HTTP缓存服务器,其功能与Squid服务器相似,都可以用来做HTTP缓存。可以安装 varnish 在任何web前端,同时配置它缓存内容。与传统的 squid 相比,varnish 具有性能更高、速度更快、管理更加方便等诸多优点。有一部分企业已经在生产环境中使用其作为旧版本的 squid的替代方案,以在相同的服务器成本下提供更好的缓存效果,Varnish 更是作为 CDN 缓存服务器的可选服务之一。

Varnish 的作者Poul-Henning Kamp是FreeBSD的内核开发者之一,他认为现在的计算机比起1975年已经复杂许多。在1975年时,储存媒介只有两种:内存与硬盘。但现在计算机系统的内存除了主存外,还包括了CPU内的L1、L2,甚至有L3快取。硬盘上也有自己的快取装置,因此Squid Cache自行处理物件替换的架构不可能得知这些情况而做到最佳化,但操作系统可以得知这些情况,所以这部份的工作应该交给操作系统处理,这就是 Varnish cache设计架构。

varnish项目是2006年发布的第一个版本0.9.距今已经十多年多了,此文档之前也提过varnish还不稳定,那是2007年时候编写的,经过varnish开发团队和网友们的辛苦耕耘,现在的varnish已经很健壮。很多门户网站已经部署了varnish,并且反应都很好,甚至反应比squid还稳定,且效率更高,资源占用更少。相信在反向代理,web加速方面,varnish已经有足够能力代替squid。

varnish的官网为https://www.varnish-cache.org,rpm,rpm包的下载位置为:http://repo.varnish-cache.org

特性

  • 缓存位置:可以使用内存也可以使用磁盘。如果要使用磁盘的话推荐 SSD 做 RAID1;
  • 日志存储:日志也存储在内存中。存储策略:固定大小,循环使用;
  • 支持虚拟内存的使用;
  • 有精确的时间管理机制,即缓存的时间属性控制;
  • 状态引擎架构:在不同的引擎上完成对不同的缓存和代理数据进行处理。可以通过特定的配置语言设计不同的控制语句,以决定数据在不同位置以不同方式缓存,在特定的地方对经过的报文进行特定规则的处理;
  • 缓存管理:以二叉堆格式管理缓存数据,做到数据的及时清理。

Varnish与Squid对比

相同点

  • 都是一个反向代理服务器。
  • 都是开源软件。

Varnish的优势

  • Varnish 的稳定性很高。两者在完成相同负荷的工作时,Squid服务器发生故障的几率要高于Varnish,因为使用Squid要经常重启;

  • Varnish 访问速度更快。因为采用了“Visual Page Cache”技术,所有缓存数据都直接从内存读取,而squid是从硬盘读取,因而Varnish在访问速度方面会更快;

  • Varnish 可以支持更多的并发连接。因为Varnish的TCP连接释放要比Squid快,因而在高并发连接情况下可以支持更多TCP连接;

  • Varnish 可以通过管理端口,使用正则表达式批量的清除部分缓存,而Squid是做不到的;

  • Squid属于是单进程使用单核CPU,但Varnish是通过fork形式打开多进程来做处理,所以可以合理的使用所有核来处理相应的请求;

varnish与squid相比,都是一个反向代理缓存服务器,并且都是开源的,varnish的稳定性很高,并且访问速度很快,因为Squid是从硬盘读取缓存的数据,而Varnish把数据存放在内存中,直接从读取内存,避免了频繁在内存、磁盘中交换文件,所以Varnish要相对更高效,varnish可以支持更多的并发连接,因为varnish的TCP连接释放要比squid快;varnish也可以通过管理端口,使用正则表达式批量的清除部分缓存,而squid是做不到的;squid 属于是单进程使用单核 CPU,但 Varnish 是通过 fork 形式打开多进程来做处理,所以可以合理的使用所有核来处理相应的请求。

Varnish的劣势

  • Varnish进程一旦Hang、Crash或者重启,缓存数据都会从内存中完全释放,此时所有请求都会发送到后端服务器,在高并发情况下,会给后端服务器造成很大压力。
  • 在Varnish使用中如果单个url的请求通过HA/F5等负载均衡,则每次请求落在不同的varnish服务器中,造成请求都会被穿透到后端;而且同样的请求在多台服务器上缓存,也会造成varnish的缓存的资源浪费,造成性能下降。

劣势解决方案

  • 针对劣势一:在访问量很大的情况下推荐使用varnish的内存缓存方式启动,而且后面需要跟多台squid服务器。主要为了防止前面的varnish服 务、服务器被重启的情况下,大量请求穿透varnish,这样squid可以就担当第二层CACHE,而且也弥补了varnish缓存在内存中重启都会释放的问题;

  • 针对劣势二:可以在负载均衡上做url哈希,让单个url请求固定请求到一台varnish服务器上;

原理

系统架构

1.png

varnish主要运行两个进程:Management进程和Child进程(也叫Cache进程)。

Management进程主要实现应用新的配置、编译VCL、监控varnish、初始化varnish以及提供一个命令行接口等。Management进程会每隔一段时间探测一下Child进程以判断其是否正常运行,如果在指定的时长内未得到Child进程的回应,Mangagement将会重启此Child进程;

Child进程包含多种类型的线程,常见的如:

Acceptor进程:接受新的连接请求并响应

worker进程:child进程会为每个用户启动一个worker进程,因此,在高并发的场景中可能会出现数百个worker进程甚至更多;

Expiry进程:从缓存中清理过期内容

Varnish依赖“工作区(workspace)”以降低线程在申请或修改内存时出现竞争的可能性。在varnish内部有多种不同的工作区,其中最关键的当属用于管理会话数据的session工作区;

如何工作

Varnish 的master进程负责启动工作,master进程读取配置文件,根据指定的空间大小(例如管理员分配了2G内存)来创建存储空间,创建并管理child进程; 然后child进程来处理后续任务,它会分配一些线程来执行不同的工作,例如:接受http请求、为缓存对象分配存储空间、清除过期缓存对象、释放空间、碎片整理等。

http请求处理过程如下:

1、有一个专门负责接收http请求的线程,一直监听请求端口,当有请求过来时,负责唤起一个工作线程来处理请求,工作线程会分析http请求的uri,知道了这个请求想要什么,就到缓存中查找是否有这个对象,如果有,就把缓存对象直接返回给用户,如果没有,会把请求转给后端服务器处理,并等待结果,工作线程从后端得到结果内容后,先把内容作为一个缓存对象保存到缓存空间(以备下次请求这个对象时快速响应),然后再把内容返回给用户

分配缓存过程如下:

有一个对象需要缓存时,根据这个对象的大小,到空闲缓存区中查找大小最适合的空闲块,找到后就把这个对象放进去,如果这个对象没有填满这个空闲块,就把剩余的空间做为一个新的空闲块,如果空闲缓存区中没地方了,就要先删除一部分缓存来腾出地方,删除是根据最近最少使用原则。

释放缓存过程如下:

有一个线程来负责缓存的释放工作,他定期检查缓存中所有对象的生存周期,如果某个对象在指定的时间段内没有被访问,就把这个对象删除,释放其占用的缓存空间,释放空间后,检查一下临近的内存空间是否是空闲的,如果是,就整合为一个更大的空闲块,实现空间碎片的整理。

安装

安装配置varnish

  1. [root@varnish ~]# wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
  2. #下载阿里镜像站的repo文件
  3. [root@varnish ~]# yum -y install libedit-devel pcre-devel python-docutils #安装依赖包
  4. [root@varnish ~]# cd /usr/src #切换至指定目录
  5. [root@varnish src]# rz #上传我提供的varnish源码包
  6. [root@varnish src]# tar zxf varnish-4.0.3.tar.gz #解包
  7. [root@varnish src]# cd varnish-4.0.3/ #进入解压后的目录
  8. [root@varnish varnish-4.0.3]# ./configure && make && make install #编译安装
  9. [root@varnish varnish-4.0.3]# cp etc/example.vcl /usr/local/var/varnish/ #复制模板到指定路径
  10. [root@varnish varnish-4.0.3]# cd !$ #切换到varnish安装目录下
  11. [root@varnish varnish]# vim example.vcl #编辑其模板配置文件,根据自己所需功能,编写以下内容:
  12. vcl 4.0;
  13. import directors;
  14. import std;
  15. # Default backend definition. Set this to point to your content server.
  16. probe backend_healthcheck {
  17. .url="/"; #访问后端服务器根路径
  18. .interval = 5s; #请求时间间隔
  19. .timeout = 1s; #请求超时时间
  20. .window = 5; #指定轮询次数5次
  21. .threshold = 3; #如果出现3次失败则表示后端服务器宕机
  22. }
  23. backend web1 { #定义后端服务器
  24. .host = "192.168.171.134"; #要转向主机(即后端主机)的 IP 或域名
  25. .port = "80"; #指定后端服务器的端口号
  26. .probe = backend_healthcheck; #健康检查调用backend_healthcheck定义的内容
  27. }
  28. backend web2 {
  29. .host = "192.168.171.132";
  30. .port = "80";
  31. .probe = backend_healthcheck;
  32. }
  33. acl purgers { #定义访问控制列表
  34. "127.0.0.1";
  35. "localhost";
  36. "192.168.171.0/24";
  37. !"192.168.171.132";
  38. }
  39. sub vcl_init { #调用 vcl_init 初始化子程序创建后端主机组,即 directors
  40. new web_cluster=directors.round_robin(); #使用 new 关键字创建 drector 对象,使用 round_robin(轮询) 算法
  41. web_cluster.add_backend(web1); #添加后端服务器节点
  42. web_cluster.add_backend(web2);
  43. }
  44. sub vcl_recv {
  45. set req.backend_hint = web_cluster.backend(); #指定请求的后端节点web_cluster定义的后端节点
  46. if (req.method == "PURGE") { #判断客户端的请求头部是否是PURGE
  47. if (!client.ip ~ purgers) { #如果是,再判断客户端的IP地址是不是在ACL访问控制列表中.
  48. return (synth(405, "Not Allowed.")); #如果不是,返回给客户端405状态码并且返回定义的页面.
  49. }
  50. return (purge); #如果是ACL定义的,则交给purge处理.
  51. }
  52. if (req.method != "GET" &&
  53. req.method != "HEAD" &&
  54. req.method != "PUT" &&
  55. req.method != "POST" &&
  56. req.method != "TRACE" &&
  57. req.method != "OPTIONS" &&
  58. req.method != "PATCH" &&
  59. req.method != "DELETE") { #判断客户端的请求类型
  60. return (pipe);
  61. }
  62. if (req.method != "GET" && req.method != "HEAD") {
  63. return (pass); #如果不是GET及HEAD则交给pass.
  64. }
  65. if (req.url ~ "\.(php|asp|aspx|jsp|do|ashx|shtml)($|\?)") {
  66. return (pass); #当客户端访问的是.php等结尾的交给pass处理.
  67. }
  68. if (req.http.Authorization) {
  69. return (pass); #当客户端请求的页面类型是需要认证的,交给pass处理
  70. }
  71. if (req.http.Accept-Encoding) {
  72. if (req.url ~ "\.(bmp|png|gif|jpg|jpeg|ico|gz|tgz|bz2|tbz|zip|rar|mp3|mp4|ogg|swf|flv)$") {
  73. unset req.http.Accept-Encoding; #取消客户端接收的压缩类型
  74. } elseif (req.http.Accept-Encoding ~ "gzip") {
  75. set req.http.Accept-Encoding = "gzip"; #如果有gzip类型,标记gzip类型.
  76. } elseif (req.http.Accept-Encoding ~ "deflate") {
  77. set req.http.Accept-Encoding = "deflate";
  78. } else {
  79. unset req.http.Accept-Encoding; #其他未定义的页面也取消客户但接收的压缩类型.
  80. }
  81. }
  82. if (req.url ~ "\.(css|js|html|htm|bmp|png|gif|jpg|jpeg|ico|gz|tgz|bz2|tbz|zip|rar|mp3|mp4|ogg|swf|flv)($|\?)") {
  83. unset req.http.cookie; #取消客户端的cookie值.
  84. return (hash); #将请求转发给hash子程序,也就是查看本地缓存.
  85. }
  86. if (req.restarts == 0) { #判断客户端是不是第一次请求
  87. if (req.http.X-Forwarded-For) { #如果是第一次请求,设置获取客户端的IP地址.
  88. set req.http.X-Forwarded-For = req.http.X-Forwarded-For + ", " + client.ip;
  89. } else {
  90. set req.http.X-Forwarded-For = client.ip;
  91. }
  92. }
  93. return (hash);
  94. }
  95. sub vcl_hash {
  96. hash_data(req.url); #查看客户端请求的页面,并且进行hash
  97. if (req.http.host) {
  98. hash_data(req.http.host); #设置客户端的主机
  99. } else {
  100. hash_data(server.ip); #设置服务器的IP
  101. }
  102. return (lookup);
  103. }
  104. sub vcl_hit {
  105. if (req.method == "PURGE") { #如果是HIT并且当客户端请求的类型是PURGE返回的200的状态码,并返回相应页面.
  106. return (synth(200, "Purged."));
  107. }
  108. return (deliver);
  109. }
  110. sub vcl_miss {
  111. if (req.method == "PURGE") {
  112. return (synth(404, "Purged.")); #如果是miss返回404
  113. }
  114. return (fetch);
  115. }
  116. sub vcl_deliver {
  117. if (obj.hits > 0) {
  118. set resp.http.CXK = "HIT-from-varnish"; #设置http头部X-Cache =hit
  119. set resp.http.X-Cache-Hits = obj.hits; #返回命令的次数
  120. } else {
  121. set resp.http.X-Cache = "MISS";
  122. }
  123. unset resp.http.X-Powered-By; #取消显示web版本
  124. unset resp.http.Server; #取消显示varnish服务
  125. unset resp.http.X-Drupal-Cache; #取消显示缓存的框架
  126. unset resp.http.Via; #取消显示文件内容来源
  127. unset resp.http.Link; #取消显示HTML的超链接地址
  128. unset resp.http.X-Varnish; #取消显示varnish的id
  129. set resp.http.xx_restarts_count = req.restarts; #设置客户端请求的次数
  130. set resp.http.xx_Age = resp.http.Age; #显示缓存文件的时长
  131. #set resp.http.hit_count = obj.hits; #显示缓存命中的次数
  132. #unset resp.http.Age;
  133. return (deliver);
  134. }
  135. sub vcl_pass {
  136. return (fetch); #将后端服务器返回的数据缓存到本地
  137. }
  138. sub vcl_backend_response {
  139. set beresp.grace = 5m; #缓存额外宽限时间
  140. if (beresp.status == 499 || beresp.status == 404 || beresp.status == 502) {
  141. set beresp.uncacheable = true; #当后端服务器相应状态码是449等,不缓存
  142. }
  143. if (bereq.url ~ "\.(php|jsp)(\?|$)") {
  144. set beresp.uncacheable = true; #当是PHP的页面不缓存
  145. } else {
  146. if (bereq.url ~ "\.(css|js|html|htm|bmp|png|gif|jpg|jpeg|ico)($|\?)") {
  147. set beresp.ttl = 15m; #当是上面结尾的,缓存15分钟
  148. unset beresp.http.Set-Cookie;
  149. } elseif (bereq.url ~ "\.(gz|tgz|bz2|tbz|zip|rar|mp3|mp4|ogg|swf|flv)($|\?)") {
  150. set beresp.ttl = 30m; #缓存30分钟
  151. unset beresp.http.Set-Cookie;
  152. } else {
  153. set beresp.ttl = 10m; #生存时间10分钟
  154. unset beresp.http.Set-Cookie;
  155. }
  156. }
  157. return (deliver);
  158. }
  159. sub vcl_purge {
  160. return (synth(200,"success"));
  161. }
  162. sub vcl_backend_error {
  163. if (beresp.status == 500 ||
  164. beresp.status == 501 ||
  165. beresp.status == 502 ||
  166. beresp.status == 503 ||
  167. beresp.status == 504) {
  168. return (retry); #如果状态码是上述其中之一,则重新请求
  169. }
  170. }
  171. sub vcl_fini {
  172. return (ok);
  173. }
  174. #编辑完成后,保存退出后即可。
  175. [root@varnish varnish]# varnishd -f /usr/local/var/varnish/example.vcl -s malloc,200M -a 0.0.0.0:80
  176. #启动varnish服务,监听本机所有IP的80端口,-f为指定vcl文件,-s是指定用来存放缓存的容量
  177. [root@varnish ~]# varnishlog #varnish启动后,可以执行此命令查看其日志。

访问,清空缓存硬性加载网页;

2.png

验证ACL清除缓存配置

  1. # 在varnish允许的IP上进行清除缓存操作
  2. curl -X "PURGE" 42.193.126.123
  3. <!DOCTYPE html>
  4. <html>
  5. <head>
  6. <title>200 success</title>
  7. </head>
  8. <body>
  9. <h1>Error 200 success</h1>
  10. <p>success</p>
  11. <h3>Guru Meditation:</h3>
  12. <p>XID: 65543</p>
  13. <hr>
  14. <p>Varnish cache server</p>
  15. </body>
  16. </html>

若想实现varnish的缓存功能,通过以下基本的定义即可实现(example.vcl文件中有以下内容即可)

  1. vcl 4.0;
  2. import directors;
  3. probe backend_healthcheck {
  4. .url = "/";
  5. .timeout = 1s;
  6. .interval = 5s;
  7. .window = 5;
  8. .threshold = 3;
  9. }
  10. backend web1 {
  11. .host = "192.168.171.134";
  12. .port = "80";
  13. .probe = backend_healthcheck;
  14. }
  15. backend web2 {
  16. .host = "192.168.171.132";
  17. .port = "80";
  18. .probe = backend_healthcheck;
  19. }
  20. sub vcl_init {
  21. new web_cluster = directors.round_robin();
  22. web_cluster.add_backend(web1);
  23. web_cluster.add_backend(web2);
  24. }
  25. sub vcl_recv {
  26. set req.backend_hint = web_cluster.backend();
  27. }

01 . Varnish简介,原理,配置缓存的更多相关文章

  1. Struts2学习笔记01 之 简介及配置

    一.Struts简介 * 是轻量级的MVC框架,主要解决了请求分发的问题,重心在控制层和表现层.运用ASOP的思想,使用拦截器来扩展业务控制器 二.使用步骤: 1.引入Sturts2的相关JAR包 2 ...

  2. 01 . RPC简介原理及用Go实现一个简单的RCP

    RPC简介 本地过程调用 // 正常情况下程序的执行和调用情况.例如有如下go语言代码: package main import "fmt" func main() { var a ...

  3. 01 . etcd简介原理,应用场景及部署,简单使用

    etcd简介 Etcd是CoreOS团队于2013年6月发起的开源项目,他的目标是构建一个高可用的分布式键值(key-value)数据库,etcd内部采用raft协议作为一致性算法,etcd基于Go语 ...

  4. 01 . Vue简介,原理,环境安装

    简介 vue是一个JavaMVVM库,是一套用于构建用户界面的渐进式框架,是初创项目的首选前端框架.它是以数据驱动和组件化的思想构建的,采用自底向上增量开发的设计.它是轻量级的,它有很多独立的功能或库 ...

  5. Linux DNS原理简介及配置

    Linux DNS原理简介及配置 DNS简介 DNS原理 域名解析的过程 资源记录 DNS BIND安装配置 一.简介 一般来讲域名比IP地址更加的有含义.也更容易记住,所以通常用户更习惯输入域名来访 ...

  6. WEB缓存控制机制与varnish简介

    在说到缓存varnish前,我们首先来了解下对于web服务缓存到底是什么?它有哪些特点,基础原理是什么? http是web应用协议,通常我们说的一次http事务,不外乎就是客户端请求,服务端响应,通常 ...

  7. Nginx 反向代理工作原理简介与配置详解

    Nginx反向代理工作原理简介与配置详解   by:授客  QQ:1033553122   测试环境 CentOS 6.5-x86_64 nginx-1.10.0 下载地址:http://nginx. ...

  8. 运维DNS原理配置

    Linux DNS原理简介及配置 DNS简介 DNS原理 域名解析的过程 资源记录 DNS BIND安装配置 一.简介 一般来讲域名比IP地址更加的有含义.也更容易记住,所以通常用户更习惯输入域名来访 ...

  9. Nginx配置缓存

    目录 一.简介 二.配置 三.其它参数 忽略Cache-Control头部 缓存post请求 缓存动态内容 使用Cookie作为缓存键的一部分 手动清理缓存 支持断点续传 设置查看缓存命中与否 一.简 ...

随机推荐

  1. java-处理大容量文本文件,行内分格符为TAB的方法

    以处理某sql文件为例 源文件中行格式为: 123456 7895433 xxxxx  yyyyy zzzzz 行间分隔符为 TAB. 转换完后文件中行的格式为: 123456,7895433,xxx ...

  2. HDU - 3347 Calculate the expression — 模拟 + map存变量

    传送门 题意:从输入开始,1.输入样例数:2.然后输入一组样例中的行数n:3.前n-1行为定义变量(之间使用空格隔开),只需要map存进去就可以了(这里有覆盖的情况,故使用mp["s&quo ...

  3. HTML中的JavaScript

    HTML中的JavaScript 1.<script>元素 defer:可选.表示脚本可以延迟到文档完全被解析和显示之后再执行.只对外部脚本文件有效. 脚本会被延迟到整个页面都解析完毕后再 ...

  4. SimpleDateFormat线程不安全的5种解决方案!

    1.什么是线程不安全? 线程不安全也叫非线程安全,是指多线程执行中,程序的执行结果和预期的结果不符的情况就叫做线程不安全. ​ 线程不安全的代码 SimpleDateFormat 就是一个典型的线程不 ...

  5. Python正则表达式的七个使用范例

    本文由 伯乐在线 - 左手的灵魂 翻译.未经许可,禁止转载!英文出处:thegeekstuff.欢迎加入翻译组.http://blog.jobbole.com/74844/ 作为一个概念而言,正则表达 ...

  6. oo——第三单元总结

    前言 第三单元是我们学习oo以来第一次接触JML.这一单元的三次作业和以前一样,采用了难度递进的方式,而且前一次作业的设计思路在下一次作业都多多少少有些体现(或者说是在其基础上做出的改进).而且本单元 ...

  7. [bug] java.sql.SQLSyntaxErrorException: Table 'mysql.tb_item' doesn't exist

    参考 https://zhidao.baidu.com/question/146817103.html

  8. http://www.loongnix.org/index.php/Lbrowser

    http://www.loongnix.org/index.php/Lbrowser 浏览器是桌面应用的核心API软件,龙芯中科早在2011年就开始组建浏览器研发团队开展基于gecko.blink等内 ...

  9. shell初学之nginx(域名)

    创建两个以域名区分的虚拟网站: 1 #!/bin/bash 2 curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/ ...

  10. C语言printf-(转自shiney)

    1.调用格式为  printf("<格式化字符串>", <参量表>);   其中格式化字符串包括两部分内容: 一部分是正常字符, 这些字符将按原样输出; 另 ...