WSGI的理解
Python web开发中,服务端程序可分为2个部分:
服务器程序(用来接收、整理客户端发送的请求)
应用程序(处理服务器程序传递过来的请求)
在开发应用程序的时候,我们会把常用的功能封装起来,成为各种框架,比如Flask,Django,Tornado(使用某框架进行web开发,相当于开发服务端的应用程序,处理后台逻辑)
但是,服务器程序和应用程序互相配合才能给用户提供服务,而不同应用程序(不同框架)会有不同的函数、功能。 此时,我们就需要一个标准,让服务器程序和应用程序都支持这个标准,那么,二者就能很好的配合了WSGI:wsgi是python web开发的标准,类似于协议。它是服务器程序和应用程序的一个约定,规定了各自使用的接口和功能,以便二和互相配合
WSGI应用程序的部分规定
应用程序是一个可调用的对象
可调用的对象有三种:- 一个函数
- 一个类,必须实现__call__()方法
- 一个类的实例
这个对象接收两个参数
从源码中,我们可以看到,这两个参数是environ, start_response. 以可调用对象为一个类为例:class application:
def __call__(self, environ, start_response):
pass
可调用对象需要返回一个可迭代的值。以可调用对象为一个类为例:
class application:
def __call__(self, environ, start_response):
return [xxx]
WSGI服务器程序的部分规定
服务器程序需要调用应用程序
def run(application): #服务器程序调用应用程序
environ = {} #设定参数 def start_response(xxx): #设定参数
pass
result = application(environ, start_response) #调用应用程序的__call__函数(这里应用程序是一个类)
def write(data):
pass
def data in result: #迭代访问
write(data)
服务器程序主要做了以下的事:
1. 设定应用程序所需要的参数
2. 调用应用程序
3. 迭代访问应用程序的返回结果,并传给客户端
Middleware
middleware是介于服务器程序和应用程序中间的部分,middleware对服务器程序和应用程序是透明的。
对于服务器程序来说,middleware就是应用程序,middleware需要伪装成应用程序,传递给服务器程序
对于应用程序来说,middleware就是服务器程序,middleware需要伪装成服务器程序,接受并调用应用程序
服务器程序获取到了客户端请求的URL,需要把URL交给不同的函数处理,这个功能可以使用middleware实现:
# URL Routing middleware
def urlrouting(url_app_mapping):
def midware_app(environ, start_response): #函数可调用,包含2个参数,返回可迭代的值
url = environ['PATH_INFO']
app = url_app_mapping[url] #获得对应url的应用程序
result = app(environ, start_response) #调用应用程序
return result
return midware_app
函数midware_app就是middleware:
一方面,midware_app函数设置了应用程序所需要的变量,并调用了应用程序。所以对于应用程序来说,它是一个服务器程序
另一方面,midware_app函数是一个可调用的对象,接收两个参数,同时可调用对象返回了一个可迭代的值。所以对于服务器程序来说,它是一个应用程序
写中间件(middleware)的逻辑:
1. middleware需要伪装成应用程序—> WSGI应用程序的要求 —> 1. 可调用 2. 两个参数 3. 返回可迭代的值
2. middleware需要伪装成服务器程序 —> WSGI服务器程序的要求 —> 调用应用程序
我们需要了解一下environ
这个变量。在WSGI中, 应用程序需要两个参数:environ
和start_response
, 在服务器程序调用应用程序之前, 需要先设定这两个参数。 其中start_response
通常是个可调用的方法, 而environ
则是一个字典, 它是在CGI中定义的, 查看CGI文档The Common Gateway Interface Specification, 可以找到关于environ
的定义。
以下是environ中的参数:
AUTH_TYPE
CONTENT_LENGTH #HTTP请求中Content-Length的部分
CONTENT_TYPE #HTTP请求中Content-Tpye的部分
GATEWAY_INTERFACE
HTTP_* #包含一系列变量, 如HTTP_HOST,HTTP_ACCEPT等
PATH_INFO #URL路径除了起始部分后的剩余部分,用于找到相应的应用程序对象,如果请求的路径就是根路径,这个值为空字符串
PATH_TRANSLATED
QUERY_STRING #URL路径中?后面的部分
REMOTE_ADDR
REMOTE_HOST
REMOTE_IDENT
REMOTE_USER
REQUEST_METHOD #HTTP 请求方法,例如 "GET", "POST"
SCRIPT_NAME #URL路径的起始部分对应的应用程序对象,如果应用程序对象对应服务器的根,那么这个值可以为空字符串
SERVER_NAME
SERVER_PORT
SERVER_PROTOCOL #客户端请求的协议(HTTP/1.1 HTTP/1.0)
SERVER_SOFTWARE
举例:http://localhost:5000/aaa?666
, 变量值为:
REQUEST_METHOD=‘GET’
SCRIPT_NAME=''
SERVER_NAME='localhost'
SERVER_PORT=‘5000’
PATH_INFO='/aaa'
QUERY_STRING='666'
SERVER_PROTOCOL='HTTP/1.1'
CONTENT_TYPE='text/plain'
CONTEN_LENGTH=''
HTTP_HOST = 'localhost:8000'
HTTP_ACCEPT = 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8'
HTTP_ACCEPT_ENCODING = 'gzip,deflate,sdch'
HTTP_ACCEPT_LANGUAGE = 'en-US,en;q=0.8,zh;q=0.6,zh-CN;q=0.4,zh-TW;q=0.2'
HTTP_CONNECTION = 'keep-alive'
HTTP_USER_AGENT = 'Mozilla/5.0 (X11; Linux i686) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1700.77 Safari/537.36'
对于start_response()
函数:
start_response
是HTTP响应的开始, 它的形式为:start_response(status, response_headers, exc_info=None)
status
表示HTTP状态码, 比如200 OK
response_headers
是一个列表,列表元素是个tuple
:(header_name, header_value)
exc_info
是个可选参数, 当处理请求的过程中发生错误时, 会设置该参数, 同时会调用start_response
举一个werkzeug
官方文档上的例子,我稍作改进,以进行分析(这段建议看完wsgi.py第二部分的SharedDataMiddleware类
再看):
class Shortly(object):
def __init__(self, config):
self.redis = redis.Redis(config['redis_host'], config['redis_port'])
def dispatch_request(self, request):
return Response('Hello World!') #初始化Response类
def wsgi_app(self, environ, start_response):
request = Request(environ)
response = self.dispatch_request(request) #response的类型为Response类
print('%%%%%%%%%%%%%%%%%%%%%%%%%%%')
return response(environ, start_response) #Response的__call__函数就是应用程序,返回迭代对象
def __call__(self, environ, start_response):
print(self.wsgi_app)
print('erghrgheoghegoierge')
return self. wsgi_app(environ, start_response)
def create_app(redis_host='localhost', redis_port=6379, with_static=True):
app = Shortly({
'redis_host': redis_host,
'redis_port': redis_port
})
if with_static:
print('yes')
app.wsgi_app = SharedDataMiddleware(app.wsgi_app, {
'/static': os.path.join(os.path.dirname(__file__), 'static')
})
print('33333333333333333')
return app
#开启本地服务器
if __name__ == '__main__':
from werkzeug.serving import run_simple
app = create_app() #创建应用程序的实例
run_simple('127.0.0.1', 5000, app, use_debugger=True, use_reloader=True)
我们查看Response
的源码(Response
继承了BaseResponse
,查看BaseResponse
的源码即可)可以知道:函数dispatch_request()
返回的值是Request
的构造函数,即返回了一个Response
类, 在函数wsgi_app()
中,request
的值的类型就是Response
, 所以wsgi_app()
的返回值response(environ, start_response)
实际上是调用了Response
类的__call__()
函数。
看了源码我们可以发现,__call__()
是一个WSGI
的应用程序!
当运行这个程序的时候:
22222222222222222
yes
33333333333333333
* Running on http://127.0.0.1:5000/ (Press CTRL+C to quit)
* Restarting with stat
22222222222222222
yes
33333333333333333
我们先不纠结为什么读取了2次。
当我们打开这个网页,控制台的输出为:
<werkzeug.wsgi.SharedDataMiddleware object at 0x1007be7b8> #说明wsgi_app是SharedDataMiddleware的实例!
erghrgheoghegoierge
%%%%%%%%%%%%%%%%%%%%%%%%%%% #说明执行了原wsgi_app函数中的内容!
127.0.0.1 - - [22/May/2015 21:01:25] "GET / HTTP/1.1" 200 -
可以注意到,在本例中,app.wsgi_app
这个方法已经变成了一个SharedDataMiddleware
类的实例,我很好奇当服务器把environ和start_response
传递给app
后,为什么wsgi_pp
还会执行原wsgi_app
中的内容呢?
当我们访问主机地址的时候,服务器程序接受用户请求,然后会把environ和start_response
传递给应用程序app
,app
会执行__call__函数
,在该函数中,会执行app.wsgi_app
这个函数。 然后wsgi_app
会执行ShareDataMiddleware
的__call__()
函数
这地方需要我们看SharedDataMiddleware
类的__call__()
的源码。看了源码我们可以发现,由于用户没有请求静态文件,所以会执行return self.app(environ, start_response)
,在本例中,我们可以看到在create_app()
中,我们定义的ShareDataMiddleware
的应用程序是app.wsgi_app,所以这里返回的是原wsgi_app函数!所以当然会执行原函数了~
同时,我们也可以在static
文件夹中放一个文件,然后访问试一下:127.0.0.1/static/文件名
,此时就能看到那个文件了!
通过本例,我们可以更深刻的了解Middleware的作用:
Middleware介于服务器程序和应用程序之间,它会接收服务器发来的消息(environ和
start_response),并做一定的处理,然后把需要应用程序处理的部分传递给应用程序处理
另外, 服务器程序还需要定义WSGI的相关变量:
wsgi.version
值的形式为 (1, 0) 表示 WSGI 版本 1.0
wsgi.url_scheme
表示 url 的模式,例如 "https" 还是 "http"
wsgi.input
输入流,HTTP请求的 body 部分可以从这里读取
wsgi.erros
输出流,如果出现错误,可以写往这里
wsgi.multithread
如果应用程序对象可以被同一进程中的另一线程同时调用,这个值为True
wsgi.multiprocess
如果应用程序对象可以同时被另一个进程调用,这个值为True
wsgi.run_once
如果服务器希望应用程序对象在包含它的进程中只被调用一次,那么这个值为True
WSGI的理解的更多相关文章
- 说说我对 WSGI 的理解
先说下 WSGI 的表面意思,Web Server Gateway Interface 的缩写,即 Web 服务器网关接口. 之前不知道 WSGI 意思的伙伴,看了上面的解释后,我估计也还是不清楚,所 ...
- WSGI的理解 perfect
https://blog.csdn.net/hzrandd/article/details/10099871 https://blog.csdn.net/cloudxli/article/detail ...
- 对于python WSGI的理解
首先看看WSGI的目的是什么? 是用来定义一个统一的接口. 这个接口是针对Web服务器和python Web应用之间的. 以增加Python web应用在不同Web 服务器之间的可移植性. 也就是说如 ...
- OpenStack设计与实现5——RESTful API和WSGI
转https://segmentfault.com/a/1190000004361778 Tips:文章为拜读@xingjiarong 后有感而做的分享,先对作者表示感谢,附原文地址:http://b ...
- WSGI 简介(使用python描述)
WSGI 简介 背景 Python Web 开发中,服务端程序可以分为两个部分,一是服务器程序,二是应用程序.前者负责把客户端请求接收,整理,后者负责具体的逻辑处理.为了方便应用程序的开发,我们把常用 ...
- linux性能评估与分析工具
linux是一个开源系统,其内核负责管理系统的进程,内存,设备驱动程序,文件和网络系统, 决定着系统的性能和稳定性.由于内核源码很容易获取,任何人都可以将自己认为优秀的代码 加入到其中.linux默认 ...
- Django 分析(一)Requst、Middleware 和 Response 数据流
0. 前言 通过 Django 编写 HTTP 接口时,我们需要指定 URL.Model 和 Views 函数(或者指定 RESTBaseView 对象解析参数和编写逻辑) 编写逻辑时的基本思路就是解 ...
- Django Full Coverage
Django(个人推荐, 如果项目较大 需要协同开发, 建议使用django这种重量级框架, 如果类似于纯api的后端应用建议使用 flask, 轻量小巧 , 麻雀虽小五脏俱全) 1.Django是什 ...
- 理解WSGI
WSGI是什么? WSGI,全称 Web Server Gateway Interface,或者 Python Web Server Gateway Interface ,是为 Python 语言定义 ...
随机推荐
- Codeforces Round #276 (Div. 2) 解题报告
题目地址:http://codeforces.com/contest/485 A题.Factory 模拟.判断是否出现循环,如果出现,肯定不可能. 代码: #include<cstdio> ...
- Keil 中关于C语言编译生成汇编代码函数名规则
在keil 中 C语言的函数有带参数和不带参数之分. 一般的资料里说fun(void)类型的函数不带参数,所以,keil编译器生成的汇编的调用地址(函数名) 为fun.这没有错.事实上,不管C语言的函 ...
- 安装ArchLinux的参考分区方案
其实就是从Archwiki上搬运过来的 = =. 分区方案 虽然有一些关于分区方案的通用建议,但没有严格的准则.有许多影响分区方案的因素,例如对灵活性的期望,访问速度,安全性以及可用磁盘空间的硬性限制 ...
- yii基础知识-
控制器 是 CController 或其子类的实例.它在当用户请求时由应用创建. 当一个控制器运行时,它执行所请求的动作,动作通常会引入所必要的模型并渲染相应的视图. 动作 的最简形式,就是一个名字以 ...
- 编译不通过:提示XXXX不是类或命名空间名 的解决办法
手动写了一个类,需要引入预编译头stdafx.h.结果编译时提示XXXX不是类或命名空间名. 处理方法:将#include "stdafx.h"放在最前面.
- 简述tcp协议对http性能的影响及优化
当网站服务器并发连接达到一定程度时,你可能需要考虑服务器系统中tcp协议设置对http服务器的影响. tcp相关延时主要包括: 1.tcp连接时建立握手: 2.tcp慢启动拥塞控制: 3.数据聚集的N ...
- 【编译原理】语法分析LL(1)分析法的FIRST和FOLLOW集
近来复习编译原理,语法分析中的自上而下LL(1)分析法,需要构造求出一个文法的FIRST和FOLLOW集,然后构造分析表,利用分析表+一个栈来做自上而下的语法分析(递归下降/预测分析),可是这个FIR ...
- jmock2.5基本教程(转)
原文:http://www.cnblogs.com/zfc2201/archive/2011/12/30/2307970.html jmock2.5基本教程 目录 第0章 概述 第1章 jmock初体 ...
- java匿名内部类,多态,接口练习
1多态以及接口调用方法: public class Interface { public static void main(String[] args) { Al x = new Al(); jian ...
- ECMAScript 6新特性介绍
箭头函数 箭头函数使用=>语法来简化函数.在语句结构上和C#.Java 8 和 CoffeeScript相似,支持表达式和函数体. . =>`操作符左边为输入的參数.而右边则是进行的操作以 ...