flask_sqlalchemy中db.session是如何保持请求间独立的--源码阅读笔记

本文主要是为了验证两个问题：

flask处理请求时通过新建线程、进程、协程的区别(顺带一提)
flask_sqlalchemy是如何使用db.session使多个请求中保函的改变同一个表的sql操作不相互影响的，专业名词是会话范围或Session作用域(主要探讨)

一个简单的例子

# -*- coding:utf-8 -*-

from sqlalchemy.orm.session import Session # 线程不安全

from sqlalchemy.orm import scoped_session  # 线程安全

import time

from flask_sqlalchemy import SQLAlchemy

from flask import Flask

app = Flask(__name__)

app.config['SQLALCHEMY_DATABASE_URI'] = 'mysql://root:root@172.16.4.120:3306/mytest?charset=utf8'

db = SQLAlchemy(app)    # db.init_app(app) 提供了两种将app与db绑定的方式，具体区别看文档，这里不做分析

db_session = db.session

class role(db.Model):

    id = db.Column(db.INT, primary_key=True,autoincrement=True)

    name = db.Column(db.String(99), unique=False)

    name_cn = db.Column(db.String(99), unique=False)

    def __init__(self, name, name_cn):

        self.name = name

        self.name_cn = name_cn

    def __repr__(self):

        return '<User %r>' % self.name

# db.create_all()

@app.route('/add1')

def add1():

    print("db.session:", vars(db_session))

    print("id(db_session)",db_session)

    test_role1 = role('supervisol', '11')

    # test_role2 = role('your try', '11')

    db_session.add(test_role1)

    #db_session.add(test_role2)

    #db.session.commit() # 这里不去提交

    time.sleep(60)

    return "add1"

@app.route('/add2')

def add2():

    print("db.session:",vars(db.session))

    print("id(db_session)", db_session)

    test_role1 = role('supervisol', '22')

    #test_role2 = role('your try', '22')

    db_session.add(test_role1)

    #db_session.add(test_role2)

    db_session.commit()

    time.sleep(60)

    return "add2"

if __name__ == '__main__':

    app.run(threaded=True)

三种run的方式

# 不使用线程或进程模式时，请求都会发向同一个socket，处理时间会有先后顺序，相互影响。(flask会检查库中是否有协程greenlet库，但这里即使用了也是会影响的，因为并不是time.sleep不符合协程的要求)

# threaded模式会为每个进来的请求创建新的线程去处理，请求之间不会相互影响，通过下面的测试就可以了解。

# processes 模式就是创建进程。

"""

root@(none):# date ;curl "http://127.0.0.1:5000/add2";date

Tue Aug 14 08:38:14 CST 2018

add2Tue Aug 14 08:39:14 CST 2018

root@(none):~# date ;curl "http://127.0.0.1:5000/add1";date

Tue Aug 14 08:38:16 CST 2018

add1Tue Aug 14 08:39:16 CST 2018

root@(none):~# ps -T -p 8657

  PID  SPID TTY          TIME CMD

 8657  8657 pts/7    00:00:00 python

 8657  8662 pts/7    00:00:00 python

 8657  8666 pts/7    00:00:00 python

"""

db.session的探寻

# db_session在两个route中不会相互影响，虽然db_session是同一个

# 在 flask_sqlalchemy.SQLAlchemy类的定义中有self.session = self.create_scoped_session(session_options)以及最后返回的

# return orm.scoped_session(self.create_session(options), scopefunc=scopefunc)可以追溯到

# sqlalchemy.orm.session与sqlalchemy.orm.scoped_session的关系

# 可以参考 http://www.cnblogs.com/ctztake/p/8277372.html 会为每一个请求创建独立的session由线程id或者

# _app_ctx_stack.__ident_func__为标记

# 这篇也是很有参考意义的 https://stackoverflow.com/questions/39480914/why-db-session-remove-must-be-called

# 当然看前人的路最方便基本上把前后都说清楚了https://blog.csdn.net/yueguanghaidao/article/details/40016235

"""

# 绑定app然后初始化sql配置

if app is not None:

    self.init_app(app)

# 使用钩子，当请求结束后若没有配置自动提交，则移除此session

@app.teardown_appcontext

def shutdown_session(response_or_exc):

    if app.config['SQLALCHEMY_COMMIT_ON_TEARDOWN']:

        if response_or_exc is None:

            self.session.commit()

    self.session.remove()

    return response_or_exc  

# sqlalchemy.orm.scoping.scoped_session

# sqlalchemy.util._collections.ScopedRegistry 定义

def clear(self):

    #Clear the current scope, if any.

    try:

        del self.registry[self.scopefunc()]

    except KeyError:

        pass

"""

笨办法print

# sqlalchemy.util._collections.ScopedRegistry 函数加了打印可以看出每次请求进来都是不同的id，已经不同的session去处理

('db.session:', {'session_factory': 127.0.0.1 - - [15/Aug/2018 15:48:19] "GET /add1 HTTP/1.1" 200 -

sessionmaker(class_='SignallingSession', autocommit=False, query_cls=<class 'flask_sqlalchemy.BaseQuery'>, expire_on_commit=True, bind=None, db=<SQLAlchemy engine=mysql://root:***@172.16.4.120:3306/mytest?charset=utf8>, autoflush=True), 'registry': <sqlalchemy.util._collections.ScopedRegistry object at 0x000000000379D748>})

('id(db_session)', <sqlalchemy.orm.scoping.scoped_session object at 0x000000000379D710>)

('1 __call__:', <greenlet.greenlet object at 0x00000000038605A0>)

('2 __call__:', {})

('3 has:', {<greenlet.greenlet object at 0x00000000038605A0>: <sqlalchemy.orm.session.SignallingSession object at 0x00000000038756A0>})

('1 __call__:', <greenlet.greenlet object at 0x00000000038605A0>)

('2 __call__:', {<greenlet.greenlet object at 0x00000000038605A0>: <sqlalchemy.orm.session.SignallingSession object at 0x00000000038756A0>})

('4 clear start:', {<greenlet.greenlet object at 0x00000000038605A0>: <sqlalchemy.orm.session.SignallingSession object at 0x00000000038756A0>})

('5 clear end:', {})

('db.session:', {'session_factory': sessionmaker(class_='SignallingSession', autocommit=False, query_cls=<class 'flask_sqlalchemy.BaseQuery'>, expire_on_commit=True, bind=None, db=<SQLAlchemy engine=mysql://root:***@172.16.4.120:3306/mytest?charset=utf8>, autoflush=True), 'registry': <sqlalchemy.util._collections.ScopedRegistry object at 0x000000000379D748>})

('id(db_session)', <sqlalchemy.orm.scoping.scoped_session object at 0x000000000379D710>)

('1 __call__:', <greenlet.greenlet object at 0x00000000039843D8>)

('2 __call__:', {})

('1 __call__:', <greenlet.greenlet object at 0x00000000039843D8>)

('2 __call__:', {<greenlet.greenlet object at 0x00000000039843D8>: <sqlalchemy.orm.session.SignallingSession object at 0x000000000398DE48>})

127.0.0.1 - - [15/Aug/2018 15:49:29] "GET /add2 HTTP/1.1" 200 -

('3 has:', {<greenlet.greenlet object at 0x00000000039843D8>: <sqlalchemy.orm.session.SignallingSession object at 0x000000000398DE48>})

('1 __call__:', <greenlet.greenlet object at 0x00000000039843D8>)

('2 __call__:', {<greenlet.greenlet object at 0x00000000039843D8>: <sqlalchemy.orm.session.SignallingSession object at 0x000000000398DE48>})

('4 clear start:', {<greenlet.greenlet object at 0x00000000039843D8>: <sqlalchemy.orm.session.SignallingSession object at 0x000000000398DE48>})

('5 clear end:', {})

总结上面的流程

Web Server          Web Framework        SQLAlchemy ORM Code

--------------      --------------       ------------------------------

startup        ->   Web framework        # Session registry is established

                    initializes          Session = scoped_session(sessionmaker())

incoming

web request    ->   web request     ->   # The registry is *optionally*

                    starts               # called upon explicitly to create

                                         # a Session local to the thread and/or request

                                         Session()

                                         # the Session registry can otherwise

                                         # be used at any time, creating the

                                         # request-local Session() if not present,

                                         # or returning the existing one

                                         Session.query(MyClass) # ...

                                         Session.add(some_object) # ...

                                         # if data was modified, commit the

                                         # transaction

                                         Session.commit()

                    web request ends  -> # the registry is instructed to

                                         # remove the Session

                                         Session.remove()

                    sends output      <-

outgoing web    <-

response

重点来了

sqlalchemy是python中最强大的orm框架，无疑sqlalchemy的使用比django自带的orm要复杂的多，

使用flask sqlalchemy扩展将拉近和django的简单易用距离。

先来说两个比较重要的配置

app.config['SQLALCHEMY_ECHO'] = True =》配置输出sql语句

app.config['SQLALCHEMY_COMMIT_ON_TEARDOWN'] = True =》每次request自动提交db.session.commit(),

如果有一天你发现别的写的视图中有db.session.add，但没有db.session.commit，不要疑惑，他肯定配置了上面的选项。

这是通过app.teardown_appcontext注册实现

        @teardown

        def shutdown_session(response_or_exc):

            if app.config['SQLALCHEMY_COMMIT_ON_TEARDOWN']:

                if response_or_exc is None:

                    self.session.commit()

            self.session.remove()

            return response_or_exc

response_or_exc为异常值，默认为sys.exc_info()[1]

上面self.session.remove()表示每次请求后都会销毁self.session，为什么要这么做呢？

这就要说说sqlalchemy的session对象了。

from sqlalchemy.orm import sessionmaker

session = sessionmaker()

一帮我们会通过sessionmaker()这个工厂函数创建session，但这个session并不能用在多线程中，为了支持多线程

操作，sqlalchemy提供了scoped_session，通过名字反映出scoped_session是通过某个作用域实现的

所以在多线程中一帮都是如下使用session

from sqlalchemy.orm import scoped_session, sessionmaker

session = scoped_session(sessionmaker())

我们来看看scoped_session是如何提供多线程环境支持的

class scoped_session(object):

    def __init__(self, session_factory, scopefunc=None):

        self.session_factory = session_factory

        if scopefunc:

            self.registry = ScopedRegistry(session_factory, scopefunc)

        else:

            self.registry = ThreadLocalRegistry(session_factory)

__init__中，session_factory是创建session的工厂函数，而sessionmaker就是一工厂函数(其实是定义了__call__的

函数)而scopefunc就是能产生某个作用域的函数，如果不提供将使用ThreadLocalRegistry

class ThreadLocalRegistry(ScopedRegistry):

    def __init__(self, createfunc):

        self.createfunc = createfunc

        self.registry = threading.local()

    def __call__(self):

        try:

            return self.registry.value

        except AttributeError:

            val = self.registry.v

从上面__call__可以看出，每次都会创建新的session，并发在线程本地变量中，你可能会好奇__call__是在哪里调用的？

def instrument(name):

    def do(self, *args, **kwargs):

        return getattr(self.registry(), name)(*args, **kwargs)

    return do

for meth in Session.public_methods:

    setattr(scoped_session, meth, instrument(meth))

正如我们所看到的，当我们调用session.query将会调用 getattr(self.registry(), 'query')，self.registry()就是

调用__call__的时机，但是在flask_sqlalchemy中并没有使用ThreadLocalRegistry，创建scoped_session过程如下

# Which stack should we use?  _app_ctx_stack is new in 0.9

connection_stack = _app_ctx_stack or _request_ctx_stack

    def __init__(self, app=None,

                 use_native_unicode=True,

                 session_options=None):

        session_options.setdefault(

            'scopefunc', connection_stack.__ident_func__

        )

        self.session = self.create_scoped_session(session_options)

    def create_scoped_session(self, options=None):

        """Helper factory method that creates a scoped session."""

        if options is None:

            options = {}

        scopefunc=options.pop('scopefunc', None)

        return orm.scoped_session(

            partial(_SignallingSession, self, **options), scopefunc=scopefunc

        )

我们看到scopefunc被设置为connection_stack.__ident_func__，而connection_stack就是flask中app上下文，

如果你看过前一篇文章你就知道__ident_func__其实就是在多线程中就是thrading.get_ident，也就是线程id

我们看看ScopedRegistry是如何通过_操作的

class ScopedRegistry(object):

    def __init__(self, createfunc, scopefunc):

        self.createfunc = createfunc

        self.scopefunc = scopefunc

        self.registry = {}

    def __call__(self):

        key = self.scopefunc()

        try:

            return self.registry[key]

        except KeyError:

            return self.registry.setdefault(key, self.createfunc())

代码也很简单，其实也就是根据线程id创建对应的session对象，到这里我们基本已经了解了flask_sqlalchemy的

魔法了，和flask cookie,g有异曲同工之妙，这里有两个小问题？

1.flask_sqlalchemy能否使用ThreadLocalRegistry？

    大部分情况都是可以的，但如果wsgi对多并发使用的是greenlet的模式就不适用了

2.上面create_scoped_session中partial是干嘛的？

    前面我们说过scoped_session的session_factory是可调用对象，但_SignallingSession类并没有定义__call__，所以通过partial支持

到这里你就知道为什么每次请求结束要self.session.remove()，不然为导致存放session的字段太大

这里说一下对db.relationship lazy的理解，看如下代码

class Role(db.Model):

    __tablename__ = 'roles'

    id = db.Column(db.Integer, primary_key=True)

    name = db.Column(db.String(64), unique=True)

    users = db.relationship('User', backref='role', lazy='dynamic')

class User(db.Model):

    __tablename__ = 'users'

    id = db.Column(db.Integer, primary_key=True)

    username = db.Column(db.String(64), unique=True, index=True)

    role_id = db.Column(db.Integer, db.ForeignKey('roles.id'))

假设role是已经获取的一个Role的实例

lazy:dynamic => role.users不会返回User的列表， 返回的是sqlalchemy.orm.dynamic.AppenderBaseQuery对象

                当执行role.users.all()是才会真正执行sql，这样的好处就是可以继续过滤

lazy:select => role.users直接返回User实例的列表，也就是直接执行sql

注意：db.session.commit只有在对象有变化时才会真的执行update

参考

https://stackoverflow.com/questions/39480914/why-db-session-remove-must-be-called 问题引出

http://www.cnblogs.com/ctztake/p/8277372.html 皮毛

https://blog.csdn.net/yueguanghaidao/article/details/40016235 大佬的足迹

http://docs.sqlalchemy.org/en/latest/orm/contextual.html#using-thread-local-scope-with-web-applications 文档

flask_sqlalchemy中db.session是如何保持请求间独立的--源码阅读笔记的更多相关文章

源码阅读笔记 - 1 MSVC2015中的std::sort
大约寒假开始的时候我就已经把std::sort的源码阅读完毕并理解其中的做法了,到了寒假结尾,姑且把它写出来这是我的第一篇源码阅读笔记,以后会发更多的,包括算法和库实现,源码会按照我自己的代码风格格 ...
vue中$watch源码阅读笔记
项目中使用了vue,一直在比较computed和$watch的使用场景,今天周末抽时间看了下vue中$watch的源码部分,也查阅了一些别人的文章,暂时把自己的笔记记录于此,供以后查阅: 实现一个简单 ...
caffe中ConvolutionLayer的前向和反向传播解析及源码阅读
一.前向传播在caffe中,卷积层做卷积的过程被转化成了由卷积核的参数组成的权重矩阵weights(简记为W)和feature map中的元素组成的输入矩阵(简记为Cin)的矩阵乘积W * Cin. ...
Java生鲜电商平台-SpringCloud微服务架构中网络请求性能优化与源码解析
Java生鲜电商平台-SpringCloud微服务架构中网络请求性能优化与源码解析说明:Java生鲜电商平台中,由于服务进行了拆分,很多的业务服务导致了请求的网络延迟与性能消耗,对应的这些问题,我们 ...
Flask之请求，应用上下文源码解析
什么是上下文? 每一段程序都有很多外部变量.只有像Add这种简单的函数才是没有外部变量的.一旦你的一段程序有了外部变量,这段程序就不完整,不能独立运行.你为了使他们运行,就要给所有的外部变量一个一个写 ...
Yii2.0源码阅读-一次请求的完整过程
Yii2.0框架源码阅读,从请求发起,到结束的运行步骤其实最初阅读是从yii\web\UrlManager这个类开始看起,不断的寻找这个类中方法的调用者,最终回到了yii\web\Applicati ...
【安卓网络请求开源框架Volley源码解析系列】定制自己的Request请求及Volley框架源码剖析
通过前面的学习我们已经掌握了Volley的基本用法,没看过的建议大家先去阅读我的博文[安卓网络请求开源框架Volley源码解析系列]初识Volley及其基本用法.如StringRequest用来请求一 ...
SpringMVC源码阅读：Controller中参数解析
1.前言 SpringMVC是目前J2EE平台的主流Web框架,不熟悉的园友可以看SpringMVC源码阅读入门,它交代了SpringMVC的基础知识和源码阅读的技巧本文将通过源码(基于Spring ...
Redis源码阅读（四）集群-请求分配
Redis源码阅读(四)集群-请求分配集群搭建好之后,用户发送的命令请求可以被分配到不同的节点去处理.那Redis对命令请求分配的依据是什么?如果节点数量有变动,命令又是如何重新分配的,重分配的过程 ...

随机推荐

【洛谷P1037】产生数
产生数题目链接本着“水题不可大做”的原则,我直接字符串hash+爆搜,成功爆栈.. 我们发现,依次搜索每一位能取到的数字个数,最后乘起来即可(乘法原理) 然后又爆了一个点.. long long存 ...
轻量ORM-SqlRepoEx 重大升级
.Net平台下兼容.NET Standard 2.0,一个实现以Lambda表达式转转换标准SQL语句,支持MySQL.SQL Server数据库方言,使用强类型操作数据的轻量级ORM工具,在减少魔法 ...
GNS3的安装和配置
一.为什么安装GNS3 简单说来它是dynamips的一个图形前端,相比直接使用dynamips这样的虚拟软件要更容易上手和更具有可操作性.更重要的一点是很多Cisco实验在cisco packet ...
Windows无法安装到这个磁盘选中的磁盘具有MBR分区表解决方法
在安装 win10的时候,会出现这种提示:Windows 无法安装到这个磁盘.选中的磁盘具有 MBR 分区表.在 EFI 系统上, Windows 只能安装到 GPT 磁盘.出现这种情况主要是因为 ...
iOS | FMDB快速上手
任何的开发都或多或少的接触到数据库,而在IOS中一般使用的是SQLite数据库,这是一个轻量功能较为不错的数据库.而现在用到比较多的第三方数据库操作框架就是FMDB.废话不多说,相信查找到这篇文章的都 ...
手动创建简单webpack项目及React使用
一.创建基本的webpack4.x项目 1.运行 npm init -y 快速初始化项目 2.在项目根目录创建src的源代码目录和dist产品目录 3.在src目录下创建 index.html 4.使 ...
Luogu P2590 [ZJOI2008]树的统计
最近在学树剖,看到了这题就做了 [ZJOI2008]树的统计思路从题面可以知道,这题是树剖题(要求的和模板没什么区别呀喂就是在普通的树剖上加了一个最大值所以可以知道就是树剖+特殊的线段树线段 ...
python 如何在列表list，字典dict，集合set 中根据条件筛选数据
from random import randint """ list 过滤掉负数 """ data = [randint(-10, 10) ...
C#判断系统是64位还是32位支持.net4.0以前的版本
C#判断系统是64位还是32位的时候引用了一串代码,这个代码是从园子里面其他博文中转载过来的,引入自己的项目中发现无法使用,在引用了相应的命名空间之后还是提示: "未能找到类型或命名空间名称 ...
python核心编程2 第十五章练习
15-1.识别下列字符串 :“bat ”.“bit ”.“but ”.“hat ”.“hit” 或 “hut ” import re from random import choice strtupl ...

flask_sqlalchemy中db.session是如何保持请求间独立的--源码阅读笔记

一个简单的例子

三种run的方式

db.session的探寻

笨办法print

总结上面的流程

重点来了

参考

flask_sqlalchemy中db.session是如何保持请求间独立的--源码阅读笔记的更多相关文章

随机推荐

热门专题