DBPack 赋能 python 微服务协调分布式事务

作者：朱晗中国电子云

什么是分布式事务

事务处理几乎在每一个信息系统中都会涉及，它存在的意义是为了保证系统数据符合期望的，且相互关联的数据之间不会产生矛盾，即数据状态的一致性。

按照数据库的经典理论，原子性、隔离性、持久性。原子性要求数据要么修改要么回滚，隔离性要求事务之间相互独立不影响，持久性要求事务的执行能正确的持久化，不丢失数据。mysql 类的行式数据库通过 mvcc 多版本视图和 wal 预写日志等技术的协作，实现了单个服务使用单个数据源或者单个服务使用多个数据源场景的多事务的原子性、隔离性和持久性。

凤凰架构这本书中有描述，单个服务使用单个数据源称之为本地事务，单个服务使用多个数据源称之为全局事务，而分布式事务特指多个服务同时访问多个数据源的事务处理机制。

DBpack 简介

分布式事务的实现有很多方式，如可靠性事务队列，TCC事务，SAGA事务等。

可靠性事务队列，也就是BASE，听起来和强一致性的ACID，"酸碱"格格不入，它作为最终一致性的概念起源，系统性地总结了一种针对分布式事务的技术手段。

TCC 较为烦琐，如同名字所示，它分为以下三个阶段。

Try：尝试执行阶段，完成所有业务可执行性的检查（保障一致性），并且预留好全部需用到的业务资源（保障隔离性）。
Confirm：确认执行阶段，不进行任何业务检查，直接使用 Try 阶段准备的资源来完成业务处理。Confirm 阶段可能会重复执行，因此本阶段所执行的操作需要具备幂等性。
Cancel：取消执行阶段，释放 Try 阶段预留的业务资源。Cancel 阶段可能会重复执行，也需要满足幂等性。

SAGA 事务将事务进行了拆分，大事务拆分若干个小事务，将整个分布式事务 T 分解为 n 个子事务，同时为为每一个子事务设计对应的补偿动作。尽管补偿操作通常比冻结或撤销容易实现，但保证正向、反向恢复过程的能严谨地进行也需要花费不少的工夫。

DBPack 的分布式事务致力于实现对用户的业务无入侵，使用时下流行的sidecar架构，主要使用 ETCD Watch 机制来驱动分布式事务提交回滚，它对 HTTP 流量和 MYSQL 流量做了拦截代理，支持 AT 模式（自动补偿 SQL）和 TCC 模式（自动补偿 HTTP 请求）。

DBPack 的 AT 模式性能取决于全局锁的释放速度，哪个事务竞争到了全局锁就能对业务数据做修改，在单位时间内，全局锁的释放速度越快，竞争到锁的事务越多，性能越高。DBPack 创建全局事务、注册分支事务只是在 ETCD 插入两条 KV 数据，事务提交回滚时修改对应数据的状态，通过 ETCD Watch 机制感知到数据的变化就能立即处理数据的提交回滚，从而在交互上减少了很多 RPC 请求。

DBPack 的 TCC 模式中，请求会先到达 sidecar 后再注册 TCC 事务分支，确保 Prepare 先于 Cancel 执行。具体到操作的业务数据，建议使用 XID 和 BranchID 加锁。

DBpack 赋能 python 微服务

以上的前戏已铺垫，后文以讲解python 微服务代码为主，不涉及 dbpack 源码，感兴趣的童鞋可去自行调试了解。

https://github.com/CECTC/dbpack-samples/blob/main/python

这里会提到三个微服务，首先是是事务发起方，其次是订单系统，最后是产品库存系统。而每一个微服务，都使用dbpack代理。事务发起方请求成功后，当订单正常commit后，产品库存要发生正常扣除，一旦一个微服务未完成，另一个则要发生回滚，也就是说，两个微服务系统要保持一致。

首先，模拟分布式事务发起方的服务，该服务会注册两个 handler，一个会发起正常的请求，走 dbpack 代理发起分布式事务，另一个会则会非正常返回。事务发起方会根据 http 的请求情况，决定是否要发起分布式事务回滚。

以下借用了 flask web 框架实现了事务发起方的两个handler，通过两个http请求我们可以模拟分布式事务发起或者回滚。

from flask import Flask, request, jsonify

import requests

app = Flask(__name__)

create_so_url        = "http://order-svc:3001/createSo"

update_inventory_url = "http://product-svc:3002/allocateInventory"

@app.route('/v1/order/create', methods=['POST'])

def create_1():

   return create_so(rollback=False)

@app.route('/v1/order/create2', methods=['POST'])

def create_2():

   return create_so(rollback=True)

def create_so(rollback=True):

    xid = request.headers.get("x-dbpack-xid")

    so_items = [dict(

        product_sysno=1,

        product_name="apple iphone 13",

        original_price=6799,

        cost_price=6799,

        deal_price=6799,

        quantity=2,

    )]

    so_master = [dict(

        buyer_user_sysno = 10001,

        seller_company_code = "SC001",

        receive_division_sysno = 110105,

        receive_address = "beijing",

        receive_zip = "000001",

        receive_contact = "scott",

        receive_contact_phone =  "18728828296",

        stock_sysno = 1,

        payment_type = 1,

        so_amt = 6999 * 2,

        status = 10,

        appid = "dk-order",

        so_items = so_items,

    )]

    success = (jsonify(dict(success=True, message="success")), 200)

    failed = (jsonify(dict(success=False, message="failed")), 400)

    headers = {

        "Content-Type": "application/json",

        "xid": xid

    }

    so_req = dict(req=so_master)

    resp1 = requests.post(create_so_url, headers=headers, json=so_req)

    if resp1.status_code == 400:

        return failed

    ivt_req = dict(req=[dict(product_sysno= 1, qty=2)])

    resp2 = requests.post(update_inventory_url, headers=headers, json=ivt_req)

    if resp2.status_code == 400:

        return failed

    if rollback:

        print("rollback")

        return failed

    return success

if __name__ == "__main__":

    app.run(host="0.0.0.0", port=3000)

那么如何使用 dbpack 代理该服务呢？

$./dist/dbpack start --config ../dbpack-samples/configs/config-aggregation.yaml

$ cat ../dbpack-samples/configs/config-aggregation.yaml

listeners:

  - protocol_type: http

    socket_address:

      address: 0.0.0.0

      port: 13000

    config:

      backend_host: aggregation-svc:3000

    filters:

      - httpDTFilter

filters:

  - name: httpDTFilter

    kind: HttpDistributedTransaction

    conf:

      appid: aggregationSvc

      transaction_infos:

        - request_path: "/v1/order/create"

          timeout: 60000

        - request_path: "/v1/order/create2"

          timeout: 60000

distributed_transaction:

  appid: aggregationSvc

  retry_dead_threshold: 130000

  rollback_retry_timeout_unlock_enable: true

  etcd_config:

    endpoints:

      - etcd:2379

可想而知，以上的微服务两个 handler 是通过 filters这部分的定义来配置拦截的。

接着是订单系统。

from flask import Flask, jsonify, request

from datetime import datetime

import mysql.connector

import time

import random

app = Flask(__name__)

insert_so_master = "INSERT /*+ XID('{xid}') */ INTO order.so_master({keys}) VALUES ({placeholders})"

insert_so_item = "INSERT /*+ XID('{xid}') */ INTO order.so_item({keys}) VALUES ({placeholders})"

def conn():

    retry = 0

    while retry < 3:

        time.sleep(5)

        try:

            c = mysql.connector.connect(

              host="dbpack3",

              port=13308,

              user="dksl",

              password="123456",

              database="order",

              autocommit=True,

            )

            if c.is_connected():

                db_Info = c.get_server_info()

                print("Connected to MySQL Server version ", db_Info)

                return c

        except Exception as e:

            print(e.args)

        retry += 1 

connection = conn()

cursor = connection.cursor(prepared=True,)

@app.route('/createSo', methods=['POST'])

def create_so():

    xid = request.headers.get('xid')

    reqs = request.get_json()

    if xid and "req" in reqs:

        for res in reqs["req"]:

            res["sysno"] = next_id()

            res["so_id"] = res["sysno"]

            res["order_date"] = datetime.now()

            res_keys = [str(k) for k,v in res.items() if k != "so_items" and str(v) != ""]

            so_master = insert_so_master.format(

                xid=xid,

                keys=", ".join(res_keys),

                placeholders=", ".join(["%s"] * len(res_keys)),

            )

            try:

                cursor.execute(so_master, tuple(res.get(k, "") for k in res_keys))

            except Exception as e:

                print(e.args)

            so_items = res["so_items"]

            for item in so_items:

                item["sysno"] = next_id()

                item["so_sysno"] = res["sysno"]

                item_keys = [str(k) for k,v in item.items() if str(v) != "" ]

                so_item = insert_so_item.format(

                    xid=xid,

                    keys=", ".join(item_keys),

                    placeholders=", ".join(["%s"] * len(item_keys)),

                )

                try:

                    cursor.execute(so_item, tuple(item.get(k, "") for k in item_keys))

                except Exception as e:

                    print(e.args)

        return jsonify(dict(success=True, message="success")), 200

    return jsonify(dict(success=False, message="failed")), 400 

def next_id():

    return random.randrange(0, 9223372036854775807)

if __name__ == '__main__':

   app.run(host="0.0.0.0", port=3001)

注意到 sql 中以注解的形式添加使用了 xid ，主要是方便配合 dbpack 识别后做出相应的分布式事务处理，也就是回滚还是commit。

这里数据库连接使用 autocommit 这种方式。同时，使用 python 中的 mysql.connector 这个 lib 来支持 sql 传输中的二段式加密传输协议，见代码中声明的prepared=true。

用以下命令，使用 dbpack 代理 order 微服务：

./dist/dbpack start --config ../dbpack-samples/configs/config-order.yaml

最后是产品库存系统，详细代码如下：

from flask import Flask, jsonify, request

import time

import mysql.connector

app = Flask(__name__)

allocate_inventory_sql = "update /*+ XID('{xid}') */ product.inventory set available_qty = available_qty - %s, allocated_qty = allocated_qty + %s where product_sysno = %s and available_qty >= %s;"

def conn():

    retry = 0

    while retry < 3:

        time.sleep(5)

        try:

            c = mysql.connector.connect(

              host="dbpack2",

              port=13307,

              user="dksl",

              password="123456",

              database="product",

              autocommit=True,

            )

            if c.is_connected():

                db_Info = c.get_server_info()

                print("Connected to MySQL Server version ", db_Info)

                return c

        except Exception as e:

            print(e.args)

        retry += 1 

connection = conn()

cursor = connection.cursor(prepared=True,)

@app.route('/allocateInventory', methods=['POST'])

def create_so():

    xid = request.headers.get('xid')

    reqs = request.get_json()

    if xid and "req" in reqs:

        for res in reqs["req"]:

            try:

                cursor.execute(allocate_inventory_sql.format(xid=xid), (res["qty"], res["qty"], res["product_sysno"], res["qty"],))

            except Exception as e:

                print(e.args)

        return jsonify(dict(success=True, message="success")), 200

    return jsonify(dict(success=False, message="failed")), 400

if __name__ == '__main__':

    app.run(host="0.0.0.0", port=3002)

同样，用以下命令使用 dbpack 代理 product 微服务：

./dist/dbpack start --config ../dbpack-samples/configs/config-product.yaml

我们可以使用docker-compose一键拉起以上三个微服务：

docker-compose up

正常情况下，以下请求会触发订单系统和产品库存系统的正常 commit：

curl -XPOST http://localhost:13000/v1/order/create

而以下命令虽然正常请求了订单系统和产品库存的 API，不管事务是否正常执行，由于事务发起方状态码不正常，要求"回滚"，所以会导致已经 commit 的微服务发生回滚，以此保证分布式系统的一致性：

curl -XPOST http://localhost:13000/v1/order/create2

参考资料

官方仓库：

https://github.com/CECTC/dbpack

https://github.com/CECTC/dbpack-samples

https://cectc.github.io/dbpack-doc/#/
凤凰架构：http://icyfenix.cn/architect-perspective/general-architecture/transaction/distributed.html

DBPack 赋能 python 微服务协调分布式事务的更多相关文章

[跨数据库、微服务] FreeSql 分布式事务 TCC/Saga 编排重要性
前言 FreeSql 支持 MySql/SqlServer/PostgreSQL/Oracle/Sqlite/Firebird/达梦/Gbase/神通/人大金仓/翰高/Clickhouse/MsAcc ...
最近整理出了有关大数据，微服务，分布式，Java，Python，Web前端，产品运营，交互等1.7G的学习资料，有视频教程，源码，课件，工具，面试题等等。这里将珍藏多年的资源免费分享给各位小伙伴们
大数据,微服务,分布式,Java,Python,Web前端,产品运营,交互领取方式在篇尾!!! 基础篇.互联网架构,高级程序员必备视频,Linux系统.JVM.大型分布式电商项目实战视频...... ...
dotnet core 也能协调分布式事务啦！
2022 年 5 月 24 日,我们发布了 DBPack v0.1.0 版本,该版本主要 release 了分布式事务功能.在我们的规划里,DBPack 是要支持所有微服务开发语言协调分布式事务的,但 ...
python 微服务方案
介绍使用python做web开发面临的一个最大的问题就是性能,在解决C10K问题上显的有点吃力.有些异步框架Tornado.Twisted.Gevent 等就是为了解决性能问题.这些框架在性能上有些 ...
SpringCloud微服务架构分布式组件如何共享session对象
一.简单做一个背景说明1.为说明问题,本文简单微服务架构示例如下 2.组件说明分布式架构,每个组件都是集群或者主备.具体说明如下:zuul service:网关,API调用都走zuul service ...
微服务之分布式跟踪系统（springboot+zipkin+mysql）
通过上一节<微服务之分布式跟踪系统(springboot+zipkin)>我们简单熟悉了zipkin的使用,但是收集的数据都保存在内存中重启后数据丢失,不过zipkin的Storage除了 ...
python 微服务开发书中几个方便的python框架
python 微服务开发是一本讲python 如果进行微服务开发的实战类书籍,里面包含了几个很不错的python 模块,记录下,方便后期回顾学习处理并发的模块 greenlet && ...
使用 Consul 作为 Python 微服务的配置中心
使用 Consul 作为 Python 微服务的配置中心 Consul 作为数据中心,提供了 k/v 存储的功能,我们可以利用这个功能为 Python 微服务提供配置中心. Consul 提供了 HT ...
推荐一款 Python 微服务框架 - Nameko
1. 前言大家好,我是安果! 考虑到 Python 性能及效率性,Python Web 端一直不温不火,JAVA 和 Golang 的微服务生态一直很繁荣,也被广泛用于企业级应用开发当中本篇文章 ...

随机推荐

Ubu18下cpptest安装
1.环境安装 sudo apt install g++ sudo apt install automake sudo apt install autoconf sudo apt install lib ...
关于Electron框架应用的安全测试
Electron框架应用的安全测试 0.Electron相关简介 electron.js是一个运行时框架,它在设计之初就结合了当今最好的Web技术,核心是使用HTML.CSS.JavaScript构建 ...
分布式应用运行时 Dapr 1.7 发布
Dapr 是一个开源.可移植的.事件驱动的运行时,可以帮助开发人员构建在云和边缘上运行的弹性的.微服务的.无状态和有状态应用程序,并且关注于业务逻辑而不用考虑分布式相关的问题. 分布式相关的问题交给D ...
JAVA语言学习day16--7月22日
###15用户选择功能 * A: 用户选择功能 * a: 案例代码 import java.util.ArrayList; import java.util.Scanner; /* * 超市管理系统主 ...
JDK内置锁深入探究
一.序言本文讲述仅针对 JVM 层次的内置锁,不涉及分布式锁. 锁有多种分类形式,比如公平锁与非公平锁.可重入锁与非重入锁.独享锁与共享锁.乐观锁与悲观锁.互斥锁与读写锁.自旋锁.分段锁和偏向锁/轻 ...
javaScript深拷贝和浅拷贝简单梳理
在了解深拷贝和浅拷贝之前,我们先梳理一下: JavaScript中,分为基本数据类型(原始值)和复杂类型(对象),同时它们各自的数据类型细分下又有好几种数据类型基本数据类型数字Number 字符串 ...
【PyHacker】编写WAF指纹探测与Sqlmap相结合
使用Python编写探测WAF指纹脚本,再结合到Sqlmap中,这样以后再探测网站时,如果识别到此WAF指纹,就会显示出来.本文属于巡安似海PyHacker系列课程编写探测识别WAF脚本 00x ...
Svelte3.x网页聊天实例|svelte.js仿微信PC版聊天svelte-webchat
基于Svelte3+SvelteKit+Sass仿微信Mac界面聊天实战项目SvelteWebChat. 基于svelte3+svelteKit+sass+mescroll.js+svelte-lay ...
spring boot 默认日志替换为 log4j
移除默认日志 <dependency> <groupId>org.springframework.boot</groupId> <artifactId> ...
C# 给Word中的字符添加强调符号（着重号）
在Word中添加着重号,即强调符号,可以在选中字符后,鼠标右键点击,选择"字体",在窗口中可直接选择"着重号"添加到文字,用以对重要文字内容起加强提醒的目的,如 ...