搜索关注微信公众号"捉虫大师",后端技术分享,架构设计、性能优化、源码阅读、问题排查、踩坑实践。

本文已收录 https://github.com/lkxiaolou/lkxiaolou 欢迎star。

背景

在很久以前,网站应用是单体应用的架构,流量小,所有功能、代码都部署在一起,成本低。此时数据库访问框架ORM是关键。

后来流量逐渐增大,单体应用被拆分为互不相干的多个应用,这就是垂直架构,此时加速前端页面开发的Web框架MVC是关键。

再后来,垂直应用越来越大,应用间的交互不可避免,分布式服务框架RPC变成了关键。

dubbo

RPC,全称Remote Procedure Call,即远程过程调用,一句话描述就是调用远程对象就像调用本地方法一样方便简单。常见的RPC框架有dubbo、grpc、thrift等。

dubbo, |ˈdʌbəʊ| 是一款高性能、轻量级的开源Java RPC框架,它提供了三大核心能力:面向接口的远程方法调用,智能容错和负载均衡,以及服务自动注册和发现。目前使用dubbo的公司非常多。

前世今生

dubbo的发展历程可以总结为3个阶段:

  • 诞生阿里:dubbo前生2008年在阿里内部诞生,2011年开源,2012年发布2.5.3版本后停止更新
  • 当当续命:2014年当当发布dubbox,是基于阿里开源的dubbo 2.5.3版本增加rest协议的dubbo版本
  • 重启登顶apache:2017年阿里重启dubbo项目,并于2018年进入apache孵化,2019年成为apache顶级项目,同时也发布了dubbo.js,dubbo-go等多语言dubbo版本,2020年发布3.0往云原生项目发展的战略计划

目前支持的版本主要是2.6.x和2.7.x:

  • 2.6.x 主要以 bugfix 和少量 enhancements 为主,因此能完全保证稳定性
  • 2.7.x 作为社区的主要开发版本,得到持续更新并增加了大量新 feature 和优化,同时也带来了一些稳定性挑战

协议

dubbo原生的协议定义如下:

  • 0-15: 魔数,判断是否是dubbo协议
  • 16: 判断是请求还是返回
  • 17: 判断是否期望返回
  • 18: 判断是否为事件消息,如心跳事件
  • 19-23: 序列化标志
  • 24-31: 标志响应状态(类似http status)
  • 32-63: 请求id
  • 64-95: 内容长度(字节)
  • 96-?: 序列化后的内容(换行符分隔)

dubbo协议的优点是设计紧凑、请求响应的header一致;缺点是无法通过header定位资源,header和body中字段存在冗余,协议无法扩展。

当然同时也支持扩展多种协议,如当当扩展的rest协议,还有最新支持的grpc协议等

说到扩展,可能是dubbo设计的最大亮点,dubbo的扩展基于SPI(Service Provide Interface)设计,可以无侵入代码实现非常多的功能。

注册中心

注册中心有如下特点:

  • 动态加入,服务提供者通过注册中心动态的把自己暴露给消费者,无需消费者逐个更新配置文件。
  • 动态发现服务,消费者可以动态发现新的服务,无需重启生效。
  • 统一配置,避免本地配置导致每个服务配置不一致。
  • 动态调整,注册中心支持参数动态调整,新参数自动更新到所有相关的服务节点。
  • 统一管理,依靠注册中心数据,可以统一管理配置服务节点。dubbo主流的注册中心一般用zookeeper或者nacos,其他还有很多扩展实现。

集群

集群包含了路由、负载均衡和集群容错三个内容,从一个例子来看这三方面的差异:

一个dubbo的用户服务,在北京部署了10个,在上海部署了20个。一个杭州的服务消费方发起了一次调用,然后发生了以下的事情:

  1. 根据配置的路由规则,如果杭州发起的调用,会路由到比较近的上海的20个provider。
  2. 根据配置的随机负载均衡策略,在20个provider中随机选择了一个来调用
  3. 假设随机到了第7个provider。结果调用第7个 provider 失败了。根据配置的failover集群容错模式,重试其他服务器。重试了第13个provider,调用成功。

    这里1对应了路由,2对应了负载均衡,3对应了集群容错。

filter

在dubbo的整体设计中,filter是一个很重要的概念,包括dubbo本身的大多数功能,都是基于此扩展点实现的,在每次的调用过程中,filter的拦截都会被执行。filter是一种责任链的设计模式:

常见的filter:监控打点、日志记录、限流降级、鉴权等。

三大中心

三大中心指注册中心,元数据中心,配置中心。为什么需要三大中心,可以看一条dubbo注册到注册中心上的数据:

/dubbo/org.apache.dubbo.demo.DemoService/providers/dubbo%3A%2F%2F172.23.234.48%3A20880%2Forg.apache.dubbo.demo.DemoService%3Fanyhost%3Dtrue%26application%3Ddubbo-demo-api-provider%26default%3Dtrue%26deprecated%3Dfalse%26dubbo%3D2.0.2%26dynamic%3Dtrue%26generic%3Dfalse%26interface%3Dorg.apache.dubbo.demo.DemoService%26metadata-type%3Dremote%26methods%3DsayHello%2CsayHelloAsync%26pid%3D21563%26release%3D%26side%3Dprovider%26timestamp%3D1600336623852

可以看出数据量很大,这还是接口级的数据,当接口数量越来越多,注册中心的压力越来越大,变更推送的数据越来越多。

所以,我们需要元数据中心和配置中心来减轻注册中心的压力。不经常变化的数据可以放在元数据中心。

/dubbo/org.apache.dubbo.demo.DemoService/providers/dubbo%3A%2F%2F172.23.234.48%3A20880%2Forg.apache.dubbo.demo.DemoService%3Fapplication%3Ddubbo-demo-api-provider%26deprecated%3Dfalse%26dubbo%3D2.0.2%26timestamp%3D1600336144382

配置中心也是如此,如果没有配置中心需要全量将变更的url推送下去,有了配置中心只需要推送变更的配置即可。

泛化调用

我们常见的dubbo调用方式是引入provider定义的接口jar包,但如果没有这个jar包,能否发起调用?当然是可以,也确实有这样的场景,比如服务测试平台,dubbo服务网关等。只要知道接口名,参数等信息即可发起调用。

未来发展

dubbo当时的未来规划其实走了个曲线,并不是一步到现在的云原生方向。2019年想走的方向是响应式编程(或者叫反应式编程)。IO密集型的应用,通常线程池是限制吞吐的重要因素之一,假设consumer线程池为100,provider接口响应时间为500ms,consumer的qps上限为 (1000 / 500) x 100 = 200。响应式编程就是解决这个问题。

响应式编程(reactive programming)是一种基于数据流(data stream)和变化传递(propagation of change)的声明式(declarative)的编程范式。RSocket 是一个支持 reactive-stream 语义的开源网络通信协议,它将 reactive 语义的复杂逻辑封装了起来,使得上层可以方便实现网络程序。Dubbo 在 3.0.0-SNAPSHOT 版本里基于 RSocket 对响应式编程提供了支持,用户可以在请求参数和返回值里使用Mono和Flux类型的对象。

但到了2020年,随着云原生概念的兴起和大厂纷纷地落地,dubbo是否也可以朝这个方向发展呢?

云原生是基于容器、服务网格、微服务、不可变基础设施和声明式API构建的可弹性扩展的应用,基于自动化技术构建具备高容错性、易管理和便于观察的松耦合系统,构建一个统一的开源云技术生态,能和云厂商提供的服务解耦。

dubbo的服务级注册发现,与k8s容器编排的应用级服务发现相违背,dubbo是“重sdk”,与易管理相违背。

所以在最新的版本中支持了应用级的服务发现,原先是这样的一个接口:

/dubbo/org.apache.dubbo.demo.DemoService/providers/dubbo%3A%2F%2F172.23.234.48%3A20880%2Forg.apache.dubbo.demo.DemoService%3Fapplication%3Ddubbo-demo-api-provider%26deprecated%3Dfalse%26dubbo%3D2.0.2%26timestamp%3D1600336144382

使用应用级服务发现注册到注册中心上是这样

/services/dubbo-demo-api-provider/172.23.234.48:20880

而重sdk,未来可能会被mesh改善,据说阿里内部已经有dubbo mesh落地的业务线了。


搜索关注微信公众号"捉虫大师",后端技术分享,架构设计、性能优化、源码阅读、问题排查、踩坑实践。

本文已收录 https://github.com/lkxiaolou/lkxiaolou 欢迎star。

Dubbo的前世今生的更多相关文章

  1. 分布式服务治理框架Dubbo的前世今生及应用实战

    Dubbo的出现背景 Dubbo从开源到现在,已经出现了接近10年时间,在国内各大企业被广泛应用. 它到底有什么魔力值得大家去追捧呢?本篇文章给大家做一个详细的说明. 大规模服务化对于服务治理的要求 ...

  2. Rpc框架dubbo-server(v2.6.3) 源码阅读(一)

    额,dubbo的前世今生咱就不说了,有用的人都知道.(最新版本已更名 incubator-dubbo,预计版本3.0,不过咱们就先不掺和别人的开发过程了,以v2.6.3为蓝本) 首先,是工作需要,用到 ...

  3. 浅谈服务治理、微服务与Service Mesh(三) Service Mesh与Serverless

    作为本系列文章的第三篇(前两篇<浅谈服务治理.微服务与Service Mesh(一)Dubbo的前世今生>,<浅谈服务治理.微服务与Service Mesh(二) Spring Cl ...

  4. Dubbo阿里Alibaba开源的分布式服务框架

    [获奖公布]"我的2016"主题征文活动    程序猿全指南,让[移动开发]更简单!      [观点]移动原生App开发和HTML 5开发,你更看好哪个?   博客的神秘功能 D ...

  5. Dubbo近况

    刚下班看到开发者头条上一篇讲dubbo前世今生的文章,总结的不错,摘录一下. 从2012年10月23日Dubbo 2.5.3发布后,在Dubbo开源将满一周年之际,阿里基本停止了对Dubbo的主要升级 ...

  6. Dubbo加权轮询负载均衡的源码和Bug,了解一下?

    本文是对于Dubbo负载均衡策略之一的加权随机算法的详细分析.从2.6.4版本聊起,该版本在某些情况下存在着比较严重的性能问题.由问题入手,层层深入,了解该算法在Dubbo中的演变过程,读懂它的前世今 ...

  7. 2.Netty 与 NIO 之前世今生

      2.Netty 与 NIO 之前世今生 本文围绕一下几点阐述: 1. NIO 的核心组件 Buffer.Selector.Channel. 2.何谓多路复用? 3.Netty 支持的功能与特性. ...

  8. 用dubbo时遇到的一个序列化的坑

    首先,这是标题党,问题并不是出现在序列化上,这是报错的一部分: Caused by: com.alibaba.dubbo.remoting.RemotingException: Failed to s ...

  9. 【调侃】IOC前世今生

    前些天,参与了公司内部小组的一次技术交流,主要是针对<IOC与AOP>,本着学而时习之的态度及积极分享的精神,我就结合一个小故事来初浅地剖析一下我眼中的“IOC前世今生”,以方便初学者能更 ...

随机推荐

  1. Vue系列教程(三)之vue-cli脚手架的使用

    一.Vue-cli的环境准备 目的:(1)快速管理依赖 (2)确定项目结构 1.安装node.js Node.js是一个可以让前端运行在服务器上的一个工. 下载:https://nodejs.org/ ...

  2. LINUX学习-Mysql集群-主主备份

    接着主从备份继续. 1.编辑主从服务器 vim /etc/my.cnf 在server-id下添加一句 忽略一些信息 binlog-ignore-db=mysql 2.从服务器也授权给主服务器 gra ...

  3. 阿里神器 Seata 实现 TCC模式 解决分布式事务,真香!

    今天这篇文章介绍一下Seata如何实现TCC事务模式,文章目录如下: 什么是TCC模式? TCC(Try Confirm Cancel)方案是一种应用层面侵入业务的两阶段提交.是目前最火的一种柔性事务 ...

  4. Java 将PDF转为PDF/A

    通过将PDF格式转换为PDF/A格式,可保护文档布局.格式.字体.大小等不受更改,从而实现文档安全保护的目的,同时又能保证文档可读.可访问.本篇文章,将通过Java后端程序代码展示如何将PDF转为符合 ...

  5. leetcode 102. 二叉树的层次遍历 及 103. 二叉树的锯齿形层次遍历

    102. 二叉树的层次遍历 题目描述 给定一个二叉树,返回其按层次遍历的节点值. (即逐层地,从左到右访问所有节点). 例如: 给定二叉树: [3,9,20,null,null,15,7], 3 / ...

  6. 系统信号SIGHUP、SIGQUIT、SIGTERM、SIGINT的场景

    SIGHUP:hong up 挂断.本信号在用户终端连接(正常或非正常)结束时发出, 通常是在终端的控制进程结束时, 通知同一session内的各个作业, 这时它们与控制终端不再关联.登录Linux时 ...

  7. Spark基础知识详解

    Apache Spark是一种快速通用的集群计算系统. 它提供Java,Scala,Python和R中的高级API,以及支持通用执行图的优化引擎. 它还支持一组丰富的高级工具,包括用于SQL和结构化数 ...

  8. 很详细的FFT(快速傅里叶变换)概念与实现

    FFT 首先要说明一个误区,很多人认为FFT只是用来处理多项式乘的,其实FFT是用来实现多项式的系数表示法和点值表示法的快速转换的,所以FFT的用处远不止多项式乘. FFT的前置知识:点值表示法,复数 ...

  9. 通过kubeadm工具部署k8s集群

    1.概述 kubeadm是一工具箱,通过kubeadm工具,可以快速的创建一个最小的.可用的,并且符合最佳实践的k8s集群. 本文档介绍如何通过kubeadm工具快速部署一个k8s集群. 2.主机规划 ...

  10. rsync.sh

    #!/bin/bash file1=`du -sm /var/www/vhosts/|awk '{print $1}'` ps=`ps -C rsync --no-header|wc -l` if [ ...