转码服务serverless探索
背景
公司目前主要聚焦于视频这个领域,利用视频为媒体、文旅、会议等行业进行赋能。
既然聚焦于视频领域,那么视频转码则是绕不开的话题。
为了降低成本,以及保证产品的核心能力,公司自建了一套转码系统。
转码服务除了尽可能多的兼容业界的视频格式外,转码的速度是另一个非常重要的指标。
因为视频转码对用户来说,感知最强的就是视频转码速度。
假如用户上传了一个1分钟的视频,转码花了10分钟甚至更久的话,用户肯定就不愿意使用我们的产品了。
对于用户来说等待的时间越短越好,对于转码服务来说转码速度越快越好。
我们先从转码流程说起,在聊一聊目前系统存在的问题,以及为serverless改造所做的努力。
转码流程
众所周知,转码是CPU密集型任务,一个长视频在单机上可能要转很久。但如果能用尽可能利用多的CPU去进行转码,那么转码速度将会大大加快。而现在丰富的云产品能够在短时间内提供大量的计算能力,以阿里云为例,阿里云提供了函数计算、Serverless应用引擎等serverless产品能够支撑起我们所需要的计算能力。
于是为了提高转码倍速,我们将
- 视频进行切片,每一个切片都是一个转码任务。一个长视频经过切片以后就会被切分成大量转码子任务。
- 将转码子任务调度到不同的机器上执行,充分利用不同机器上的CPU资源,提高转码速度
- 当所有的转码子任务都执行完毕以后,再进行汇总合并输出转码后的视频
流程如下:
切片 转码 合并
输入视频 ------> (n个)转码任务 ------> (n个)转码结果 -----> 输出视频
改造前的系统架构
再来看看我们的系统架构。
之前转码服务是一个应用,同时肩负着调度和转码的职责,其中:
- 调度主要是跟MySQL、Redis打交道:用Redis维护任务队列;MySQL则用来保存任务的执行状态
- 转码则是执行任务:读取文件系统中的源视频,转码后再将视频写入到文件系统中
大规模集群面临的问题
上面有提到为了提高转码速度,我们会有多个转码服务实例进行转码,但是上面的系统架构会限制转码集群的实例数。
上面的系统架构中,转码服务既承担了转码职责,也承担了调度的职责(获取任务、以及更新任务状态)。不符合存储(Redis、MySQL等数据层)与计算分离,无法大规模快速获取计算能力。
因为承担了调度的职责就不可避免的要与Redis、MySQL打交道,启动服务时就要与Redis、MySQL建立连接,且不说建立大量的连接Redis、MySQL能不能承受的住,光是建立连接所需要花费的时间就是一笔很大的浪费。
serverless改造
为了提供大规模的转码计算能力,我们决定对转码服务进行改造。
方案
改造的方案主要思路是将存储与计算分离,说大白话就是讲调度职责与转码职责进行分离,这样就可以只对转码计算能力进行扩容。
这里主要聊转码(计算)节点的改造点,主要有2个:
- 移除数据层的访问操作(剥离调度服务能力),避免建立连接
- 优化启动速度,尽可能缩短应用启动时间
移除数据层的访问操作
将转码(计算)节点的数据层访问操作全部都移除后,如何与调度服务进行通信呢?比如获取任务、提交转码结果需要通过调度服务访问Redis和MySQL。
一般有2种选择:dubbo或者http。我最终选择使用http进行通信。
这里先说一下为什么没有选择dubbo:还是上面所提到的、需要建立连接的问题,如果使用dubbo,那么就需要与zk等注册中心建立连接。而且如果发生大规模上下线(如发布)操作,那么势必给注册中心带来巨大的推送压力。
选择http进行通信,摆在眼前的第一个问题是:转码(计算)节点怎么知道调度节点的访问地址?
因为我们的服务部署在k8s集群中,借助k8s内部域名天然的解决了获取调度节点访问地址的问题。我们只需要访问调度节点在k8s中内部域名地址就可以访问到调度节点接口,而无需关系发布所带来的ip变化等情况。
使用http进行通信,调度节点除了需要做好优雅下线,避免http请求被意外终止;还需要做好数据幂等的措施。
提高应用启动速度
作为云原生应用,不会常备很多计算资源,但是需要的时候希望马上就有,这就要求应用启动越快越好。
影响应用启动速度的主要有下面2点:
- 拉镜像
- 应用启动
拉镜像的速度
我们选择了阿里云 sae job作为serverless载体,sae job刚好有一个镜像加速的能力:拉镜像到启动镜像可以做到15s,还可以接受,这块就不展开了。
应用启动
这块主要是尽可能的将非必须的代码移除,减少springboot扫描的bean,目前启动时间在6s左右。
另外也在尝试使用graalvm编译成本地可执行文件,测试的启动时间约1s左右。因为涉及到SpringBoot大版本变更以及JDK版本变更,这个方案还在测试,没有发布到生产环境。
改造后的系统架构
效果
serverless改造后的转码服务,带来的效果有2个:
- 带来更高的转码速度:在面对大量转码也不用担心转码慢的问题,一个字-扩!
- 成本的显著降低:得益于按量付费的模式,只需要为实际使用的计算资源付费,无需预留计算资源。
转码服务serverless探索的更多相关文章
- FPGA加速:面向数据中心和云服务的探索和实践
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由columneditor 发表于云+社区专栏 作者介绍:章恒--腾讯云FPGA专家,目前在腾讯架构平台部负责FPGA云的研发工作,探索 ...
- Android源码服务专家(申明:来源于网络)
Android源码服务专家(申明:来源于网络) 地址:http://www.javaapk.com/topics/demo/page/20/
- 使用 Docker 和 Nginx 打造高性能的二维码服务
使用 Docker 和 Nginx 打造高性能的二维码服务 本文将演示如何使用 Docker 完整打造一个基于 Nginx 的高性能二维码服务,以及对整个服务镜像进行优化的方法.如果你的网络状况良好, ...
- DotNet 使用阿里云媒体转码服务
公司项目中一部分文件放到了阿里云 OSS 上,其中有些音频文件是 amr 类型的,在后期使用的时候比较麻烦,所以需要转换成 mp3 的文件,方便以后使用.本来想使用 ffmpeg 处理,但由于文件都存 ...
- 别再问WiFi密码了,HMS Core统一扫码服务让手机一键联网
现代生活离不开网络.在餐厅.商场等公共场所,手机连接WiFi一直是高频使用场景.虽然公共场所的免费WiFi越来越多,但网络连接过程却很麻烦.有的需要打开网页注册或点击广告链接才能上网,还有的要求下载特 ...
- Netty(6)源码-服务端与客户端创建
原生的NIO类图使用有诸多不便,Netty向用户屏蔽了细节,在与用户交界处做了封装. 一.服务端创建时序图 步骤一:创建ServerBootstrap实例 ServerBootstrap是Netty服 ...
- RPC服务框架探索之Thrift
前言架构服务化后,需要实现一套方便调用各服务的框架,现在开源如日中天,优先会寻找开源实现,如果没有合适自家公司业务的,才会考虑从零开发,尤其是一切以KPI为准绳的公司,谁会跟钱过不去?N个月之前,公司 ...
- eureka源码--服务的注册、服务续约、服务发现、服务下线、服务剔除、定时任务以及自定义注册中心的思路
微服务注册后,在注册中心的注册表结构是一个map: ConcurrentHashMap<String, Map<String, Lease<InstanceInfo>>& ...
- 关于基于Nexus3和Docker搭建私有Nuget服务的探索
背景简介 NuGet是Microsoft开发平台的程序集包管理器,它由客户端工具和服务端站点组成,客户端工具提供给用户管理和安装/卸载软件程序包,以及打包和发布程序包到NuGet服务端站点等功能,服务 ...
- 口袋微博android源码服务端和客户端
刚刚在源码天堂看到了一个不错的安卓SNS应用源码,而且也比较完整的,它基本具备了新浪微博的所有功能,包括查看最新的微博.微博评论.好友资料.回复评论以及发私信等,除此之外,还提供了许多独有的特色功能: ...
随机推荐
- .NET 云原生架构师训练营(基于 OP Storming 和 Actor 的大型分布式架构一)--学习笔记
目录 为什么我们用 Orleans Dapr VS Orleans Actor 模型 Orleans 的核心概念 为什么我们用 Orleans 分布式系统开发.测试的难度(服务发现.通信) 运维的复杂 ...
- 常用的渗透测试工具——SQLMap安装
SQLMap是一个自动化的SQL注入工具,其主要功能是扫描.发现并利用给定URL的SQL注入漏洞,内置了很多绕过插件,支持的数据库是MySQL.Qracle.PostgreSQL.Microsoft ...
- YonBuilder移动开发平台功能大盘点
YonBuilder是面向企业组织和个人开发者的低代码开发平台,实现无代码.低代码.专业代码开发三种模式.提供元数据驱动和画布构建两种开发方式,通过点击拖拽+自动化代码生成和移动多端编译的技术,与开放 ...
- Spring IOC官方文档学习笔记(三)之依赖项
1.依赖注入 (1) 依赖注入(DI)的概念:某个bean的依赖项,由容器来负责注入维护,而非我们自己手动去维护,以此来达到bean之间解耦的目的,如下 //情况一:不使用依赖注入 public cl ...
- 低代码开发平台YonBuilder移动开发,开发阅读APP教程
设计实现效果如下图: 主要包括书架,阅读,收藏功能. 经过分析,我们可以先实现底部导航功能,和书架列表页面. 1. 使用 tabLayout 高级窗口实现底部导航 . 使用tabLayout 有两 ...
- C/C++语言 MD5例子
之前研究了一下在C中进行MD5加密,由于找了很久没有找到现成的库文件,所以所幸自己去写了一下.个人感觉C的便捷性没有Python好的原因就是这里. 下面是我写的一个例子. mian.cpp: 点击查看 ...
- Less-1(GET字符型)
union联合注入(方法一) 进入靶场 按照要求提交一个id:http://192.168.121.131/sqli/Less-1/?id=1 数据库执行语句:select * from news w ...
- [python]《Python编程快速上手:让繁琐工作自动化》学习笔记1
1. 模式匹配与正则表达式笔记(第7章)(代码下载) 正则表达式,又称规则表达式.(英语:Regular Expression,在代码中常简写为regex.regexp或RE),计算机科学的一个概念. ...
- [Java]内存回收机制框架图
具体解释下面这篇博客总结的已经非常好了,我就不复制了: http://www.cnblogs.com/cielosun/p/6674431.html#12-%E5%8F%AF%E8%BE%BE%E6% ...
- 【深入浅出Seata原理及实战】「入门基础专题」带你透析认识Seata分布式事务服务的原理和流程(1)
分布式事务的背景 随着业务的不断发展,单体架构已经无法满足我们的需求,分布式微服务架构逐渐成为大型互联网平台的首选,但所有使用分布式微服务架构的应用都必须面临一个十分棘手的问题,那就是"分布 ...