“腾百万”之后,腾讯的云操作系统VStation单集群调度达10万台

https://www.leiphone.com/news/201909/4BsKCJtvvUCEb66c.html

腾讯有超过100万台服务器.. 阿里应该也差不多了吧
本文作者:王刚 2019-09-19 09:03
导语:对话腾讯云硬件与虚拟化团队

今年5月,腾讯全网服务器总量迈过100万台里程碑,成为中国首家服务器总量超过百万的公司,也是全球五家服务器数量过百万的公司之一。同时,今年腾讯的带宽峰值也突破100T。

而在近期,腾讯云又宣布自研的云计算操作系统VStation已经实现在单集群内调度超过10万台服务器,成为业界首个达到此项能力的云厂商。

雷锋网了解到,Vstation是腾讯自研的云计算操作系统,起始于2012年,从那时起,就被部署到腾讯云分布在全球的地域里面(到今天25个地域、53个数据中心),要解决的就是大规模服务器资源调度问题。

不过,Vstation比较复杂,与其他操作系统类似,需要很多分布式组件来实现协同和统一。

一直以来,计算资源的调度与管理能力,以及服务器的虚拟化是云计算的关键基础技术。云计算是一个非常大的平台,其本质是把物理服务器做了集合与共享,对传统IT基础设施做了优化。

之所以调度显得如此重要,主要在于规模带来的复杂度的提

腾讯云云服务器产品负责人李力谈到,举例来看,如果一个人只有一台电脑不需要调度,如果有两台电脑就感觉有点麻烦了,有一个切换的困扰,距离它的存储更近,业务更近,整个的资源分配最合理。

云计算调度也一样,一个运维管十台机器和管一百台机器是完全不同的,这是一个复杂度持续上升的过程。

我们首先解决的第一个问题是如何将成千上万台的服务器的管理做到像管理一台那么简单。

其言下之意是操作不当会导致客户很难快速获得相应的IT的能力。

基于这个初衷,Vstation顺势而出。

雷锋网注意到,尤其是对于腾讯本身来说,1999年做QQ(1台服务器),2005年做QQ空间(5000台服务器),2010年推出微信(超10万台服务器),2011年推出腾讯视频(超20万台服务器),都掐住了互联网发展的最佳节点,在这样的过程中,其内需的服务器规模一直在增长。

用李力的话来说,2013年当腾讯云正式成立时,服务器数量已经超过40万台,整个腾讯的计算规模是以指数级的指标在往上走。

Vstation具备的主要能力有三个:自主研发、安全可控;高可用高并发;支持异构硬件,支持物理机。

某种程度上看,用户对云服务器的需求有点超出了云本身应该做的范围。当面向产业互联网的客户时,腾讯云在Vstation之上又增加了黑石物理计算的支持,这样“云服务器、物理服务器都变成客户的资产”。

据李力介绍,从第一行代码开始,他们就完全按照腾讯的高规格要求去做的安全可控的操作系统,适配高可用、高并发的需求。腾讯的业务都是一级的用户,在腾讯的内部,他们所有的业务要求都非常严格,不容出错——这意味着,Vstation的起点也比较高。

目前,腾讯云VStation已经部署在腾讯云遍布全球的数据中心中,支持数万台虚拟机分钟级别创建,并可以在十款不同硬件中协同操作。

怎么体现 VStation 的价值?

李力表示,云服务器是完全对物理服务器的抽象,以前在控制台上去创建一台云服务器,要经历多个技术模块,创建耗时5分钟到10分钟。腾讯云在设计 VStation之初就让其肩负着大规模调度、海量并发和支持异构计算的历史使命,在做了深度优化之后,Vstation创建一台云服务器只需要5到10秒,在并发的场景上,如果有一个用户需要业务扩容1000台服务器,腾讯云可以在30秒到60秒之内完成,这意味着一个中等偏大的公司整体的计算资源的需求可以在腾讯云上1分钟得到交付

关于“秒级计费”,雷锋网(公众号:雷锋网)注意到,2013年的时候,腾讯云就支持了秒级计费,这个能力是同行在几年之后才开始支持的。这种收费方式的好处是能够更好支撑企业大规模计算部署需求,并有效降低突发性业务的计算成本支出。

为何腾讯全网服务器数量达到100万台而单集群内VStation只能调度超过10万台服务器?李力就此进行了答疑。他表示:

这里还是强调“单集群”,腾讯在云计算的单集群里面还是十万台的规模,在单集群的规模里面短时间之内也不会达到百万台。云有分区的属性,不太可能在一个地方搞太大。

在未来计划上,李力表示,VStation会维持十万、数十万的单集群调度服务器规模,往海外部署,通过技术上的EC点和OC点往国内中小城市延展(只不过集群规模会越来越小,中心区的集群规模是最大的)。

可以看到,早期的电商、游戏、视频甚至一些金融的客户给了腾讯不小的机会,使得腾讯云能够迅速做起来,而到了传统行业开始数字化的当下,虽然其对云接受相对比较慢,但是计算量要求却是非常巨大,加上政府、央企等大客户要上云,这给今天的腾讯带来了新的挑战,但同时也催生了挣钱的新机会。

[转帖]“腾百万”之后,腾讯的云操作系统VStation单集群调度达10万台的更多相关文章

  1. [转帖]单集群10万节点 走进腾讯云分布式调度系统VStation

    单集群10万节点 走进腾讯云分布式调度系统VStation https://www.sohu.com/a/227223696_355140 2018-04-04 08:18 云计算并非无中生有的概念, ...

  2. 腾讯混合云存储 TStor 系列再添新成员,并行存储一体机正式发布

    最近国内某大型互联网公司依靠其数据优势成功上市,可见数据的重要性,而数据和存储密不可分,您真的知道自己需要更高性能存储吗? 在当今数据爆发式增长的时代,数据已经成为很多行业最重要的资源,没有之一. 数 ...

  3. 基于腾讯Centos7云服务器搭建SVN版本控制库

    基于腾讯Centos7云服务器搭建SVN版本控制库 最近在和小伙伴组队参加一个关于人工智能的比赛,无奈不知道怎么处理好每个人的代码托管问题,于是找到了晚上免费svn托管服务器的服务,但是所给的免费空间 ...

  4. 腾讯通信云服务端使用心得,腾讯云IM

    腾讯通信云服务端使用心得 1.腾讯通信服务入口并创建应用 方便使用保留url地址 :   https://cloud.tencent.com/product/im 注册账号腾讯云账号->通过审核 ...

  5. PGXZ-腾讯全功能分布式关系数据集群

    PGXZ-腾讯全功能分布式关系数据集群

  6. 聚焦小游戏技术生态,腾讯游戏云GAME-TECH落地厦门

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由腾讯游戏云 发表于云+社区专栏 2018迎来了小游戏元年,据<2018年小游戏行业白皮书>显示:2018年小游戏市场规模预 ...

  7. 佣金百万so easy!阿里云推广联盟喊你来赚钱

    淘客速来,佣金百万so easy!阿里云推广联盟喊你来赚钱 阿里云CPS推广阶梯返佣活动火热升级! 坐享15%佣金!一笔成交即有奖励!最高奖励2000元! 超高客单价.高转化率.高佣金! 招募淘客推广 ...

  8. 腾讯Ubuntu云虚拟主机设置ftp服务器

    刚申请了免费的腾讯云主机, 发现还要想办法自己的服务器代码传到云主机上 在网上搜了很多方法介绍, 照着设置完后都无法正常连接 最后半夜尿醒来睡不着找到一篇站内文章, 提到必须注释掉一行代码 这个是其他 ...

  9. javascript 腾讯ABS云平台面试题及面试经历

    既然说到面试前端肯定是Javascript各种问,只好各种答. 面试题肯定离不了,最近热门的Vue.js,React.js,Angular.js,Gulp,Webpack还有各种Js问题,还有令人头痛 ...

随机推荐

  1. HDU 6194 string string string ——(2017沈阳网络赛,后缀数组)

    思路见:http://blog.csdn.net/aozil_yang/article/details/77929216. 代码如下: #include <stdio.h> #includ ...

  2. VMware 桥接网络设置

    1. 桥接的基本原理 桥接是将虚拟机和宿主机在局域网中的地位看成是一样的,逻辑如下: 但实际上是通过如下图实现的:(该图来自http://blog.csdn.net/qingfengtsing/art ...

  3. 第06组 Alpha冲刺(1/6)

    队名:拾光组 组长博客链接 作业博客链接 团队项目情况 燃尽图(组内共享) 宋奕 过去两天完成了哪些任务 主要完成了用户模块接口 具体完成了用户注册登录,忘记.修改密码,修改.查看个人信息 GitHu ...

  4. MYSQL | ERROR 1305(42000) SAVEPOINT *** DOES NOT EXIST

    autocommit模式:在开启情况下,对于每条statement来说,都会自动形成一个commit,也就是会即时对开始和结束一个事务.所以,当出现rollback to savepoint出现这个错 ...

  5. C++ 11 线程调用类的成员函数解决办法

    在C++中,_beginthreadex 创建线程是很麻烦的.要求入口函数必须是类的静态函数. 通常,可以采用thunk,或者模板来实现. 因C++ 11中引入了 std::async ,可以很好的解 ...

  6. 如何解决Access操作或事件已被禁用模式阻止

    操作或事件已被禁用模式阻止.本来是Access安全设置的一部分,可以防止一些危险性的宏自动运行损坏数据,但是如果是自己在设计或是修改Access数据库的时候,这个就比较烦人了,一次次的提示,每次都需要 ...

  7. Spring cloud微服务安全实战-5-3后端服务改造

    本节来实现一个登陆的效果. 需要一个登陆前的页面和登陆后的页面. 直接粘贴过来的代码 这是一个和后台的绑定 后台要有个autenticated的对象来实现绑定,ts内我们定义这个autenticate ...

  8. ABAP DEMO 下拉框

    效果展示: *&---------------------------------------------------------------------* *& Report YCX ...

  9. LeetCode_263. Ugly Number

    263. Ugly Number Easy Write a program to check whether a given number is an ugly number. Ugly number ...

  10. iOS实现简单时钟效果

    实现的效果图如下 : 实现代码如下: #import "ViewController.h" //将旋转角度转换为弧度制#define angleToRadion(angle) (( ...