完善的IaaS云服务的个人理解
此文已由作者王盼授权网易云社区发布。
欢迎访问网易云社区,了解更多网易技术产品运营经验。
前情提要
本文仅讨论云主机(虚拟机)、云硬盘(块存储)、云网络(普通虚拟网络或SDN)相关的IaaS服务,相关论调仅代表个人意见,如有谬误,敬请批评指正。
这篇文章在7月份就列好了大纲,但是一直拖拖拉拉到11月初,才憋出了几百字。
网易云IaaS平台自2012年上半年立项,到如今已有接近5年的发展历程,生产环境云主机数量也从个位数扩展到当前的5位数,机房数量也从1个扩展到杭州3个,北京2个,并且还在迅速扩张。有一点我特别深有体会,那就是生产环境流行“屯云主机”,线上资源长期处于秒杀状态,每个季度采购的几十台计算节点,一个月左右基本就抢光,剩下两个月就处于等待新节点上线,无法创建新云主机的尴尬境地,所以很多有经验的开发人员,会在季度采购节点上线后,迅速准确的提出扩容需求(当然可能是两三个月之后的需求),创建一批云主机备用,当然他们也是逼不得已,因为晚了就抢不到了。说了这么多,不知道大家看明白了没有,我只是想强调一点,我们的IaaS服务非常受欢迎(想吐槽的人请私下联系我即可,千万不要在评论区留言)。
接下来就谈一谈我心目中的完善的IaaS服务是长什么样的,至于我们的IaaS服务做到了没有,暂且不论,权当闲聊吧。
何为完善
功能完善
运维便利
安全可靠
性能优异
体验友好
服务优质
成本低廉
功能完善
作为一个IaaS服务提供商,尤其是做公有云(私有云需求相对简单一些),必须要提供完善的IaaS功能,这点是最基本、最基础的要求,如果功能都不完善,缺少一些重要功能,甚至API都不对用户开放,怎么能算是完善的IaaS服务?个人认为具备如下几个方面的功能,才能算是功能完善:
普通用户功能
基本的主机、网络、存储资源的生命周期管理功能(增删改查、修改规格、快照备份、VNC等)
资源汇总查看
操作日志查看(包含web和api操作)
账户及子账户管理
监控报警
计费充值(消费清单、充值记录、发票申请、退款处理等)
镜像丰富,规格齐全
客户支持(一般为工单系统)
API、SDK、CLI支持
移动端管理
后台管理员功能
在线、离线迁移及常规生命周期管理
平台容量规划预警
欠费通知及处理
集群状态监控
异常状态报警
租户配额管理
用户权限控制
管理员分级
管理员操作审计
各种资源的详细信息展示
功能完善的直观体现是用户不会因为功能不全而选用竞品。
运维便利
IaaS云平台运维主要包含如下几个方面:
平台初始化部署
平台扩缩容及容量估算
平台升级更新
平台故障恢复
常见错误排查
便利的意思主要是指如下几个方面:
故障自恢复,不需要人为介入
人员交互少,跨部门跨项目组交互少,最好一个人能搞定
耗时短,自动化程度高,极低的人工参与度
操作简单,容易上手,不需要高深的知识技能和经验积累(坑少且浅)
常见简单错误可以自助识别原因(无资源、无网络端口、无配额等)
运维便利的直观体现是新招员工一周内可接手全部平台运维工作。
安全可靠
计算服务多层高可用保障(多数据中心,多级可用域)
网络服务冗余链路保障
存储多副本保障、租户数据隔离
管理服务无单点
SLA保证
QoS保证
租户网络隔离
平台、租户防攻击(平台入口如web或API、网络、虚拟化内核等方面)
机房基础设施安全(多路供电、多网络出口、防人为失误、防火防盗防高温防鼠防虫等)
管理员权限管控(防止误操作和恶意操作)
用户及管理员操作记录和审计
物理基础设施资源冗余保障(机房、机柜、电力、服务器、交换机、硬盘、内存、网卡、网络带宽等)
计算节点宕机恢复速度快(支持云主机宕机自动迁移恢复)
其他节点宕机用户无感知
安全可靠的直观体现为全年用户可感知故障时间和次数(总故障时间120分钟以内或更少,总故障次数不超过3次)
性能优异
计算(cpu、内存)性能达到或接近扣除虚拟化损耗的理论值
网络(带宽、时延)性能达到或接近扣除虚拟化损耗的理论值
存储(带宽、时延)性能达到或接近扣除虚拟化损耗的理论值
性能波动较少,与租户数量、测试时间段等关系较小或无关
不同租户性能相互影响较小或无相互影响
相同租户不同云主机的性能相互影响较小或无相互影响
性能优异直观体现为与竞品厂商相比,对比测试结果排名靠前(前三或更好),并与测试时间段无关
体验友好
完善的使用指导文档(目录清晰、内容详细、解释清楚、更新及时、FAQ全面)
优秀的web交互、UI设计(人性化、提示明确、傻瓜式,很多用户是不看文档直接上手操作的)
详细生动的API文档(文档更新及时、目录清晰、示例丰富、参数尽量少、内聚程度高、版本兼容性好)
体验友好的直观体现为用户使用过程中问题较少(用户极少因为使用问题找售后支持)
服务优质
用户响应及时(按问题类型、用户类型分类制定响应时限,类似服务等级策略)
渠道丰富(工单、QQ、微信群、公众号、电话等)
售前交流深入充分(将平台的相关局限性与用户充分沟通,可防止给用户过高期望而导致满意度降低)
服务优质的直观体现为用户满意度很高(如果满分5分,则需要达到90%以上4分甚至更高)
成本低廉
成本低廉的直观体现是相同规格服务与竞品价格对比优势明显,并且可保证我们平台的盈利能力。
云硬盘是网易云提供多种硬件介质的块存储设备,用户可以根据实际生产环境,灵活选择云硬盘类型和规格大小,弹性地创建、删除、挂载、卸载、扩容云硬盘。
更多网易技术、产品、运营经验分享请点击。
相关文章:
【推荐】 Hive中文注释乱码解决方案(2)
【推荐】 如何开发一个可运维系统的一点体会
【推荐】 iOS安装包瘦身(下篇)
完善的IaaS云服务的个人理解的更多相关文章
- 5分钟理解iaas paas saas三种云服务区别
随着云计算的大热,向我咨询云计算相关问题的童鞋也越来越多,其中最近问的比较多的一个问题便是云计算中的pass是什么意思?整好今天有空,统一给大家解释下pass是什么意思?和Iass.Sass之间有什么 ...
- 理解iaas paas saas三种云服务区别
其实搞懂这个问题也不难,我们可以把云计算理解成一栋大楼,而这栋楼又可以分为顶楼.中间.低层三大块.那么我们就可以把Iass(基础设施).Pass(平台).Sass(软件)理解成这栋楼的三部分.基础设施 ...
- IaaS,PaaS,Saas 云服务的介绍
云服务只是一个统称,可以分成三大类. IaaS:基础设施服务,Infrastructure-as-a-service PaaS:平台服务,Platform-as-a-service SaaS:软件服务 ...
- 云服务中IaaS、PaaS、SaaS的区别
越来越多的软件,开始采用云服务. 云服务只是一个统称,可以分成三大类. IaaS:基础设施服务,Infrastructure-as-a-service PaaS:平台服务,Platform-as-a- ...
- 国内物联网平台(5):机智云IoT物联网云服务平台及智能硬件自助开发平台
国内物联网平台(5)——机智云IoT物联网云服务平台及智能硬件自助开发平台 马智 平台定位 机智云平台是致力于物联网.智能硬件云服务的开放平台.平台提供了从定义产品.设备端开发调试.应用开发.产测.运 ...
- IM云服务领域,融云因何得以登上浪潮之巅?
每一次技术驱动下的商业变革都是以浪潮的形式到来,每一次的涨潮都会带着赶上浪潮的企业登上新的巅峰.随着移动互联网的融合发展,短短几年期间,IM通讯云服务从早期的虚无飘渺到如今已经成为现代企业的标配,引发 ...
- Iass、Pass、SasS三种云服务区别?
Iass.Pass.SasS三种云服务区别 我们可以把云计算理解成一栋大楼,而这栋楼又可以分为顶楼.中间.低层三大块.那么我们就可以把Iass(基础设施).Pass(平台).Sass(软件)理解成这栋 ...
- [转]在 Azure 云服务上设计大规模服务的最佳实践
本文转自:http://technet.microsoft.com/zh-cn/magazine/jj717232.aspx 英文版:http://msdn.microsoft.com/library ...
- 国内物联网平台初探(五) ——机智云IoT物联网云服务平台及智能硬件自助开发平台
平台定位 机智云平台是致力于物联网.智能硬件云服务的开放平台.平台提供了从定义产品.设备端开发调试.应用开发.产测.运营管理等覆盖智能硬件接入到运营管理全生命周期服务的能力. 机智云平台为开发者提供了 ...
随机推荐
- C#基础学习4
流程控制!
- Android studio 时间选择器
相当简单加载 gradle文件然后做一个textview即可. 1.首先我们要在build.gradle中写上这一行代码: compile 'com.feezu.liuli:timeselector: ...
- synchronize早已经没那么笨重
我发现一些同学在网络上有看不少synchronize的文章,可能有些同学没深入了解,只看了部分内容,就急急忙忙认为不能使用它,很笨重,因为是采用操作系统同步互斥信号量来实现的.关于这类的对于synch ...
- 浅析 innerHTML 性能优化的原理
浅析 innerHTML 性能优化的原理 博客分类: web前端 IEAndroidwebkit浏览器UI 昨天看了 lveyo老兄的"innerHTML的性能问题" 一文 ht ...
- [Java 8] (9) Lambda表达式对递归的优化(下) - 使用备忘录模式(Memoization Pattern) .
使用备忘录模式(Memoization Pattern)提高性能 这个模式说白了,就是将需要进行大量计算的结果缓存起来,然后在下次需要的时候直接取得就好了.因此,底层只需要使用一个Map就够了. 但是 ...
- 使用JavaScript给对象修改注册监听器
我们在开发一些大型前端项目时,会遇到这样一种情况,某个变量上有个字段.我们想知道是哪一段程序修改了这个变量上的字段.比如全局变量window上我们自定义了一个新字段_name,我们想知道到底有哪些程序 ...
- SQLite – GROUP BY
SQLite - GROUP BY SQLite GROUP BY子句中使用与SELECT语句的合作安排相同的数据组. 在GROUP BY子句之前一个SELECT语句的WHERE子句,先于ORDER ...
- Android(java)学习笔记157:开源框架的文件上传(只能使用Post)
1.文件上传给服务器,服务器端必然要写代码进行支持,如下: 我们新建一个FileUpload.jsp的动态网页,同时我们上传文件只能使用post方式(不可能将上传数据拼凑在url路径下),上传数据Ap ...
- Android(java)学习笔记177: 服务(service)之音乐播放器
1.我们播放音乐,希望在后台长期运行,不希望因为内存不足等等原因,从而导致被gc回收,音乐播放终止,所以我们这里使用服务Service创建一个音乐播放器. 2.创建一个音乐播放器项目(使用服务) (1 ...
- swift Equatable 的缺省实现
Starting from Swift 4.1, all you have to is to conform to the Equatable protocol without the need of ...