(一) 项目背景:

网上办事大厅是由省信息中心承建的电子政务核心业务系统,致力于为全省民众提供一站式网上办事服务,实现了政务信息网上公开、法人及个人事项网上办理、公共决策网上互动、政府效能网上监督五大功能。目前大厅已进驻省级部门57个,市县部门6318个,提供电脑版和智能终端版访问服务。

随着电子政务的推进,网上办事大厅所涉及的系统规模不断扩大,数量日益增多,业务持续增长,再加上运维团队缺少了有效的管理和防护手段,平台管理和信息安全问题日渐凸现。

在国家对电子政务信息系统安全保障工作的要求以及等级化保护“坚持积极防御、综合防范”的方针指导下,急需建设一套完备的安全管理服务体系,加强运行环境监控、应用性能管理和安全防护体系的建设,从不同维度监控网办平台的可用性和性能,进而保证系统安全高效的运行,实现省网上办事大厅和政府服务的信息化、智能化。

(二) 用户反馈:

OneAPM 帮我们打造了一个五维的安全运行监控平台和体系,从发现问题,通知问题,定位问题,解决问题,到归纳问题。过去都是系统出现问题,我们被动告知,还需要花大量时间定位问题根源,并进行修复。通过这个平台我们能更加直观、主动的发现系统潜藏的问题,有效预防风险,极大的提升了运维效率,降低了管理成本,也给民众带来了更加满意的使用体验。

(三) OneAPM 解决方案:

基于 OneAPM 基础资源管理 Infrastructure Insight、应用性能管理 APM、模拟拨测 Cloud Test、实时应用安全防护 RASP 四大核心产品能力构建的一体化运维管理平台,从全面监测、准确预警、快速诊断、辅助优化,到指导评估,建立起一套完善的安全可靠运行保障体系。

全面监测,及时发现平台风险,故障主动发现率提升至85%

在 OneAPM 一体化运维管理平台上线前,整个网上办事大厅涉及的 IT 资源由8名运维工程师通过几个开源工具进行日常运维,常常是最终用户发现并反馈网办大厅系统问题之后才开始着手处理,运维工程师80%以上的时间都在“救火”。这样的运维方式既被动,又效率低下,造成用户满意度较差。OneAPM 一体化运维管理平台,提供了主动和被动两种监测手段,及时发现网办平台的运行风险。Cloud Test 是一个应用系统可用性及性能主动监测方案,通过遍布全省的访问监测点,7X24小时不间断模拟网办平台的业务访问,详尽了解网办平台业务的性能和可用性,在最终用户访问体验受影响之前提前发现系统性能问题。Infrastructure Insight 和 APM 是一个应用系统可用性及性能被动监测方案,从运行环境和用户体验两个角度,监测应用系统运行态的可用性、健康度、性能和安全性,监测指标覆盖信息中心的服务器、网络、操作系统、数据库、中间件、应用系统、浏览器和手机 APP,以及应用中所存在的各类安全攻击手段,实时监测系统性能、系统故障,以及安全攻击行为。这两种手段相辅相成,构建了一个对网办平台所有 IT 资源进行全面主动监测的日常工作环境,帮助运维工程师对系统状态做到心中有数,对突发故障做到胸有成竹。

准确预警,第一时间反馈风险至责任人,告警准确送达率88%

由于开源工具只提供服务器、网络、操作系统、数据库、中间件等基础资源的实时性能数据查看功能,缺少告警模块,运维人员无法在第一时间获得准确的系统异常信息。OneAPM 一体化运维管理平台结合网办平台等保三级以及日常管理的相关指导文件和相关规范,主动定义各类关键性能指标的最佳预警阈值,第一时间定位系统性能问题。对于一些有着时间周期特性的性能指标,通过动态基线算法自动拟合预警阈值,在减少告警配置工作量的同时,进一步提升了告警的准确度。运维管理平台提供的邮件、短信、微信等多种告警方式,快速、准确通知到相关责任人,实现被动管理到主动管理的跨越。同时,运维管理平台通过采用模拟的手段 Cloud Test,对网办平台可用性进行定期的访问和监测,确保系统能够有效运行,在出现故障时第一时间进行通知和预警。

快速诊断,精准分析定位故障根因,平均故障检测时间 MTTD 缩减到原来的四分之一

作为一个运维管理平台仅仅只提供资源的指标监控和告警是不够的。监控的范围越广,监控的指标越多,系统产生的告警也就越多,运维工程师去甄别告警真伪和根因的时间也就越长。这反而不利于故障的分析和定位。如何帮助运维工程师快速识别和精准分析故障根因,也就成为了体现运维管理平台价值的关键之一。

OneAPM 一体化运维管理平台中的 APM 产品以真实的用户体验和端到端应用性能为切入点,颠覆传统运维监控方案,实现自上而下的 IT 管理新模式。一体化运维管理平台提供了对前端浏览器、应用性能、中间件性能、数据库性能、主机性能的自动关联和分析,帮助运维工程师快速识别、定位网办平台的性能瓶颈和可用性问题。同时,运维管理平台通过自动学习能力,识别、记录业务交易的类型,业务代码类执行的效率及业务性能匹配模式,辅助运维工程师从代码类、参数到数据库语句,进行完整交易链的性能诊断和故障定位,将平均故障检测时间从原来的4小时缩减到1小时。

辅助优化,专业化问题处置建议,平均故障恢复时间MTTR缩短一半

专业化的故障处置建议是缩短平均故障恢复时间的关键。不论是服务器和操作系统的配置参数调整,网络的设置调整,中间件和数据库的配置优化,还是应用系统的代码修改,都提升网办平台处理性能的重要手段。

OneAPM 一体化运维管理平台提供了以一星期为周期的系统性能诊断和优化建议报告,通过对应用系统关键性能指标和参数的详细分析,给出量化的评估效果,并提供系统优化建议,包括应用系统代码优化、数据库性能优化、中间件性能优化、操作系统性能优化等,指导运维工程师与研发工程师快速对网办平台性能瓶颈做出响应。运维管理平台还能提供实时故障处理建议,针对告警详细信息,结合过往运维经验,提供处置方案,方便运维工程师及时对系统故障进行判断和处理。

指导评估,总结沉淀运维经验,提供决策数据支持

通过充分挖掘监控数据的可用性,OneAPM 一体化运维管理平台建立了一套多数据源、多用户视角、沉淀专家经验的运行环境分析评估体系。通过各个维度的分析报表,建立面向客户感知的、面向业务体验的、面向运行质量,围绕性能、故障、考核主题的管理分析能力。帮助运维工程师主动分析系统性能、容量,预测问题,为“决策层、管理层、执行层”人员提供决策支持。

国内 ITOM 管理平台OneAPM 致力于帮助企业用户提供全栈式的性能管理以及 IT 运维管理服务,通过一个探针就能够完成日志分析、安全防护、APM 基础组件监控、集成报警以及大数据分析等功能。想阅读更多优秀文章,请访问 OneAPM 官方技术博客

来源:http://blog.oneapm.com/casestudy/821.html

「客户成功故事」OneAPM 助力网上办事大厅构建阳光、高效、安全的政务服务平台的更多相关文章

  1. 未来科技城 x 奇点云打造「企业数据大脑」,助力1.3万家企业服务

    “当前,政府数字化和数字政府建设已成为一种趋势.一种必然,并且有了一条水到渠成式的实现路径.” 上升为国家战略的数字中国建设加速了”智慧政务“的生动实践,杭州未来科技城的「企业数据大脑」就是一个典型. ...

  2. Loj #2331. 「清华集训 2017」某位歌姬的故事

    Loj #2331. 「清华集训 2017」某位歌姬的故事 IA 是一名会唱歌的女孩子. IOI2018 就要来了,IA 决定给参赛选手们写一首歌,以表达美好的祝愿.这首歌一共有 \(n\) 个音符, ...

  3. 「编程羽录」上线,程序员必备的这些技能你能get到嘛?

    大家好,我是小羽. 好久不见,给大家带来个好消息,小羽的全新专题「编程羽录」系列正式上新,主要是介绍一些关于面试题和经验总结的文章. 会为大家提供一些技术栈之外,程序员还需要的其他方面硬核知识,做到全 ...

  4. 对于前端,「微信小程序」其实不美好

    微信小程序开放公测了,9月底我曾经写过一篇 「微信小程序」来了,其中最后一句:"谢天谢地,我居然还是个前端". 这种火爆的新事物总是令人激动,感谢这个时代. 但是,当我真作为开发者 ...

  5. 企业运营对 DevOps 的「傲慢与偏见」

    摘要:出于各种原因,并非所有人都信任 DevOps .有些人觉得 DevOps 只不过给开发者改善产品提供了一个途径而已,还有的人觉得 DevOps 是一堆悦耳的空头支票,甚至有人认为 DevOps ...

  6. [译]聊聊C#中的泛型的使用(新手勿入) Seaching TreeVIew WPF 可编辑树Ztree的使用(包括对后台数据库的增删改查) 字段和属性的区别 C# 遍历Dictionary并修改其中的Value 学习笔记——异步 程序员常说的「哈希表」是个什么鬼?

    [译]聊聊C#中的泛型的使用(新手勿入)   写在前面 今天忙里偷闲在浏览外文的时候看到一篇讲C#中泛型的使用的文章,因此加上本人的理解以及四级没过的英语水平斗胆给大伙进行了翻译,当然在翻译的过程中发 ...

  7. 「微信小程序」有哪些冲击与机会?

    昨天晚上相信大家的朋友圈被「微信小程序」刷屏了,这影响力赶上了国务院出台新政策一样,足以说明微信在中国的影响力之大. 然后今天公号后台一大堆人问我怎么看这件事,不少人非常忧虑,仿佛自己将要失业一样. ...

  8. 「雕爷学编程」Arduino动手做(15)——手指侦测心跳模块

    37款传感器和模块的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止37种的.鉴于本人手头积累了一些传感器与模块,依照实践出真知(动手试试)的理念,以学习和交流为目的,这里准备 ...

  9. 从0开始学习 GitHub 系列之「03.Git 速成」

    前面的 GitHub 系列文章介绍过,GitHub 是基于 Git 的,所以也就意味着 Git 是基础,如果你不会 Git ,那么接下来你完全继续不下去,所以今天的教程就来说说 Git ,当然关于 G ...

随机推荐

  1. Spring boot集成spring-boot-starter-data-jpa环境搭建

    1.创建Spring boot项目 2.保存等待构建完成 3.增加spring-boot-starter-data-jpa.内存数据库依赖包hsqldb <!-- 添加data jpa依赖 -- ...

  2. C#--对象转Json序列化

    前言 最近在研究Android项目,其中涉及到Android中解析Json数据的问题,需要模拟网络中传递Json数据的模式,因为以前是.net的工程师,所以想着从.net的平台开发服务,传递Json格 ...

  3. 【转】vmware 安装 osx 无法登录 appstore 的解决办法 (伪造smbios设备信息)

    伪造smbios设备信息 原文网址:http://www.insanelymac.com/forum/topic/292170-how-to-spoof-real-mac-in-vmware/page ...

  4. DateTimeHelper

    本文参考文章: http://geekswithblogs.net/mnf/articles/my-datetimehelper-class.aspx https://referencesource. ...

  5. ubuntu搭建nodejs生产环境——快速部署手册

    为什么不用CentOS而用Ubuntu作为生产环境的运行平台?这个我也比较好奇,公司订的只能沿用传统,从使用成本的角度来说,此举也是值得肯定的. 测试环境 腾讯云 Ubuntu 16.04 阿里云 U ...

  6. [Redux] redux的概述

    redux 的概述 随着 javascript 单页应用的不断发展,javascript 需要管理比以往都要多的状态,管理不断变化的 state 非常困难,数据流动不断变的模糊不可预测,代码的开发与维 ...

  7. iOS Runtime的消息转发机制

    前面我们已经讲解Runtime的基本概念和基本使用,如果大家对Runtime机制不是很了解,可以先看一下以前的博客,会对理解这篇博客有所帮助!!! Runtime基本概念:https://www.cn ...

  8. camera测试之MTF

    1.MTF介绍 MTF(Modulation Transfer Function)模量传递函数.MTF是camera成像对比度和分辨率的综合表现.从另一个角度来看,camera成像过程可以简单看成下图 ...

  9. C# 输出字符串到文本文件中

    写个博客记录下,方便以后使用: public class WriteHelper { public static void WriteFile(object data) { try { string ...

  10. mybatis整合springboot 以及需要注意的细节

    具体怎么整合的网上有很多优秀的博客介绍,这里就直接引用一篇个人觉得非常详细的教程: https://blog.csdn.net/winter_chen001/article/details/77249 ...