(一) 项目背景:

网上办事大厅是由省信息中心承建的电子政务核心业务系统,致力于为全省民众提供一站式网上办事服务,实现了政务信息网上公开、法人及个人事项网上办理、公共决策网上互动、政府效能网上监督五大功能。目前大厅已进驻省级部门57个,市县部门6318个,提供电脑版和智能终端版访问服务。

随着电子政务的推进,网上办事大厅所涉及的系统规模不断扩大,数量日益增多,业务持续增长,再加上运维团队缺少了有效的管理和防护手段,平台管理和信息安全问题日渐凸现。

在国家对电子政务信息系统安全保障工作的要求以及等级化保护“坚持积极防御、综合防范”的方针指导下,急需建设一套完备的安全管理服务体系,加强运行环境监控、应用性能管理和安全防护体系的建设,从不同维度监控网办平台的可用性和性能,进而保证系统安全高效的运行,实现省网上办事大厅和政府服务的信息化、智能化。

(二) 用户反馈:

OneAPM 帮我们打造了一个五维的安全运行监控平台和体系,从发现问题,通知问题,定位问题,解决问题,到归纳问题。过去都是系统出现问题,我们被动告知,还需要花大量时间定位问题根源,并进行修复。通过这个平台我们能更加直观、主动的发现系统潜藏的问题,有效预防风险,极大的提升了运维效率,降低了管理成本,也给民众带来了更加满意的使用体验。

(三) OneAPM 解决方案:

基于 OneAPM 基础资源管理 Infrastructure Insight、应用性能管理 APM、模拟拨测 Cloud Test、实时应用安全防护 RASP 四大核心产品能力构建的一体化运维管理平台,从全面监测、准确预警、快速诊断、辅助优化,到指导评估,建立起一套完善的安全可靠运行保障体系。

全面监测,及时发现平台风险,故障主动发现率提升至85%

在 OneAPM 一体化运维管理平台上线前,整个网上办事大厅涉及的 IT 资源由8名运维工程师通过几个开源工具进行日常运维,常常是最终用户发现并反馈网办大厅系统问题之后才开始着手处理,运维工程师80%以上的时间都在“救火”。这样的运维方式既被动,又效率低下,造成用户满意度较差。OneAPM 一体化运维管理平台,提供了主动和被动两种监测手段,及时发现网办平台的运行风险。Cloud Test 是一个应用系统可用性及性能主动监测方案,通过遍布全省的访问监测点,7X24小时不间断模拟网办平台的业务访问,详尽了解网办平台业务的性能和可用性,在最终用户访问体验受影响之前提前发现系统性能问题。Infrastructure Insight 和 APM 是一个应用系统可用性及性能被动监测方案,从运行环境和用户体验两个角度,监测应用系统运行态的可用性、健康度、性能和安全性,监测指标覆盖信息中心的服务器、网络、操作系统、数据库、中间件、应用系统、浏览器和手机 APP,以及应用中所存在的各类安全攻击手段,实时监测系统性能、系统故障,以及安全攻击行为。这两种手段相辅相成,构建了一个对网办平台所有 IT 资源进行全面主动监测的日常工作环境,帮助运维工程师对系统状态做到心中有数,对突发故障做到胸有成竹。

准确预警,第一时间反馈风险至责任人,告警准确送达率88%

由于开源工具只提供服务器、网络、操作系统、数据库、中间件等基础资源的实时性能数据查看功能,缺少告警模块,运维人员无法在第一时间获得准确的系统异常信息。OneAPM 一体化运维管理平台结合网办平台等保三级以及日常管理的相关指导文件和相关规范,主动定义各类关键性能指标的最佳预警阈值,第一时间定位系统性能问题。对于一些有着时间周期特性的性能指标,通过动态基线算法自动拟合预警阈值,在减少告警配置工作量的同时,进一步提升了告警的准确度。运维管理平台提供的邮件、短信、微信等多种告警方式,快速、准确通知到相关责任人,实现被动管理到主动管理的跨越。同时,运维管理平台通过采用模拟的手段 Cloud Test,对网办平台可用性进行定期的访问和监测,确保系统能够有效运行,在出现故障时第一时间进行通知和预警。

快速诊断,精准分析定位故障根因,平均故障检测时间 MTTD 缩减到原来的四分之一

作为一个运维管理平台仅仅只提供资源的指标监控和告警是不够的。监控的范围越广,监控的指标越多,系统产生的告警也就越多,运维工程师去甄别告警真伪和根因的时间也就越长。这反而不利于故障的分析和定位。如何帮助运维工程师快速识别和精准分析故障根因,也就成为了体现运维管理平台价值的关键之一。

OneAPM 一体化运维管理平台中的 APM 产品以真实的用户体验和端到端应用性能为切入点,颠覆传统运维监控方案,实现自上而下的 IT 管理新模式。一体化运维管理平台提供了对前端浏览器、应用性能、中间件性能、数据库性能、主机性能的自动关联和分析,帮助运维工程师快速识别、定位网办平台的性能瓶颈和可用性问题。同时,运维管理平台通过自动学习能力,识别、记录业务交易的类型,业务代码类执行的效率及业务性能匹配模式,辅助运维工程师从代码类、参数到数据库语句,进行完整交易链的性能诊断和故障定位,将平均故障检测时间从原来的4小时缩减到1小时。

辅助优化,专业化问题处置建议,平均故障恢复时间MTTR缩短一半

专业化的故障处置建议是缩短平均故障恢复时间的关键。不论是服务器和操作系统的配置参数调整,网络的设置调整,中间件和数据库的配置优化,还是应用系统的代码修改,都提升网办平台处理性能的重要手段。

OneAPM 一体化运维管理平台提供了以一星期为周期的系统性能诊断和优化建议报告,通过对应用系统关键性能指标和参数的详细分析,给出量化的评估效果,并提供系统优化建议,包括应用系统代码优化、数据库性能优化、中间件性能优化、操作系统性能优化等,指导运维工程师与研发工程师快速对网办平台性能瓶颈做出响应。运维管理平台还能提供实时故障处理建议,针对告警详细信息,结合过往运维经验,提供处置方案,方便运维工程师及时对系统故障进行判断和处理。

指导评估,总结沉淀运维经验,提供决策数据支持

通过充分挖掘监控数据的可用性,OneAPM 一体化运维管理平台建立了一套多数据源、多用户视角、沉淀专家经验的运行环境分析评估体系。通过各个维度的分析报表,建立面向客户感知的、面向业务体验的、面向运行质量,围绕性能、故障、考核主题的管理分析能力。帮助运维工程师主动分析系统性能、容量,预测问题,为“决策层、管理层、执行层”人员提供决策支持。

国内 ITOM 管理平台OneAPM 致力于帮助企业用户提供全栈式的性能管理以及 IT 运维管理服务,通过一个探针就能够完成日志分析、安全防护、APM 基础组件监控、集成报警以及大数据分析等功能。想阅读更多优秀文章,请访问 OneAPM 官方技术博客

来源:http://blog.oneapm.com/casestudy/821.html

「客户成功故事」OneAPM 助力网上办事大厅构建阳光、高效、安全的政务服务平台的更多相关文章

  1. 未来科技城 x 奇点云打造「企业数据大脑」,助力1.3万家企业服务

    “当前,政府数字化和数字政府建设已成为一种趋势.一种必然,并且有了一条水到渠成式的实现路径.” 上升为国家战略的数字中国建设加速了”智慧政务“的生动实践,杭州未来科技城的「企业数据大脑」就是一个典型. ...

  2. Loj #2331. 「清华集训 2017」某位歌姬的故事

    Loj #2331. 「清华集训 2017」某位歌姬的故事 IA 是一名会唱歌的女孩子. IOI2018 就要来了,IA 决定给参赛选手们写一首歌,以表达美好的祝愿.这首歌一共有 \(n\) 个音符, ...

  3. 「编程羽录」上线,程序员必备的这些技能你能get到嘛?

    大家好,我是小羽. 好久不见,给大家带来个好消息,小羽的全新专题「编程羽录」系列正式上新,主要是介绍一些关于面试题和经验总结的文章. 会为大家提供一些技术栈之外,程序员还需要的其他方面硬核知识,做到全 ...

  4. 对于前端,「微信小程序」其实不美好

    微信小程序开放公测了,9月底我曾经写过一篇 「微信小程序」来了,其中最后一句:"谢天谢地,我居然还是个前端". 这种火爆的新事物总是令人激动,感谢这个时代. 但是,当我真作为开发者 ...

  5. 企业运营对 DevOps 的「傲慢与偏见」

    摘要:出于各种原因,并非所有人都信任 DevOps .有些人觉得 DevOps 只不过给开发者改善产品提供了一个途径而已,还有的人觉得 DevOps 是一堆悦耳的空头支票,甚至有人认为 DevOps ...

  6. [译]聊聊C#中的泛型的使用(新手勿入) Seaching TreeVIew WPF 可编辑树Ztree的使用(包括对后台数据库的增删改查) 字段和属性的区别 C# 遍历Dictionary并修改其中的Value 学习笔记——异步 程序员常说的「哈希表」是个什么鬼?

    [译]聊聊C#中的泛型的使用(新手勿入)   写在前面 今天忙里偷闲在浏览外文的时候看到一篇讲C#中泛型的使用的文章,因此加上本人的理解以及四级没过的英语水平斗胆给大伙进行了翻译,当然在翻译的过程中发 ...

  7. 「微信小程序」有哪些冲击与机会?

    昨天晚上相信大家的朋友圈被「微信小程序」刷屏了,这影响力赶上了国务院出台新政策一样,足以说明微信在中国的影响力之大. 然后今天公号后台一大堆人问我怎么看这件事,不少人非常忧虑,仿佛自己将要失业一样. ...

  8. 「雕爷学编程」Arduino动手做(15)——手指侦测心跳模块

    37款传感器和模块的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止37种的.鉴于本人手头积累了一些传感器与模块,依照实践出真知(动手试试)的理念,以学习和交流为目的,这里准备 ...

  9. 从0开始学习 GitHub 系列之「03.Git 速成」

    前面的 GitHub 系列文章介绍过,GitHub 是基于 Git 的,所以也就意味着 Git 是基础,如果你不会 Git ,那么接下来你完全继续不下去,所以今天的教程就来说说 Git ,当然关于 G ...

随机推荐

  1. Java核心技术及面试指南 2.3.6 String相关的面试题答案

    2.3.6.1 String是最基本的数据类型吗?能不能被继承? String不能被继承,它是一个对象 2.3.6.2 String s = new String("xyz");创 ...

  2. sql server 索引阐述系列四 表的B-Tree组织

    一.概述 说到B-tree组织,就是指索引,它可以提供了对数据的快速访问.索引使数据以一种特定的方式组织起来,使查询操作具有最佳性能.当数据表量变得越来越大,索引就变得十分明显,可以利用索引查找快速满 ...

  3. Android--UI之ListView

    前言 今天讲解一下Android平台下ListView控件的开发,在本篇博客中,将介绍ListView的一些常用属性.方法及事件,还会讲解ListView在开发中常用的几种方式,以及使用不通用的适配器 ...

  4. Netty源码分析(五):EventLoop

    上一篇主要介绍了一下EventLoopGroup,本篇详细看下它的成员EventLoop. 类结构 NioEventLoop继承自SingleThreadEventLoop,而SingleThread ...

  5. WinFrom Thread里面new出来的控件不显示

    那本More Effective C# 好多天没看了..惭愧. 做个小笔记吧. 今天碰到一个问题,描述如题. 何解?其实很简单,因为Thread里面new出来的控件的Parent是null,然后他就不 ...

  6. SSM框架的sql中参数注入(#和$的区别)

    <select id="findUsersByUserName2" resultType="java.util.Map" parameterType=&q ...

  7. Jquery里的特定小技巧

    jQuery 动态设置样式:                      https://blog.csdn.net/xiaoyuncc/article/details/70854925 jquery如 ...

  8. nginx 禁止未绑定的域名访问

    nginx 禁止未绑定的域名访问 方法1: server { listen 80 default_server; #不指定 server_name, server_name 默认为"&quo ...

  9. Windows server 2008 R2配置多个远程连接

    1.右键计算机属性——远程设置——出现系统属性对话框——选择“远程”选项卡,按如下图操作:. 2.默认只有administrator具有远程桌面的权限,其他用户都没有权限远程桌面连接服务器.因此,我们 ...

  10. 爬虫之re数据提取的使用

    本文将业务场景中最常用的几点实例,给大家列举出来,不常见的不再一一赘述.  使用urllib库可以模拟浏览器发送请求获得服务器返回的数据,下一步就是把有用的数据提取出来.数据分为两种形式:结构化和非结 ...