FinTech领域实践:乐维监控助力西南某上市城商行IT运维转型升级!

项目背景

随着信息化的逐步深入,企业业务运营活动对IT的依赖程度越来越高,传统的局部、粗放、碎片化的IT运维管理模式已经无法满足安全生产的实际需要,IT运维必须向自动化、全面化、流程化模式转变,构建一站式监控平台,则成为企业 IT 架构升级、自动化转型的战略刚需。

相对其他行业来说,银行行业因为网络环境、系统软件复杂,资源整合程度高,系统数据安全级别高,权限管理复杂等原因,对技术的可靠性、稳定性和成熟性有着更高的要求。

客户简介

某银行是一家以国有股本为主、股权多元化的地方性股份制商业银行,引入马来西亚某银行作为境外战略投资合作伙伴。在上海证券交易所挂牌上市,成为某省首家上市银行、全国第8家A股上市城市商业银行。该银行致力于为广大小微企业客户提供优质高效的金融服务,利用自身优势,加强产品创新和“本土化”改造,开发了一批“特色化、标准化、本土化”产品。目前,旗下“财富金翼”小微企业融资品牌包括“壮大贷”、“成长贷”、“科创贷”、“科票通”、“创业贷”、“惠农贷”、“易采贷”等10余种产品,为不同发展阶段的小微企业融资提供多种金融方案以及一站式金融服务,不遗余力支持企业成长发展。

项目背景

该银行信息化建设蓬勃开展,IT规模逐年扩大,相应的故障次数也逐年增加。而在采用有效的管理方式之前,管理相关部门仍然采用传统的、分散、不统一的手工管理方式,且无专业团队对现有IT系统软硬件进行统一管理维护,建设、运行、支撑职责不分,缺乏有效的管理和运行监视手段,缺乏有效的针对设备/设施的资产管理。系统配套的管理手段的创建已经落后于相关建设的步伐,这样就造成了管理模式跟不上系统建设的工作矛盾。

该银行现有的生产监控系统于2011年开发完成,主要是基于IBM商业产品Tivoli,已使用7年时间。需在其基础上衍生基础设施纳控、集中告警、巡检报表等。为解决此问题,需对基础监控平台系统进行升级改造。一方面可以解决目前该银行监控系统存在的问题,另一方面也可以提高运维工作效率,降低运行风险。

解决方案

乐维监控结合该银行发展的现状及发展需求,在进行需求的前期调研和现场调研后,针对性的制定设计了一套完整的实施方案,帮助其构建一个安全、实用、可持续发展的智能监控管理平台。

通过改造,对银行所有软硬件设备进行管理,综合展现运维管理数据和相关统计信息,以一个综合展现平台的方式展现所有关键管理数据,通过灵活的告警设备,精确的告警检测,多样的告警推送方式,简单的告警经验积累方式,实现用户有效及时得到故障信息。提供快速故障定位,故障分析,最终实现IT运维管理要求:

1.基础监控平台需完成生产系统服务器、操作系统、数据库、中间件、存储、网络设备等的实时监控,确保能够在故障发生时提供及时的告警和操作;

2.需有比较美观的展示界面和人性化的UI,能清晰方便的反映出企业纳控的IT资产运行状态及相关信息;

3.在完成对各项基础监控项的同时,需定制开发针对银行的特殊要求,监控项之间能配置关联关系,并能够生成性能分析和故障报告;

4.基础监控平台需将告警信息接入统一展示界面(与现有系统接入方式保持一致)。

5.需具备智能巡检功能,设置巡检周期,自动生成巡检报表,对重点关注指标进行检查并汇总发至指定人员邮箱,以供分析决策。

实施过程

针对该银行所面临的问题,乐维监控基于开源Zabbix(最新版本4.0)深度二次开发,利用开源技术及自身产品的高可用、可伸缩、易维护等特性,对银行的IT资产进行了梳理纳控,建设优化的处理。

产品逻辑图谱

 

对象统一纳控,集中管理

1、主机监控:RedHat、Windows、AIX、HMC

  • 针对监控AIX小机LPAR信息、JFS文件系统、errpt日志信息、LVM信息和Linux不一样
  • AIX的HMC数据资源的管理
  • 防火墙状态和应用服务监控

2、网络设备监控:Cisco、H3C、华为、F5、迈普、山石、深信服

  • F5的层级划分、主备状态、配置同步、活跃连接数、pool
  • SDN-spine、SDN-leaf监控
  • 网络设备的syslog日志对接
  • 网络设备日常巡检相关报表展示
  • 链路探测的不同方式(NQA、SQA),登录交互探测

3、虚拟化监控:VMWARE

  • 监控Clusters、Datacenters、Datastores、Hypervisors、VM
  • vCenter平台告警对接
  • Clusters、Datacenters、Datastores、Hypervisors、VM资源相互关联状态
  • 模块与监控平台集成
  • 消息与队列处理,对接

4、数据库监控:Oracle、DB2、Mysql、Redis

  • SQL排名-时间
  • redo log
  • 数据库dataguard状态、日志同步情况

5、中间件监控:Weblogic、Tomcat、Nginx、RabbitMQ、ZooKeeper、WebSphere

  • 接口对接
  • 控制台数据采集
  • 最大连接数、当前连接数
  • 健康状态
  • 线程池状态
  • server状态

6、存储监控:EMC VNX、EMC VMAX、Netapp

  • 需采用专门的存储工具,连接查询数据

7、安全设备监控

  • 电子银行WEB应用防火墙
  • 电子银行IPS

标签化管理,对象分组,权限配置,为数据安全保驾护航

  1. 支持标签化管理,方便对海量用户信息进行搜索、分类、整理记录。
  2. 对象分组,可进行分类、排序、检索、批量删除。
  3. 用户管理,支持登录名、手机、微信、密码、角色、有效期及是否能登录Zabbix等管理功能,支持对用户的角色授权的功能。
  4. 权限配置,统计报表、首页、告警、监控对象等各个功能权限设置,可按照管理员级别进行分类设置。

 

 

秒级智能告警平台,内置知识库,使运维有迹可循

  • 自定义告警策略(告警分级、收敛),故障快照,动态基线,快速对接微信客户端、邮件、短信等多种工具,结合专家智库对故障高效处理,保障业务系统长期平稳运行。
  • 告警关联专家智库,运维人员将故障处理方式记录到专家智库,这些信息将通过算法自动匹配到告警列表,为运维人员下次处理类似告警提供参考依据,支持对专家智库信息进行点赞和点踩,专家智库的匹配算法会根据用户点赞和点踩的行为进行智能匹配告警。

智能运维巡检报表,定时邮件发送

  • 支持自定义设置巡检周期、时间点对重点关注指标(包括但不限于CPU使用率、内存使用率、接口接收流量、借口发送流量、风扇转速、机房温度、机房备电灯等)展开日常巡检工作, 生成报表汇总发至指定人员邮箱,节约运维工程师人工巡检时间,提升运维效率。

 

 

 

终端UI界面全新升级,灵活切换主题皮肤

  • 结合客户VI,对界面整体改良升级,并制定出标准版和暗黑版两款个性化皮肤,供自行选择切换,适用大多数应用场景,满足客户需求定制。

标准版&暗黑版

 

客户收益

  1. 通过IT资产全面梳理、全栈监控、实时告警等新型智能运维手段,建设出一套完善且灵活的成熟运维体系,告别传统“救火”式运维,运维效率提升10倍,企业运维成本降低超过50%。
  2. 从项目、用户、角色等多个维度实施权限配置管理,为系统安全性和保密性提供保障。
  3. 高可用的技术架构和灵活的调度能力,可覆盖并应用于绝大多数业务场景,持续赋能。
  4. 智能高效的运维管理体系,帮助客户从IT管理的层面加快自动化进程。

本文《FinTech领域实践:乐维监控助力西南某上市城商行IT运维转型升级!》首发于乐维官网

FinTech领域实践:乐维监控助力西南某上市城商行IT运维转型升级!的更多相关文章

  1. 《开源安全运维平台OSSIM最佳实践》

    <开源安全运维平台OSSIM最佳实践> 经多年潜心研究开源技术,历时三年创作的<开源安全运维平台OSSIM最佳实践>一书即将出版.该书用80多万字记录了,作者10多年的IT行业 ...

  2. 基于 ANSIBLE 自动化运维实践

    摘要:运维这个话题很痛苦,你做任何的产品都离不开运维.不管你用什么语言.什么平台.什么技术,真正能够决定你产品成熟度的很有可能就是你运维的能力.取自 云巴 CEO 张虎在 ECUG 大会上的分享. 云 ...

  3. 博云 x 某农商行 | 银行信息化运维系统升级的最佳实践

    随着银行新一代信息化运维系统建设的推进,应用系统更新换代速度明显提升.数字化转型的发展对银行业务需求的敏捷性提出了越来越高的要求,促进敏捷开发和资源敏捷部署成为大势所趋. 背景 江苏某农村商业银行成立 ...

  4. python为运维人员打造一个监控脚本

    0x00前言: 一直想写一个监控方面的脚本,然后想到了运维这方面的 后来就写了个脚本. 0x001准备: psutil模块 0x02正文: import os import time import r ...

  5. 基于Prometheus和Grafana的监控平台 - 运维告警

    通过前面几篇文章我们搭建好了监控环境并且监控了服务器.数据库.应用,运维人员可以实时了解当前被监控对象的运行情况,但是他们不可能时时坐在电脑边上盯着DashBoard,这就需要一个告警功能,当服务器或 ...

  6. 重磅发布丨乐维监控:全面兼容云平台,助力企业DevOps转型升级!

    2019年伊始,我们迎来了乐维监控的又一重大功能更新——云平台监控,这将有效帮助企业将云上.云下数据聚合,方便统一化的监控管理与维护!未来,乐维监控每一次的产品功能及版本更新,我们都将第一时间于此发布 ...

  7. 运维开发实践——基于Sentry搭建错误日志监控系统

    错误日志监控也可称为业务逻辑监控, 旨在对业务系统运行过程中产生的错误日志进行收集归纳和监控告警.似乎有那么点曾相识?没错... 就是提到的“APM应用性能监控”.但它又与APM不同,APM系统主要注 ...

  8. 京东云数据库 RDS助力企业便捷运维

    iPhone6发布那年,京东在国贸等商圈送货最快速度数分钟,包括从下单到送达.这是一个极端的富含营销因素例子.即便如此,常态来看,隔天到货的这种业务模式,也是基于同样的支撑:营销业务.物流业务,大数据 ...

  9. 阿里智能运维实践|阿里巴巴DevOps实践指南

    编者按:本文源自阿里云云效团队出品的<阿里巴巴DevOps实践指南>,扫描上方二维码或前往:https://developer.aliyun.com/topic/devops,下载完整版电 ...

随机推荐

  1. BZOJ4517:[SDOI2016]排列计数(组合数学,错排公式)

    Description 求有多少种长度为 n 的序列 A,满足以下条件: 1 ~ n 这 n 个数在序列中各出现了一次 若第 i 个数 A[i] 的值为 i,则称 i 是稳定的.序列恰好有 m 个数是 ...

  2. HBase学习之路 (五)MapReduce操作Hbase

    MapReduce从HDFS读取数据存储到HBase中 现有HDFS中有一个student.txt文件,格式如下 95002,刘晨,女,19,IS 95017,王风娟,女,18,IS 95018,王一 ...

  3. 理解JavaScript继承(三)

    理解JavaScript继承(三) 通过把父对象的属性,全部拷贝给子对象,也能实现继承. 7.浅拷贝 function extendCopy(p) { var o = {}; for (var pro ...

  4. 多线程之并发容器ConcurrentHashMap(JDK1.6)

    简介 ConcurrentHashMap 是 util.concurrent 包的重要成员.本文将结合 Java 内存模型,分析 JDK 源代码,探索 ConcurrentHashMap 高并发的具体 ...

  5. [转]DirectX and .NET[英]

    With the DirectX SDK (June 2010) release and the addition of support for Visual Studio 2010, I’ve be ...

  6. 包学会之浅入浅出Vue.js:结业篇

    在第一篇<包学会之浅入浅出Vue.js:开学篇>和上一篇<包学会之浅入浅出Vue.js:升学篇>的学习中,我们首先了解了Vue环境的搭建以及两个重要思想——路由和组件的学习,通 ...

  7. 苹果电脑(Mac mini或Macbook或iMac)恢复出厂设置

    苹果电脑(Mac mini或Macbook或iMac)恢复出厂设置,首先要做好如下的准备: 第一:数据的备份:第二:保证正常的wifi连接:第三:有线的鼠标键盘连接: 具体恢复操作步骤: 步骤一:电脑 ...

  8. C++程序设计入门 之常量学习

    常量: 常量的定义格式:const datatype CONSTANTNAME = VALUE 常量的命名规范:符号常量(包括枚举值)必须全部大写并用下划线分隔单词 例如:MAX_ITERATIONS ...

  9. 使用C语言给php写扩展

    1.在php源码路径的ext文件夹下,新建一个extend_test.def文件,编辑文件内容为 string my_test_function(string str,int n) 2.在当前目录执行 ...

  10. sqli-labs学习(less-1-less-4)

    学习sqli-labs之前先介绍一些函数,以便于下面的payload看的懂 group_concat函数 将查询出来的多个结果连接成一个字符串结果,用于在一个回显显示多个结果 同理的还有 concat ...