智慧矿山IT智能运维自动化解决方案
矿山企业是国民经济中的重要组成部分,其资源开发和产业链条中涉及的环节与过程非常繁琐和复杂。随着我国矿山企业规模逐年扩大,为了提高其生产效率和降低其生产成本,信息化、数字化建设成为当下矿山企业发展的重要趋势。
第1章 智慧矿山的建设背景
矿山信息化在经历自动化、数字化发展阶段后,正快步迎来智慧化时代,中国传统采矿业正在或即将面临新一代信息技术的挑战和洗礼。通过采用物联网、云计算、大数据、人工智能、自动控制、移动互联网、智能装备等技术,智慧矿山形成全面自主感知、实施高效互联、智能决策分析、动态预测预警的智能化管理体系。
2022年8月,应急管理部、国家矿山安全监察局印发的《“十四五”矿山安全生产规划》提出,实施矿山智能化发展行动计划,协同推进矿山自动化、智能化建设相关政策配套,分级分类推进矿山智能化建设,从政策端明确了加快建设自动化、信息化、智能化的矿山,促进矿山产业向“安全、绿色、高效”转型升级的整体目标。
第2章 智慧矿山IT运维的痛点
在智慧矿山建设过程中,企业投入了大量的人力、物力和财力,建设了各类应用软件和自动化系统。同时,如何确保这些业务系统始终处于最佳运行状态,并使之能够根据业务的变化进行相应的调整,逐渐成为企业高度关注的问题。各业务部门需要自动化系统来实时获取现场的生产实绩,需要一体化监控平台来实现集中调度控制,但由于缺少对IT系统、设备的有效管控,加上IT系统、设备具有复杂性、综合性及连续性等特点,传统矿山企业IT运维管理处理被动、孤立状态。
随着信息化技术的发展,传统的被动“救火”式运维已难以适应智慧矿山的IT运维环境。随着矿山IT架构和网络结构的变化,运维如何适应新技术的冲击?如何保障业务的系统正常运行,聚焦业务价值?逐渐成为智慧矿山运维的核心痛点。
运维过程中面临的具体难题如下:
- 无线网、物联网广泛应用,网络规模成倍增长,有限人力难以全面维护;
- 网络覆盖范围大,硬件设备多,维护内容广,运维总体要求更高;
- 设备种类多,厂商复杂,且跨专业设备难以统一运维;
- 发现故障后知后觉,难以定位故障根因,仍处于人工运维阶段,排障慢;
- 矿山中业务系统繁多,受限于各系统分隔和物理地域隔离,无法实现业务信息的交互和贯通;
- 不能精准确定各类异常事件对业务造成的影响程度及范围,难以从多个视角直观掌握业务运行态势;
- 混合资源的运维数据采集困难,易形成数据孤岛,难集中分析;
- 跨专业、按角色运维管理,如何实现权责划分。
第3章 智和信通智慧矿山IT运维方案
智和信通从矿山实际情况出发,结合行业特点和矿山企业特点,打造统一的IT运维监控平台,实现智慧矿山统一、集中、全面、分层次IT运维,提高运维的主动性和及时性。
方案从以下四方面实现对整体网络的实时纳管:
一是将所有IT资源可视化监控管理,帮助运维人员,快速定位故障,高效处理,提升运维效率;
二是将IT基础架构和应用进行有效量化,呈现IT建设的投资分布,直观反映基础设施的动态变化对业务造成的影响和威胁;
三是将众多的硬件设备、应用系统间不同管理工具进行资源共享,打破各种IT系统分散而孤立,形成信息孤岛的现状;
四是从内部管理和领导决策出发,呈现IT建设的投资分布,实现总部集中管理。
3.1.井上井下多网整合管理
智慧矿山建设包括工业环网、无线网络、矿用专网、视频专网、企业办公网、安全监测专网等井上井下多类型网络,在运维管理上,方案将有线网、无线网中所有网络设施均纳入智和网管平台中一站管控,避免分散管理,减少运维成本。
平台采取智能技术,实现网络拓扑可视化的能力,通过动态智能拓扑实现全网设备、资源、链接关系、IP等实时更新、快速定位。
通过按片区、按地域、按层级等多种布局方式划分网络,使用不同颜色、粗细、图标表示被管理对象的状态信息,助力运维人员实时了解网络架构及全网运行状态,快速感知资源、链路、流量等异常信息。
同时通过分级、分权管理,不同人员对不同网络和界面具备差异化权限。一线二线人员,可直观看到所在区域的核心拓扑及设备状态,管理人员可查看整体网络状态,掌控全局。
3.2.多场景视频统一监控
视频监控广泛应用于矿山井下作业场所,随着矿山智能化建设的不断深入,视频监控基本全面覆盖井下皮带机的中部、机头尾,配电点、泵房、排水点,车场的前部、中部、后部,掘进工作面的机载视频,瓦斯抽采钻场,机器人巡检设备机载视频等,以及其他需要智能识别的重要场所。
本方案支持对不同品牌、不同型号的摄像头进行统一运维,将网络高清、智能分析、多级管控融合为一体。监管视频监控体系涉及的视频前端设备(摄像头、卡口、编解码器),传输设备(光纤收发器、EPON 等)内场设备(网络与安全设备、主机/虚拟机、存储设备)、机房动力环境等多种设备,等统一接入、集中管理。并通过网络拓扑一键自动发现生成能力,直接生成视频系统可视化拓扑,通过定时轮询和事件上报进行可用性和健康度检查。
轻松对接多品牌、型号摄像头,通过onvif接口协议和智能化识别技术,实现对视频画面自动侦测、自动提取,主动监控发现和分析出摄像机设备常见的故障,如设备不连通、画面偏色、信号缺失、清晰度异常、亮度异常等问题和原因,并及时在拓扑图中显示出当前视频监控的可用情况。
3.3.下挂终端可视管理
PC、手机、PAD、摄像头、打印机、IP电话、视频会议等终端快速增长,方案通过多种发现算法,自动搜索发现交换机的下挂设备,智能识别矿山中的智能终端和物联网终端,分析其的IP、MAC、端口等信息。自动生成设备拓扑图,简化添加删除等设备操作,提升管理效率。
3.4.全网资源统一监控
本方案实现网络设备信息高频采集,并结合智能算法,实现对整体网络架构、设备运行状态、业务可用状态的实时信息采集和感知。
通过对智慧矿山网络中海量网络设备、服务器、数据库、业务系统、物联网设备、工业交换机、OLT、ONU、PLC、无线AC、AP、摄像头、应用系统、中间件、虚拟化、云、存储等智能解析和关联分析,结合全流量采集分析能力,形成整个网络通信链路的多端网络流量分析链,助力运维人员从多个维度实现对相应告警的智能分析,解决传统运维监控中关联数据缺失,辅助排障信息不足的问题。
3.5.云上云下资源统一监控
方案对复杂的多云异构环境、云上云下资源、信创云等进行全面管理,实现云下服务器、网络设备、安全设备、机房、机柜、专线、配件等设施,云上各类云服务器、云磁盘等云产品以及各类 IP、NAT、DNS 等资源的真正一站式运维,并支持对纳管资源的快速扩展。自动监测基础设施及资源,其中包括云、混合云、容器、虚拟主机、网络、服务器、存储等。对进程、资源利用率、网络使用量、性能、日志、事件进行全面监测。
3.6.端到端全链路可视化
矿山井上、井下光纤链路问题频发,交换机收光异常,导致链路不稳定或部分丢包情况,造成网络异常却难以定位。
方案通过对交换机光口和网络接口的监控,通过数据采集分析,实现对网络流量和关键连接的预测性维护,从整体维度到局部维度全面展示智慧矿山企业网络内IT设备间链路各项指标,整体可观测、可告警、可分析、可统计。通过实时监控各个端口以及每条线路的通断情况和性能指标,结合专业的流量监控分析能力,对链路容量进行即时监控,并生成流量分析报告,为容量规划提供依据。
3.7.设备、策略模型无限扩展
方案采取用户自定义设备类型及其设备资源的方式,赋予用户自定义适配设备的能力,最大可能地支持对不同设备类型的支持。通过自定义设备类型及其设备资源,最大限度上提高了智和网管平台的管理范围,真正实现了对设备及其资源的全面化管理,达到管控万物的目标。
3.8.实时故障预警
方案通过统一的故障管理平台,将各个模块中的监控信息统一采集、分析,实现整个智慧矿山企业网络中各种事件信息、设备故障、网络异常、流量异常等告警,以智能化手段进行标准化的分析、压缩、并归关联等,通过多种方式实时传达告警信息,保证落实到指定人员进行处理,为智慧矿山企业提供主动式的故障解决方案。
全面采集智慧矿山企业内所有联网设备,如存储、服务器、路由器、工业交换机、安全设备、虚拟化、云、OLT、ONU、PLC、无线ACAP等设备、资源、应用、服务等状态信息,通过对告警机制以及阈值的设置,第一时间获取准确的告警信息,快速定位告警设备,提升告警处理效率,降低因设备故障带来的损失。
3.9.异常事件管理
将事件和告警分离管理,接收设备/服务器主动发送的消息,集中处理后,及时地通知用户,并可以通过集中的管理界面进行管理,极大地提高了管理的主动性,通过统一界面集中管理事件,降低了管理的难度。
3.10.跨地域自动巡检
传统的人工巡检,尤其是应用巡检,缺乏统一的规范、标准,导致巡检的范围和深度都存在一定的局限性,并且是基于人工的手工统计,工作效率比较低,同时耗费较大的人力资源。本方案依托平台将以前依赖手工进行的日常巡检转换为自动化、定时执行的巡检策略,日常例行巡检、节假日和重要事件前的巡检均可自动化执行。
通过制定统一的巡检指标、巡检方式、巡检频度等,保证巡检标准化、巡检范围、巡检深度;通过设计巡检作业、数据采集方式、自动化作业调度等实现日常巡检的自动化,代替手工工作,提高效率的同时,解放管理人员,释放管理人员更多的精力,使更多的精力处理更重要的事项。
3.11.全网IP合规监控
对于智慧矿山企业的网络IP资产,采取统一数据标准,对整体网络中的IP和MAC进行梳理和管理,建立健全IP资产台账,端到端规划、部署、管理和监控IP 地址。通过智能IP扫描能力,定义多层次子网,然后扫描其范围内每个IP地址的当前状态,包括IP地址,MAC地址等信息,也可以查看IP段内地址使用详情,便于IP地址分配管理等。
方案支持通过追踪IP地址的历史关联MAC、接入设备/端口变更记录等与规划绑定MAC、规划接入设备/端口进行对比分析,当与规划不一致时生成一条异常记录,从而审核IP/MAC是否正确使用。
3.12.端到端业务运维
智慧矿山中存在生产安全调度系统、应急保障系统、环保健康系统、移动互联系统等业务,业务信息系统涉及面广、复杂度高。本方案以保障业务可用性为基础,通过对承载业务的IT基础设施构建真实的业务模型,满足监控点对点、点对多点、多点对多点的业务承载模型监控需求。
方案通过构建业务系统与部门、IT资源及关键指标的关联关系,整合前端、应用、后台任务、外部服务、数据库及基础设施,直观呈现面向服务的业务系统体系架构;通过影响传递,准确反映设备异常对核心业务、用户造成的影响和威胁,并对造成业务影响的故障进行实时告警,快速查明导致业务中断的故障源,帮助运维人员做出及时响应,保障业务连续性。
直观、便捷地帮助运维人员对智慧矿山内的办公系统、安全监控系统、矿井通信系统、应急救援通信系统、视频监控系统、井下调度无线通信系统等进行监控,掌握业务的运行状态和健康水平,了解业务动态变化趋势,快速定位故障源,降低运营风险。
3.13.全网带宽、流量监控
随着智慧矿山企业信息化建设的加速,其业务、应用层出不穷,对网络带宽的需求越来越高。正常的业务需要良好的带宽环境保障机制,避免被一些与业务无关的杂事干扰,影响工作效率。方案基于海量流量数据的存储挖掘,实现对网络流量的侦测分析。
通过网络流量分析技术,采集、分析、存储所有网络流量,回溯分析数据包特征、异常网络行为,以多维数据分析和深度挖掘为手段,实现数据包层面的流量追踪,发现潜伏于网络中的未知攻击。
提供设备、接口、IP、服务、应用、会话等层级的带宽监控,实时监控带宽使用趋势与带宽占用分布,并通过图表展示,快速识别网络带宽滥用,分析高带宽使用情况,识别带宽消耗较大的应用程序、服务、协议或IP 地址,避免网络容量过载,并提升最终用户网络体验。
3.14.人工运维与故障自愈结合
将人工运维与故障自愈结合,无需针对告警进行手动处置,只需预编排告警处理流程,平台根据场景自动触发,实现故障自愈。
通过实时发现告警,进行预诊断分析,判断告警类型和级别,如果是一般告警,平台进行自动恢复,如果是严重复杂告警则通过告警通知、运维工单等形式通知运维管理人员,进行人工处理。同时,将只能由专家处理的各类操作和判断转化为可存在于平台内的流程,形成可保留可复用的运维知识。
3.15.全场景自动化运维方案
网络承载的业务经常发生变更,面对业务的变更运维工程师往往要对大量设备进行操作,此时如果依靠工程师逐一登录设备进行命令下发、策略配置,将产生大量重复性的工作,不但导致运维效率低下,也不可避免地产生人为配置错误。
通过智和信通全场景自动化运维方案纳入监控的设备进行单独、批量的配置操作,设备策略远程配置管理,可以自动批量进行设备配置修改,并可对设备配置进行备份、对比、恢复,宕机后设备配置可快速复原,保障设备及时恢复运行,全面提升配置效率、质量和安全性。
3.16.运维大数据分析方案
矿山中硬件设备及各业务系统产生的海量数据无法得到深层次的应用,管理者决策缺乏数据依据,难以参考矿山各类业务指标、数据等实现对运行态势、隐患风险的实时掌控及运营管理。
为解决此难题,智和信通智慧矿山监控运维方案利用图形、图表、图表等易于理解的形式,提取和分析大量复杂的各类运维数据,呈现分析结果,将全域资源融合展示。从而帮助运维人员在短时间内更好地理解和获得更多的信息,帮助运维中心能够实时了解业务和其所依赖IT资源的运行状况,以及提供系统运维和优化的指示和依据。
3.17.IT资产生命周期监管
对于资产管理,采取统一数据标准,对整体网络资产进行梳理和调用,避免资产信息在运维系统和实物间的差异,减少网络运维过程中信息不一致、数据不统一等问题通过平台将资产实物与运维数据库一一对应,解决网络设备在日常运维过程中出现“脱管”或“半脱管”的问题。
建立健全资产台账,实现一机一档,通过自定义多级资产分类,细化资产类别,实现资产分类管控,提高资产精细管理程度。从资产入库、领用、变更、维修、调拨、到报废处置,资产每一步操作均实现完整记录,支持追溯,通过平台实现资产整个生命周期的全流程闭环管理,使得IT资产每一次生命周期变更,都有流程可依、都有迹可循,从而实现全面的IT资产监管。
3.18.可量化运维工单体系
通过方案实现运维工单“无纸化”,支持于设备和故障管理页面快速创建工单,把控故障处理进度,通过工单平台简化故障处理流程,形成自动化故障处理机制,并在每个处理流程的节点上责任到人,实现在快速响应故障的同时,实现兼顾运维流程管控。
通过建立工单服务基准,预设工单在不同优先级、不同状态时,受理人应该响应的时间及未响应时的处理方式,生成工单自动化处理规则,并以多种方式进行通知,避免超时响应提升全流程服务管理质量。
第4章 方案应用价值
近年来,政府机构十分重视采矿行业数字化建设,明确提出加快建设自动化、信息化、智能化的矿山,促进矿山产业向“安全、绿色、高效”转型升级。北京智和信通智慧矿山运维监控方案基于矿山行业特色,从“监、管、控、析、安”五大方面进行矿山综合运维管理,解决被动式、事后响应的故障风险监测,通过编排能力,将多数靠经验判断的风险、解决的问题固化到平台上,实现运维知识的积累和再利用。
通过智和信通智和矿山运维监控方案,实现井上、井下多网、多设备集中管理,主力矿山企业从原始矿山、人力矿山、机械矿山向绿色矿山、智能矿山、智慧矿山迈进。
第5章 标杆案例
至今,智和信通已成功在诸多能源化工企业进行部署与实施。通过“智和网管平台”实现智能化集中运维管理,对全部IT基础设施进行跨区域、跨平台、跨设备远程集中管控,真正实现远程集中管控,有效提升管理效率。
以下为部分项目案例。
标杆运维项目 |
||
中海油 |
秦皇岛输油气分公司 |
同煤电业 |
四川凉山水洛河电力开发有限公司 |
中国石油管道局工程有限公司 |
国家能源集团乌海能源公司 |
中冶南方(黄石)气体公司 |
西气东输东部管道公司 |
惠州华润燃气 |
皖北煤电-恒源煤矿 |
皖北煤电-五沟矿 |
湖北西塞山发电有限公司 |
山东垦利石化 |
清水河水厂 |
玉林市水利电业有限公司 |
马钢罗和矿业 |
国投钦州发电有限公司 |
上虞水处理工厂 |
河北冀衡化学股份 |
天荒坪电站 |
上海电力可再生能源中心 |
内蒙古永和氟化公司 |
淮南平圩第三发电公司 |
更多…… |
智慧矿山IT智能运维自动化解决方案的更多相关文章
- 智和网管平台国产化AIOps智能运维 建立自主可控网络安全体系
没有网络安全就没有国家安全,中国作为一个崛起中的大国,网络安全至关重要.新一届中央高度重视信息安全自主可控的发展,Gartner研究报告表明,2019年中国三分之二的数据中心.IT基础设施支出流向中国 ...
- 国产安全自主可控IT智能运维管理解决方案
新一轮科技革命和产业变革席卷全球,大数据.云计算.物联网.人工智能.区块链等新技术不断涌现,数字经济正深刻地改变着人类的生产和生活方式,作为经济增长新动能的作用日益凸显.伴随增长的,还有网络中不断涌现 ...
- 阿里智能运维实践|阿里巴巴DevOps实践指南
编者按:本文源自阿里云云效团队出品的<阿里巴巴DevOps实践指南>,扫描上方二维码或前往:https://developer.aliyun.com/topic/devops,下载完整版电 ...
- 运维自动化之SALTSTACK简单入门
运维自动化之SaltStack简单入门 饱食终日而无所事事,是颓也,废也.但看昨日,费九牛二虎之力除一BUG便流连于新番之中,不知东方之既黑,实乃颓颓然而荒废矣.故今日来缀一文以忏昨日之悔. Salt ...
- 织云 Metis:看腾讯怎么做智能运维
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 作为企业智能运维门户,业界早已关注织云的智能运维体系.我们很荣幸地宣布织云 Metis 智能运维体系正式发布.自此,织云家族已发布:织云企业 ...
- 数栈运维实例:Oracle数据库运维场景下,智能运维如何落地生根?
从马车到汽车是为了提升运输效率,而随着时代的发展,如今我们又希望用自动驾驶把驾驶员从开车这项体力劳动中解放出来,增加运行效率,同时也可减少交通事故发生率,这也是企业对于智能运维的诉求. 从人工运维到自 ...
- 魅族CMDB运维自动化实践
一.简介 原创:梁鹏 本文是根据魅族系统架构师梁鹏10月20日在msup携手魅族.Flyme.百度云主办的第十三期魅族技术开放日< 魅族CMDB运维自动化实践>演讲中的分享内容整理而成. ...
- 管正雄:基于预训练模型、智能运维的QA生成算法落地
分享嘉宾:管正雄 阿里云 高级算法工程师 出品平台:DataFunTalk 导读:面对海量的用户问题,有限的支持人员该如何高效服务好用户?智能QA生成模型给业务带来的提效以及如何高效地构建算法服务,为 ...
- CentOS 下运维自动化 Shell 脚本之 expect
CentOS 下运维自动化 Shell脚本之expect 一.预备知识: 1.在 Terminal 中反斜杠,即 "" 代表转义符,或称逃脱符.("echo -e与pri ...
- Ansible 运维自动化 ( 配置管理工具 )
背景 出差背景,要搞项目的自动化部署.因为只直接对接生产分发,机器又非常多,这样以往使用的bat只能作为应急方案了,还是得考虑使用专业化的工具来做这个事情! 当下有许多的运维自动化工具( 配置管理 ) ...
随机推荐
- 我用Awesome-Graphs看论文:解读GraphBolt
GraphBolt论文:<GraphBolt: Dependency-Driven Synchronous Processing of Streaming Graphs> 前面通过文章&l ...
- 【OracleDB】 10 数据处理 DML
DML(Data Manipulation Language – 数据操纵语言) - 向表中插入数据 - 修改现存数据 - 删除现存数据 [事务是由完成若干项工作的DML语句组成的] INSERT 语 ...
- 大语言模型(LLM)运行报错:module ‘streamlit‘ has no attribute ‘chat_message‘
参考: https://blog.csdn.net/weixin_45748921/article/details/134645308 问题在于版本不匹配,深究一下为什么各个版本软件不匹配,发现原因是 ...
- rllab —— 强化学习 算法模块库 (环境配置失败!!!) (已经不进行维护更新,已被淘汰,由于一些老旧代码还有可能关联因此fork了下,复制了份原始项目)
代码地址: https://gitee.com/devilmaycry812839668/rllab 由于官方代码地址在github上,外网偶尔会出现网络连接中断的问题因此在国内代码库中fork了一个 ...
- blender-点线面操作
- [学习笔记] 丢番图方程 & 同余 & 逆元 - 数论
首先,他们几个有着极大的相似性.另外,他们的各自的思想都能够很好的服务于另外几个,有助于加深理解. 文中有些letax公式抽风了,全屏之后应该能看得见-- 线性丢番图方程 丢番图不是个图啊!他是个ma ...
- 18-canvas绘制饼状图
1 <!DOCTYPE html> 2 <html lang="en"> 3 <head> 4 <meta charset="U ...
- SMU Spring 2023 Contest Round 2(待补
M. Different Billing #include <map> #include <set> #include <cmath> #include <q ...
- 【CMake系列】10-cmake测试 ctest
cmake作为一个强大的构建系统指导工具,同时也提供了测试功能,可用于项目的单元测试等,也可以与其他测试框架协作,如googletest,共同完成项目开发中的测试工作,本节我们就来学习 如何借助cma ...
- 折腾 Quickwit,Rust 编写的分布式搜索引擎 - 可观测性之日志管理
Quickwit 从底层构建,旨在 高效地索引非结构化数据,并在云存储上轻松搜索这些数据. 此外,Quickwit 开箱即支持 OpenTelemetry gRPC 和 HTTP(仅 protobuf ...