为什么设备智能运维越来越重要?未来企业的必备特征
为什么设备智能运维越来越重要?未来企业的必备特征
智能运维与用户场景结合前先了解下:
智能运维是什么?
智能运维是通过数据采集、识别、分析技术对传统运维的一种升级和进化。智能运维能够实现业务系统的自动化故障智能检测,自动判断设备在运营过程中存在哪些隐患、及对发生的故障及时发出警告,从而能够辅助运维管理者进行消患、故障根因判断和处理。创建一个无忧化的运维环境。
为什么智能运维越来越受到管理者重视?
智能运维能解决资源优化和服务升级问题。首先,由于业务系统的架构越来越复杂,设备运营规模越来越大,如何把设备运行中产生的海量数据存储下来,经过智能分析并以报表的形式展现出来,从而为管理者提供决策,这是传统的运维平台很难解决的。
其次,运维管理者希望通过故障智能预测的手段来发现运行设备存在的隐患及时制定维修策略来减少故障发生概率,传统运维虽有事后故障告警的能力,但不具备故障预测预警功能,同时传统运维需要运维人员具备定位、处理问题的能力。如何能够帮助运维人员进行问题诊断减少误判的概率,这个是希望在智能运维系统中去解决。在人力经验、财力和精力都无法满足的情况下我们希望智能运维系统能够自我诊断,从服务过去的运维数据中自动识别故障特征及处理故障的解决方案,从而能够更准确快速的识别、诊断、处理故障。所以,今天的运维管理人员更需要智能化的运维来帮助他们降低运维压力,提升服务质量。
怎么样的智能运维更贴近用户场景?
我们需要建立以资产设备为核心,服务为中心,数据为基础,标准化管理体系为手段,结合图像识别、大数据技术的智能运维平台更能贴近用户。
首先,智能运维有以下几个特点:
打通各系统(工业自动化系统和信息系统)数据环节,使自动化和信息化深度融合。将工业设备运行特有格式的数据、原始日志、图片、多媒体文件等非结构化数据转化成可识别的结构化数据或时间序列数据。
通过信息化手段(CMDB技术)建立设备模型与数据的映射关系,做到数据与设备联动,设备与管理联动,实现设备自动检测到故障工单触发和处理,完成一整套闭环流程。利用大数据分析技术解决人工的阈值设定、提高故障预判预警能力。通过对数据的聚合能及时有效的为管理者提供决策意见。
1、设备设施全寿命周期管理体系
在设备结构树的支持下,以单体设备、设备部位为主要数据管理对象,建立动态的设备资产基础信息管理体系:自动集成有关一台设备的运行、变动、维修、保养、报废等全程管理数据记录,形成包含动态数据在内的完整设备管理档案;建立设备管理KPI 评价体系,并通过设备资产周期费用的采集与分析,定量地评价和分析设备资产的经济价值表现、运行性能、管理工作质量和工作效率等。
2、设备设施智能巡检管理体系
智能巡检管理是对变电设备的运行状态进行动态巡测和智能分析,实现无人值守和安全智能管控。通过对设备运行状态、环境、安防等进行全面巡测,通过设备运行的可测、可视、可控,实现综合状态管理。
3、设施设备故障管理体系
建立以点检和故障分析为重点的设备运行预警体系:通过故障库的建立,记录、统计和分析单台设备或同一类设备相同故障部位的故障,对故障发生趋势进行分析;对点检实行分级受控管理,并通过运行记录、停机记录、点检、完好检查、定期检查、故障记录、事故记录、状态监测等的管理;记录设备以往的状况并准确监控设备的当前运行状况;通过数据的动态计算,分析设备运行的可靠性与经济性,为制定合理的设备维修与维护策略,提供量化依据。
建立完整的故障管理体系。通过对不同设备类型的所有可能发生的故障情况的归纳汇总,统一故障代码体系。在同一个体系中,包括:故障现象,该种现象所有可能的发生原因,以及任何一种故障原因可能存在的解决措施。使得运行维护人员在汇报事故、故障的时候使用统一标准的术语或代码,不至于造成混淆,也利于提高故障历史数据分析的质量,帮助提高设备的可靠性。
4、责任分级管理体系
维修分级管理:日常维修(中小修)及预防性维修按照现有管理方式分级管理,设备大修、同步检修和技术改造等,由设备运行维护管理部门统一管理,在系统中明确定义维修的类型和该类型的归口管理部门与责任人。
5、工作管理体系
建立高效率的工作调度监控平台,为管理流程持续优化提供技术途径。
设备运维管理系统利用工作流程设置,根据已经定义的管理流程和管理职责,形成系统的工作任务列表。根据工作人员的权限定义,生成工作人员的待办任务,并通过系统调度台提醒,以及通过移动APP通知待办任务主体。
通过管理优化设备档案、运维计划及预案的实施、限时工作管理与标准信息库的建立,形成知识管理体系,强化基础管理、深化技术管理、提高运行维护管理的整体水平。
6、内部服务管理体系
设备智能运维管理系统是一个庞大的复杂系统,它的有效运行需要有科学的管理体系。为实现高效率、高质量的运行维护,需要建立一套符合规范化的、适合供电分公司的技术运行维护的管理体系,为设备和维护管理提供保障。
这种技术运行维护管理体系的建立是:基于人才的培养、技术的积累、以及规范的制度、标准的工作流程等方面来实现,并通过业务系统的日常运行维护和管理等常规工作来发挥作用。
7、修维护管理体系
建立以预防维修为主导的多元化维修维护管理体系:建立维修标准项目库,实现故障维修BM、定期维修PM、状态维修CBM、设备大修、零部件更换和紧急抢修的一体化的优化管理;按维修项目的优先级别排列人力资源,结合供电分公司生产进程计划,给出维修任务的时间规划,结合人力资源自动匹配维修项目,并计算分析各维修项目需要的备件及其备件补库计划、紧急采购计划、资金费用计划、维修工具计划等,实现维修资源的最优化利用。
8、备件管理体系
通过管理库存备件,建立设备最小维修备件清单,并对库存进行分析和优化,制定合理的安全库存,从而降低库存成本和提高库存准确率。及时、合理的备件供应及管理,是在故障停机情况下,决定停机时间长短的重要因素。因而,将备件管理和维修工作统一考虑,并可通过相应的数学模型公式对历史消耗数据进行分析,提出一个安全、经济的备件库存建议,在能及时准确地保证故障维修供应的前提下,尽可能降低库存量。
9、KPI绩效考核体系
为建设供电分公司的各项成本和分析指标体系提供最为基础的运行数据,实现系统数据的多维度统计分析,实现跨系统关联数据的统计分析,运用特定的标准和指标,采取科学的方法,对承担生产经营过程及结果的各级管理人员,针对完成指定任务的工作实绩和由此带来的诸多效果,做出价值的判断,逐步能够构建出整体业务决策分析体系。
在设备和维修管理各业务环节,会产生一些历史数据,对这些数据按照事先定义的规则进行统计分析,得出一些关键指标:
如设备故障统计、设备完好率、PM工作达成率、工单准时完成率等;单套装置维修成本、开工率等。
建立人员工作的绩效管理体系,分类统计工时(人工工时、年度总工时、维修工时、维护工时、返修故障工时等);管理人员成本和定额。通过这些数据,帮助进行业务流程优化、组织优化及技术提升。
10、专家分析体系
通过对供电设备的遥信、遥测(电压、电流和负荷曲线等),根据供电设备管理原则制定阈值、报警值,从而提示运维策略。
11、试验数据管理体系
分类建立的各类设备设施试验数据库,建立基于设备试验数据和设备运行缺陷上的科学“设备定级”体系。
智能运维不是单靠一个现有的系统或工具能实现的,需根据客户的需求对涉及的设备采集不同维度的数据,根据业务场景制定工作流程进行规范化管理,通过大数据技术对业务数据的分析为决策者提供支持。
智能运维与不同行业的业务场景深度结合,创造出适合于不同行业的运维方式来实现真正无忧环境。例如与机器人结合来实现无人值守自动点巡检、与大数据技术结合能让系统自动理解故障趋势和模式,通过历史数据去分析、学习提供高效快速的运维路径等这些技术手段能够加速无忧环境的实现。