2022企业应用运维管理指标体系白皮书》正式重磅发布 - 网络

文章推薦指數: 80 %
投票人數:10人

首次全面定义,《2022企业应用运维管理指标体系白皮书》正式重磅发布. 2022-05-12 18:00:37. 近日,博睿数据联合艾瑞咨询共同发布了《2022企业应用运维管理指标体系 ... 内容精选话题直播技术期刊技术大会社区编辑申请我关注的话题我收藏的文章账号设置退出 注册/登录 首次全面定义,《2022企业应用运维管理指标体系白皮书》正式重磅发布 2022-05-1218:00:37网络近日,博睿数据联合艾瑞咨询共同发布了《2022企业应用运维管理指标体系白皮书》(以下简称《白皮书》)。

《白皮书》从企业IT运维的内涵以及在当前数字经济发展的大环境下企业IT运维工作在技术、战略、组织架构等方面面临的变化和问题做了详细说明,并展示了一种以业务和应用为着眼点的企业应用运维管理指标体系,对该体系的原理、设计和实践进行了详细说明。

近日,博睿数据联合艾瑞咨询共同发布了《2022企业应用运维管理指标体系白皮书》(以下简称《白皮书》)。

《白皮书》从企业IT运维的内涵以及在当前数字经济发展的大环境下企业IT运维工作在技术、战略、组织架构等方面面临的变化和问题做了详细说明,并展示了一种以业务和应用为着眼点的企业应用运维管理指标体系,对该体系的原理、设计和实践进行了详细说明。

企业应用运维管理指标体系的重要性《白皮书》指出,随着互联网服务深入千行百业,数字化应用成为企业和机构为用户提供服务的重要形式,直接对用户体验环节进行监测和优化成为IT运维的新思路和途径,相较于传统的面向企业IT资源的运维,面向用户体验的IT运维方式更加聚焦于前端业务侧,能以更显而易见的方式提升各项服务的表现。

随着互联网经济的发展,这一运维思路已在企业中得到了充分实践。

此外,数字化时代企业的运维体系需向应用端视角转变,对于企业而言则需要一套新的运维体系,就《白皮书》中提到的中国内某头部上市城商行的运维现状、问题和发展规划可见,要适应上述的基础架构和业务形式变化,企业需要系统化的方法论指导、明确的指标体系的引导。

与此同时,随着数字经济的发展及其创造的社会经济价值持续提升,我国的IT人才成本在市场需求的刺激下持续提升,IT人才成本的提高,给企业带来的直接影响是增加了聘请包含运维在内的员工的成本。

对于企业而言,减少对人力和经验的依赖是应对上述问题的有效方法,而为了达成这一目标,企业需要为运维工作建设系统性的指标、流程和组织协作体系。

因此,为了发挥企业运维侧的战略价值,企业需要自上而下地打通运维部门和其他部门之间的沟通渠道,形成合力,共同赋能于企业的数字化转型升级。

为了更好地赋能业务创新,运维部门不仅需要运维技术的迭代,也需要通过建立更完善的、能够持续赋能和迭代的运维指标体系的方式,来疏通和业务部门、管理层沟通的渠道,使运维部门能够充分发挥技术优势和创新能力,提升运维工作给企业都带来的价值,增加运维工作的投入产出比。

综上不难看出,企业IT运维正在经历从“后台”向“中台”的转变,需进一步发挥其在企业中“降本增效”的效果。

因此,为了提升运维的投入产出比并提升运维侧对业务侧的价值创造属性,企业的运维部门需要构建一套运维管理指标体系,这将帮助企业运维部门形成高效的工作流体系,提升日常运维工作的效率,减轻运维工作对人工和经验的依赖,并为基于大数据的智能运维应用的部署提供支持和引导。

首次全面定义企业应用运维指标体系以博睿数据的企业应用运维指标体系为例,这一体系从业务视角切入,以业务场景为主题,以业务连续性为宗旨,通过直面业务场景、正向梳理IT调用链、逆向接入数据源等实施步骤,最终构建起具备概览所有业务场景健康度、俯瞰多维立体化IT指标等能力的资源指标管理体系。

具体来看,分为以下7个方面:1、业务端业务端是企业应用运维指标体系的首要关注点。

对于企业来说,业务状况是企业管理者最关心的部分,也是企业所有决策的基础,而随着大数据和人工智能技术的发展,大量企业借助信息技术实现转型升级。

业务数据指标能够为业务侧员工和管理者提供数据洞察,员工和管理者做决策时不再仅仅是按照经验“拍脑袋”,而是基于数据分析的结果进行战略调整及决策规划。

2、用户端用户端(APP、小程序、网站等)是企业与用户的数字触点,同时也是企业获客、留客的重要途径。

在互联网/数字化服务的整个链条上,客户需首要关注的是用户端体验及表现,从而使得用户端体验成为数字化经营中企业产品力和市场竞争力的重要组成部分。

以提升体验为核心的用户端运维质量会直接影响用户对企业的印象和评价,是企业开展运维工作良好的着力点。

3、应用端用户端指标所反映的访问情况只是一个表象,用户端真正所访问到的其实是网站的后台应用,当前企业面临着日益激增的IT复杂性和业务需求的快速变化,IT应用在运行过程中发生性能下降或者服务不可用等故障的可能性大大增加,从而影响业务服务的正常运行。

应用监测不仅能够帮助企业快速定位问题和节约成本,协助企业持续关注应用性能状态,并获取实时反馈,并且能够助力企业应用容器化部署。

4、网络监测各个应用之间的调用通过网络来实现,各个企业IT建设的规模与复杂度与日俱增,需要通过网络监测对现有运维流程进行优化,不断提升管理和运维水平。

网络设施衔接着企业的IT基础资源和用户端的使用体验,也能够反映企业的客户数量、业务流量和业务的时间、地域等特征,在特殊场景下更牵涉数据安全等问题,能够在很大程度上帮助提升企业数字化服务的创新力和产品力。

5、资源层监测网站所有服务均体现在基础资源层面,因此基础资源监控是所有监控中最底层的部分,也是实现AIOps不可或缺的一环。

6、中间件监测随着计算机技术的快速发展,更多的应用软件需要在多种不同的网络协议、硬件以及网络平台环境中运行。

这导致了软件开发者面临数据离散、操作困难、系统匹配程度低等问题,需要开发多种应用程序来实现管理和运营,而中间件技术的发展在很大程度上减轻了开发者的负担,使得网络的运行更有效率。

7、数据库在数据成为企业重要的经营资产的环境下,对核心数据库的高效运维能够帮助企业从数据底层维护系统的问题和信息安全,同时,在湖仓一体等新型数据库构建模式不断渗透的条件下,面向数据库的运维也将迎来挑战和创新,需要企业投入更多的关注。

​构建应用运维管理指标体系的四个步骤此次,博睿数据联合艾瑞咨询联合发布的《白皮书》,不仅为《白皮书》的编写提供了参考;同时,该《白皮书》也是博睿数据今后工作的重要指南,只有引入更全面、更高要求的指标规范,才能够指引公司产品向更稳定与更高质量方向进发,从而塑造出行业的应用标杆。

在博睿数据看来,企业应用运维管理指标体系的建设需从业务全面梳理——确定应用关键动作——预定义各关键指标——落地企业应用运维管理平台四个步骤出发。

一、业务全面梳理在互联网经营大环境下,用户来源渠道众多,包括付费广告、搜索、内容社交、线下推广等方式,随后用户将进入APP、公众号、小程序或网站访问企业的首页并进行注册、商品浏览、加购、付款等行为。

用户旅程多种多样,企业需要针对不同业务来进行用户旅程梳理。

二、确定应用关键动作企业在透视业务并结合业务进行IT架构监测的过程中,务必要确定整个业务流程中的 关键动作,比如注册、登录、付款等用户行为及其所涉及的具体服务、接口、微服务或数据库等关联性资源。

三、预定义各关键指标不同的业务具有不同的特性,业务流程中的关键环节各不相同,企业需要基于不同业务的关键行为动作,从业务、应用、服务、硬件层面进行指标梳理,从而规划出符合不同业务特性的应用运维管理指标体系。

四、企业应用运维管理平台最后,在落地企业应用运维管理平台的过程中,需要企业应用运维管理平台提供强有力支持。

以博睿数据为例,该平台需要具备APM、Log、业务、基础设备、CMDB等数据的接入能力,并能够结合以往行业建设成功经验、行业发展等知识,形成覆盖“业务梳理-关键应用确认-核心指标梳理-指标健康度分级-指标更新”全链条的动态更新体系平台,为企业自身的资源利用、业务监控、决策支持、智能运维等场景提供全面的支持。

除此之外,企业在搭建指标体系过程中会使用多种监测类产品,这需要企业对各产品的稳定性、成熟度进行关注,博睿数据认为可关注CMMI5和中国信通院智能运维成熟度度评估认证两个重要指标。

博睿数据资深架构师总监张冲表示:“企业真正实现从‘O视角(Operation)’到‘C视角(Customer)’的转变,需要建设一套全新应用运维指标体系,该体系建设过程需要经历业务梳理、关键动作确定、关键指标定义、平台搭建几个关键过程,同时需要指出指标体系需要根据业务不断发展来进行动态调整,以保证指标体系的稳定、可观测性、可追溯”。

艾瑞咨询认为,构建应用运维管理指标体系将帮助企业运维部门形成高效的工作流体系,提升日常运维工作的效率,减轻运维工作对人工和经验的依赖,并为基于大数据的智能运维应用的部署提供支持和引导。

另附白皮书完整下载链接:​​https://www.bonree.com/bonree/pdf/WhitePaper.pdf​​责任编辑:刘睿暄博睿数据运维白皮书分享到微信微信扫码分享分享到微博相关推荐一文详解网络安全攻防演练中的防御规划与实施网络安全攻防演练,既是检查网络安全建设成果的试金石,也是指导开展下一步建设的指路灯。

通过攻防演练,企业应以体系化建设为指引,构建“全场景、可信任、实战化”的安全运营能力,实现“全面防护,智能分析,自动响应”的防护效果,构建网络安全保障体系、提升网络安全防护能力。

2022-06-1511:02:40网络安全运营无监控,不运维!Prometheus在线服务的监控实操指南本文会介绍我近期使用Prometheus构建的一套完整的,可用于中小规模(小于500节点)的半自动化(少量人工操作)监控系统方案。

2022-07-1113:43:51Prometheus监控经验之谈:Linux运维工程师的六类好习惯和23个教训从事运维三年半,今天简单整理一下Linux运维工程师的6类好习惯和23个教训,分享给各位小伙伴。

2022-06-1508:21:49Linux运维工程师“先见先行,乐享其成”——锐捷乐享智能运维管理平台正式发布4月13日,行业领先的ICT基础设施及行业解决方案提供商锐捷网络以“先见先行,乐享其成”为主题举办发布会,正式发布锐捷乐享智能运维管理平台。

2022-04-1818:04:16锐捷平台《中国攻击面管理市场白皮书》:基于攻防视角构建网络安全的主动防御体系白皮书中对攻击面管理(ASM)进行了定义:攻击面管理是一种从攻击者的角度对企业数字资产攻击面进行检测发现、分析研判、情报预警、响应处置和持续监控的资产安全性管理方法2022-06-1615:42:16攻击面管理ASM把K8s做到可观测,都需要哪些选型?K8s对于当下的大规模应用的技术架构的重要性不言而喻。

而K8s的可观测性(监控)工具目前也成为了开发运维团队绕不过去的一道门槛。

2022-06-3010:22:26K8s可观测Prometheus整理了100个Python精选库,建议收藏!下面我们挑选每个领域的的精品库,展现给大家,看完之后,你一定会大叫,WC,这么多库我都没有见过。

2022-06-2410:16:59Python精选库如何让云原生运维化繁为简目前我们已经由传统的IT时代迈入了数字化DT的时代。

如何面对新技术趋势的挑战,构建面向云时代的智能监测平台,让云上应用获得更好的保障,是如今摆在每一个企业面前的一道难题。

2022-06-0711:16:51云原生人工智能运维运维大牛万字自述:道尽十多年血泪史与转型自救路本文主要是对运维整体的概览,讲讲对运维的认识,以及一些转型理念思考。

2022-05-0915:01:51运维转型技术CloudOps:优化云运维的新兴框架本文将研究CloudOps是什么,它如何使企业受益,以及在企业中实施CloudOps时应牢记的关键问题。

2022-06-0107:22:24CloudOps云运维框架运维工程师必须知道的11个Linux网络命令Linux是使用最广泛的操作系统之一,在Linux上工作时,知道正确的命令可以节省大量时间,下面介绍几个经常使用的网络相关的命令。

2022-06-2022:37:25Linux操作系统命令云存储应急演练体系建立及场景设计云存储技术的应用很大程度上降低了企业构建同城和异地容灾的成本,相比于传统存储架构,云存储具有完全不同的业务特征,比如在数据的一致性同步规则和数据更新粒度等方面,这些业务特征和应用模式的明显区别,使云存储的高可用保护及应急体系建设都区别于传统存储。

2022-06-2723:44:37云原生云存储云计算从机器学习中受益最大的四个行业在这个方向上,欧盟正迈着坚定的步伐向前迈进。

2020年2月,欧盟委员会发布了《人工智能白皮书》。

正如欧盟主席所说,所有欧盟国家的联合战略旨在未来十年每年吸引超过200亿欧元投资人工智能。

这一数字预计将通过私营部门的贡献和国家的共同融资来实现。

2022-07-0114:25:27机器学习人工智能工业4.0城商行容器云平台应用场景及持久化存储实践本文主要从银行实际应用出发,阐述容器云特性及持久化存储方案实践。

2022-07-1115:35:42云计算银行本文主要从银行实际应无线运维的起源与项目建设思考作为一个从开发转入安全生产时间不太长的小白,结合自身在无线运维项目建设过程中的思考,来说说无线运维的起源,可能更好的重温初心。

2022-04-2115:05:03运维项目无线抢先看!华为伙伴暨开发者大会2022计算产业精彩不断、干货满满“鲲鹏开发者峰会2022”与数十场鲲鹏、昇腾AI技术专题,将通过最前沿的技术思考、最纯粹的技术分享、最干货的应用实践、给开发者带来全新开发体验,帮助开发者更加便捷地进行极简开发。

2022-06-1315:35:53计算我们一起聊聊关于运维监控中告警收敛问题一些通用型的故障场景,往往可以做成独立的指标,从而降低分析的复杂性。

2022-04-0108:27:30告警收敛运维监控SAP重磅发布可持续发展举措助力实现“双碳”目标SAP发布的六大可持续发展方案,包括四大核心方案:分别为碳排放管理、碳足迹管理、ESG报告披露、绿色溯源和循环回收。

2022-06-0916:07:55SAP双碳碳排放vivo大规模Kubernetes集群自动化运维实践本文将分享我们开发的Kubernetes-Operator,采用K8s的声明式API设计,可以让集群管理员和Kubernetes-Operator的CR资源进行交互,以简化、降低任务风险性。

只需要一个集群管理员就可以维护成千上万个k8s节点。

2022-06-0913:45:18vivoK8S集群Kubernetes实现基于GrafanaLoki的日志报警如果我们使用Loki收集日志是否可以根据采集的日志来进行报警呢?答案是肯定的,而且有两种方式可以来实现:Promtail中的metrics阶段和Loki的ruler组件。

2022-06-2808:40:16LokiPromtail日志报警相似话题网络设备623内容通信技术3247内容网络优化558内容4G/5G1086内容全部话题同话题下的热门内容信令分析:KDDI重大故障为何持续60小时之久?HTTP/3来了!存续二十多年的TCP协议最终被抛弃!面试突击:为什么要用HTTPS?它有什么用?SD-WAN的自动化以及为什么需要WAN加速图解网络:访问控制列表ACL,功能堪比防火墙5G、云计算和虚拟商业实践的时代数字孪生,能给无线通信带来什么?剖析Netty内部网络实现原理编辑推荐什么是持续集成?该怎么做?业绩继续高增长华为企业业务这样的速度还能持续多久?6张动态图轻松学习TCP三次握手和四次挥手区块链分叉是怎么回事儿?终于懂了美国更黑暗的操作才刚刚开始,华为匹夫无罪怀璧其罪如何破局?相关专题更多2022年安全报告集锦(上半年)openGaussDeveloperDay20222022-07-1710:20:56直播7.15日:HDD杭州站·线下沙龙2022-07-1710:20:56我收藏的内容微博QQ微信复制链接微信扫码分享AISummit人工智能大会AISummit人工智能大会 业务 速览 在线客服媒体51CTOCIOAgeHC3i社区51CTO博客开源基础软件社区教育51CTO学堂精培企业培训CTO训练营



請為這篇文章評分?