博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
AIOps 平台的误解,挑战及建议(中)— AIOps常见的误解
阅读量:6496 次
发布时间:2019-06-24

本文共 2453 字,大约阅读时间需要 8 分钟。

本文篇幅较长,分为上,中,下,三个部分进行连载。内容分别为: ,AIOps 常见的误解(中), 。

前言

我大概是 5,6 年前开始接触 ITOA 这个领域的,首次接触后,发现领域有着巨大的潜力,一直寻找在这个领域做点事情的机会。大约三年前在这个领域创业,积极寻求 Product Market Fit。这几年下来,经过与行业内的专家交流,研读报告,阅读论文,客户访谈,亲自动手对相应的运维场景解析,行业产品的试用调研,以及结合着中国运维市场现状,撰写了此文。本人才疏学浅,不学无术,欢迎拍砖。

我们第一部分主要讲到了AIOps 的背景以及所需要的能力,我们这部分主要讲误解。

对 AIOps 误解:

AIOps 等于可以减少人力资源的投入

  • AIOps 不等于无人值守;
  • AIOps 不等于 NoOps;
  • AIOps 不等于可以减少人专家的参与;
  • AIOps 可以降低人力成本;
  • AIOps 在现阶段不等于可以省钱;

AI 的确是一个非常性感的词汇,大家认为只要实现了智能化,就能够轻轻松松,不需要人的干预,这当然是一个非常理想的状况,但是,在短时间内,这个不能实现。这个的实现难度,个人认为,与自动无人驾驶,能实现第五等级是同样的难度,也就说,可能起码需要10年左右的时间,甚至可能更长时间。

平台本质上还是一个工具,在构建后,仍然需要人的参与,而且在目前的探索发展的投入阶段,有大量的工需要去做,需要运维专家,大数据工程师,算法科学家,业务专家,暂时看不到能削减人力成本的可能性,而且相关的投入可能需要多年的时间。

在平台建立后,在持续改进的情况下,仍然需要专家或者分析师,从不同的维度,从不同的业务口径,组合合适的可视化技术,机器学习技术,大数据分析技术,制定分析场景,平台才能够为IT运维,业务分析产生持续的洞察,提供商业价值。

所以,AIOps 不能取代人,在现阶段不可能减少人力投入,但在未来可能能促进部分运维人员转型为通晓业务,掌握运维知识的数据分析师。

算法和智能化是AIOps最重要的事情

算法很重要,但是我个人认为,在此阶段,大部分企业不应该以算法为第一着眼点。

这个应该是比较有争议,或者,或者说大家认知不太一致的部分。以下这张图是 Gartnert 在 AIOps 还在叫 ITOA 时候,给定义的四个阶段:

  1. Data ingestion, indexing, storage and access;
  2. Visualization and basic statistical summary;
  3. Pattern discovery and anomaly detection;
  4. True causal path discovery;

Gartner 在报告中强调,掌握后面阶段的前提是拥有前一阶段的能力,如果不拥有充分的前一阶段能力,将会影响 ITOA 的落地效果。因此这四个阶段必须一个步一脚印,第三以及第四部时,才显著地引入了机器算法,或者 AI 的必要。

大家都知道,所谓的机器学习算法,统计算法,深度学习算法这些 AI 的分类,其实是高度依赖于数据的。没有多种数据源,数据的采集,数据存储,数据统计,数据可视化,一切都只是空中楼梯。

图片6_副本.png

来源: Gartner Report “Organizations Must Sequentially Implement the Four Phases of ITOA to Maximize Investment ” 2015.2.18

因此,AIOps 的平台的建设首先应该是着眼点应该是大数据,然后才是算法,从而实现持续洞察和改进的目标。

一定要上深度学习才叫 AIOps

我们可以先看看 AI , Machine Learning , Deep Learning 的关系,他们的关系大概如下图。

图片7_副本.png

学术界有不少学者,在探索部分深度学习算法智能运维中的应用,如犹他州大学的《DeepLog: Anomaly Detection and Diagnosis from System Logs through Deep Learning》 中利用 Long Short-Term Memory (LSTM)来实现日志模式的发现,从而实现异常检测。但是,其实智能运维所需要的大部分算法,决策树学习(decision tree learning)、聚类(clustering)、SVM(Support Vector Machine)和贝叶斯网络(Bayesian networks)等等算法,均是属于传统的机器学习范畴的,因此 我们不应该将深度学习与 AIOps 挂上必然的联系。

甚至于,我们不用拘泥于概念,从解决问题的角度出发,在特定的场景,利用传统的规则集,设定一些规则,降低了运维人员的工作强度,提高了效率,也能叫智能运维。甚至在Gartner 的报告中,对AIOps 落地的第一步,是统计分析,可视化,而不是任何的机器学习算法。

它适合现阶段所有有规模的用户

这个比较好理解,就目前来看,AIOps 只适合大型的客户,原因如下:

  1. 中小型的客户缺乏多种数据源;
  2. 中小型客户业务需求没有那么复杂;
  3. 很多算法,其实是为了大规模运维的时候才用的上的,在规模小的时候,难以产生效果;

运维自动化是智能运维的前提

我看到过不少的文章,将运维分成了四个阶段,将自动化运维放在智能运维的前一个阶段,把智能,又或者在智能运维这个体系里头,硬是塞了很多自动化运维,批量操作,批量规划的功能在里头,我觉得都是不对的。自动化运维更像是手,智能运维更像是眼镜及大脑,有了更全面数据,更充满的分析后,大脑能更好的指挥手进行操作。

图片8_副本.png

因此,企业应该将自动化运维和智能化运维看成了两个有关联的体系,但是不应该混一谈,造成更多的误解。

OneAPM 全新推出新一代 AIOps 平台 I2,欢迎您随时联系我们,即刻开启贵公司的智能运维之旅。点击进入 了解更多信息。

来源:

转载地址:http://xauyo.baihongyu.com/

你可能感兴趣的文章
springcloud demo---config-client
查看>>
Django设置联合唯一约束 -- migrate时报错处理
查看>>
Java LeetCode 1.Two Sum
查看>>
前端面试题:css相关面试题
查看>>
shell命令的高级使用之---选择性copy
查看>>
最长回文子序列-----动态规划
查看>>
Vue国际化实现
查看>>
设计模式:单例模式
查看>>
FLASH位宽为8、16、32时,CPU与外设之间地址线的连接方法
查看>>
双网卡一般情况不能有两个网关 (转)
查看>>
xshell 远程连接Linux
查看>>
Linux计划任务及压缩归档(week2_day1)--技术流ken
查看>>
ccf算法模板
查看>>
微信小程序登录 该死的官方文档TypeError: the JSON object must be str, not 'bytes'
查看>>
VMware 虚拟机克隆 CentOS 6.5 之后,网络配置问题的解决方案
查看>>
Python ( 1 ) ----- 简介
查看>>
[linux基础学习]run level
查看>>
第七周学习总结
查看>>
一步步的教你安装UChome (UChome 安装教程)
查看>>
[DeeplearningAI笔记]序列模型1.5-1.6不同类型的循环神经网络/语言模型与序列生成...
查看>>