什么是 AIOps?
什么是 AIOps?
AIOps,即适用于 IT 运维的人工智能,是 Gartner® 创造的一个行业术语。它描述了能够彻底改变 IT 用户体验的多个技术平台和流程,令 IT 团队得以简化流程,做出更快、更准确的决策,并更快响应网络及系统事件。
AIOps 可以实时或近乎实时地在组织的 IT 基础架构上对大量的遥测和日志数据进行关联。然后将收集到的数据与相关的历史数据相结合,生成可操作的见解。AIOps 就像是一个助手,它对 IT 和网络环境有深入的了解,同时能够利用这些知识提供实时分析,并执行或建议下一步行动。
为什么说 AIOps 具有重要意义?
AIOps 提高了独立应用和服务的效率和性能,能够帮助 IT 团队简化复杂的人工运维,提高生产力。使用 AIOps 的组织正在体验和收获耗时人工任务自动化、工作流程简化、整体网络性能改善,以及安全态势加强等好处和成果。
AIOps 是对性能分析、异常检测和事件关联的投资,让 IT 团队能够主动识别并解决影响性能的事件,减少停机时间和代价高昂的中断,并加快事件响应速度。
AIOps 工作原理
AIOps 整合多个来源的数据,然后通过机器学习 (ML) 或深度学习 (DL) 算法处理数据,提供实时洞察,如体验质量 (QoE)、根本原因分析和异常检测。好的 AIOps 可减少误报,从而消除告警疲劳,以便运维人员主动检测问题,并在其影响最终用户体验之前解决问题。
用例、好处和成果
AIOps 的优势
AIOps 可改善最终用户和 IT 运维人员的体验,同时提高生产力并降低成本。
简化运维人员体验
- 简化工作流程并实现自动化,同时减少错误
- 通过获得响应问题的主动且具体可行的洞察,在问题导致停机或造成用户不良体验之前加以解决,从而加快解决速度
- 提高效率和生产力,为战略优先事项腾出时间
- 改善最终用户体验
- 快速解决问题,改善网络和应用性能
- 确保 IT 系统能够扩展,以应对当前和未来的工作负载需求
降低成本
- 通过减少停机时间、提高员工工作效率并降低与排除 IT 故障相关 OpEx,降低总体拥有成本 (TCO) 并提高投资回报率 (ROI)
让 AIOps 发挥作用
AIOps 在入门阶段与任何其他基础架构分析包的部署没有太大区别。AIOps 平台必须连接(或集成)到它将监视的基础架构,然后才能开始发现和学习。在人工智能学习过程中摄取了足够的数据后,就可以获得初步的见解。
AIOps 平台会分析 IT 环境,然后在问题发生时提供根本原因分析。AIOps 融入组织工作流程的最后一个阶段是自动化。当 AIOps 平台学习到足够多的知识后,它就可以开始自动对简单的问题进行补救。
理想情况下,AIOps 对最终用户不可见,并已集成到管理员的日常管理工具中。
网络 AIOps
网络 AIOps 又称网络人工智能,为整个网络提供自动化和人工智能原生洞察。行业领先的 AIOps 平台提供跨有线、无线、SD-WAN、WAN 边缘、数据中心和安全域的功能,从而提供端到端服务保证。它们可确保网络连接可靠、可衡量且安全,提高网络运维人员的效率和生产力,并改善最终用户的体验。
AIOps 不仅仅是为了能够把今天的工作做得更好。其真正的价值在于管理 IT 基础架构的复杂性,因为它超过了人类单独管理的能力,即便使用最好的非人工智能工具,也是如此。
AIOps 为企业和商业网络的运营商提供了许多优势。
- 加快事件解决速度
- 整合和分析多个来源的数据
- 观察和学习每一个独特操作环境的细节
- 根据计算出的体验质量 (QoE) 提供评估。
- 利用自然语言处理 (NLP) 提供对话界面
缓解对采用 AI 的担忧
与任何新技术一样,组织可能仍在犹豫是否采用 AIOps 解决方案。人们对 AIOps 的担忧包括数据安全、与现有环境的集成以及对 AI 的运作原理缺乏认知。为了缓解这些担忧并找到适合贵组织的解决方案,您可以着重了解以下几个关键方面的内容:
- 安全与道德:确定人工智能引擎正在使用哪些数据以及如何确保这些数据的安全。确保供应商遵循 AI 道德原则和指南
- 集成:AIOps 解决方案应简化运维,而不是增加其复杂性。寻找可以与现有基础架构集成或内置到 IT 解决方案中的解决方案
- 效能:确定 AIOps 是否随时间得以改良和发展,并了解相关 AI 技术推出的时间。AIOps 应该能够实时提供准确且相关的信息,提醒运维人员注意优先事项(且不会造成告警疲劳)。通过持续的闭环反馈和开发,AIOps 应当可以随着时间推移而得以改良和发展
- 真实案例:查看 AIOps 解决方案为客户提供切实成效的案例
- 可解释的人工智能:确定供应商是否能够解释解决方案背后的 AI 技术。如果供应商声称其解决方案中含有 AI,但无法解释其运作原理或利用了哪些技术,那么 AI 可能只是徒有虚名
瞻博网络 AIOps
瞻博网络的人工智能原生网络平台利用业界最先进的 AIOps,结合人工智能引擎和通用微服务云架构 Mist AI 以及 Marvis 虚拟网络助手,改善运维人员和最终用户的体验。
Mist AI 以正确数据进行训练,从所有网络设备中摄取遥测数据,并进行处理,以实时提供准确的响应。瞻博网络的客户支持和数据科学团队通力合作,挖掘客户面临的共同挑战;团队合作开发出 AI 算法,以便 Mist AI 能够在用户遇到性能问题之前发现并检测到问题所在。经过九年多的强化学习和完善发展,Mist AI 现在可以为用户提供准确响应,并将误报次数降至最低。
此外,Mist AI 采用现代化闭环弹性云进行针对性构建,可为 AI/机器学习和可扩展网络提供所需的计算能力。
瞻博网络 AIOps 解决方案部署阶段
瞻博网络的 AIOps 解决方案可简化所有部署阶段的运维。自动化模板和全自动部署可加快并简化第 0/1 天的配置和上线,并提供人工智能原生用户体验洞察。Marvis VNA 和自我驱动型操作可加快问题解决并提高整体网络性能,从而简化第 2 天的管理。
瞻博网络的人工智能驱动型客户支持模型
瞻博网络的人工智能引擎通过闭环系统不断改进。我们的客户支持和数据科学团队通力协作,挖掘客户面临的共同挑战,通过强化学习改进 AI 算法。历经九年多的强化学习以及来自客户和客户支持团队的反馈,Mist AI 和 Marvis 的效能随着时间推移不断提高。
挡住汹涌而来的故障工单
AI 和云计算正在改变客户和供应商之间的支持模式。在这张图中,您可以看到汇总的所有入站工单,用虚线表示。客户的增长表现在设备、站点和组织的增加,而故障工单则相对保持不变。该图说明了 AIOps 如何通过影响客户帮助台工单,使上报数和传入工单数得以减少,并加快了故障的排除和解决。
AIOps 常见问题解答
AIOps 可以解决什么问题?
AIOps 会分析和整合多个来源的数据。它观察和学习环境中的细节,并根据整体体验质量 (QoE) 提供评估。通过这种方式,AIOps 能够将网络活动关联起来,以便在最终用户或 IT 运维人员发现问题之前就确定并解决问题。
AIOps 基于机器学习算法和经过上下文化处理的数据,在问题发生时或发生之前提供根本原因分析。最重要的是,AIOps 使专业知识水平不同的 IT 人员具备差不多的故障排除能力,从而提高了整个团队的整体运维效率。
AIOps 的组件有哪些?
AIOps 平台使用机器学习算法和上下文化的数据来提供根本原因分析,并自动修复网络中的简单问题。AIOps 需要一个能够关联事件的人工智能引擎和从一组观察结果中提取知识或模式的机器学习算法。虚拟网络助手使用的自然语言处理 (NLP) 通过自然语言理解 (NLU) 和语言生成 (LG) 进行了增强,提供了一个强大的对话界面,可以对请求实现上下文化处理,加速故障排除,并做出智能决策或建议来简化操作。
AIOps 的主要功能有哪些?
- 问题隔离/根本原因分析:由于当今网络中的数据量很大,很难确定故障工单中提出的问题,更不用说那些没有引起 IT 部门注意的问题了。AIOps 通过处理上下文化的数据,实时关联事件,使运维团队能够及时发现并纠正问题
- 数据驱动的决策 – 机器学习算法推动了基于数据进行的分析过程,提供操作建议或补救措施,而不是对网络故障或异常情况做出预先确定的响应。这种以数据为中心的方法提高了运维人员的故障排除效率
- 预测性报告:AIOps 预测网络行为,并为修复网络中性能下降和其他异常情况提供建议或补救措施。这种根本性的转变有利于运维团队,使他们能够积极主动地管理网络运维,而不是追查已经对用户和业务产生影响的问题。因此,IT 部门可以腾出曾经花费在救火模式上的时间,来应对未来的业务目标。
瞻博网络提供哪些 AIOps 解决方案?
瞻博网络的人工智能原生网络平台是我们提供瞻博网络 AIOps 的基础。举例而言,我们的有线接入、无线接入、SD-WAN、企业 WAN、数据中心和安全性等解决方案都由通用云和 AIOps 引擎 Mist AI 统一管理。这些 AIOps 解决方案可简化端到端故障排除、自我驱动型网络 (Self-Driving Network™) 运维以及客户端到云端的客户洞察体验。此外,Marvis 是业内首款人工智能原生的虚拟网络助手,具有互动对话界面,可针对复杂问题提供简单明了的建议。Marvis Minis 还是业界首款人工智能原生数字体验孪生,可以在后台运行,即使用户不在场亦可发现问题。所有这些工具 (Driven by Mist AI) 均可节省您的时间和金钱,同时充分发挥网络基础架构的价值。
瞻博网络是 AIOps 领域公认的领导者。了解 Gartner 在 2024 年企业有线和无线 LAN 基础架构魔力象限™ 中,连续第三次评选瞻博网络 Mist 为“最具前瞻性”和“最具执行力”基础架构的原因。