华为JDC登场!观测云带来下一代监控观测平台的AI实战解法

6月20日,在华为数据中心大咖沙龙现场,观测云 CEO 蒋烁淼受邀登台,带来了重磅演讲《AI大模型时代,数据中心从人为观测走向机器辅助观测》,与在场数百位开发者、技术负责人、行业专家深入探讨了如何基于DeepSeek R1大模型与AI Agent技术,实现可观测性数据的智能分析与自动化运维,展示了观测云在 AI 驱动可观测性平台上的落地能力。

图片

为什么要谈“AI+可观测性”?

在复杂业务系统、庞大技术架构、高频迭代的多重挑战下,传统监控系统正逐渐失灵:

  • 各类监控工具割裂,数据不能串联

  • 问题定位链路长,分析效率低

  • 运维成本高,告警误报多

  • 团队协作难,信息不能共享

图片

AI 成为解决这些痛点的“关键钥匙”。但想让 AI 真正服务于可观测性,并不是简单“接入大模型”那么轻松。蒋烁淼表示:“我们要的不是把大模型嵌进去,而是要让 AI 理解运维问题、适应运维逻辑、生成可执行的结论。”

从难题出发,观测云怎么做?

观测云 Obsy AI,作为全栈监控观测平台的智能核心,解决的不是“问点小问题”——而是要能辅助运维完成从现象识别到根因定位、到策略建议的整个闭环。

01 三大挑战,不容低估

  • 数据上下文复杂:运维数据体量巨大,结构极不统一,原始数据分析可能涉及数十GB甚至TB级内容,经济性极差。

  • 大量无效输出:大模型通用逻辑不具备 IT 运维专业知识和客户场景抽象信息,常规 RAG+prompt 模式难以在 IT 场景中获得准确输出。

  • 推理路径过长:涉及数百个垂直场景,推理维度以万计,性能和精度难平衡。

图片

02 AI for Observability:观测云构建“五大统一”

观测云的解决方案,不是“模型+接口”的浅层集成,而是全面构建了一整套 AI for Observability 的底座能力:

  • 统一采集器:支持指标、日志、链路等多源数据统一采集

  • 统一数据模型:构建时间 + 空间坐标体系,支持上下文分析

  • 统一标签体系:实现数据语义化,让 AI 可以“看懂”业务、主机、组件等多维信息

  • 统一数据存储:GuanceDB 3.0 提供了 Serverless 架构与流式聚合引擎,支撑 PB 级数据处理、低延迟响应与 AI 分析加速

  • 统一数据分析:统一数据查询语言 DQL 支持海量数据快速处理和高效响应

图片

基于以上底座能力,Obsy AI 智能体的能力实现了真正的落地,其中包括:

  • 仪表板智能解读,给出健康度评分、重点及异常指标讲解,以及排查优化建议

  • 异常告警智能聚合,快速发现并指向故障根因

  • 全链路性能分析,辅助决策排查链路瓶颈

  • 各种分析结论形成结构化、上下文明确的建议

  • ...

图片

03 Observability for AI:观测云让大模型调用可观、可查、可控

集成强大AI能力的同时,观测云同样通过自身的全栈可观测能力,为 LLM 应用提供从请求到响应的完整可视化支持:

  • 调用链一键溯源:快速定位异常调用上下文,助力开发高效排查;

  • Token 消耗全景掌控:实时展示 Prompt / Completion Token 使用情况,支持模型与应用维度分析;

图片

  • 成本趋势预警:调用量、费用一图看清,超阈值立刻告警,守住预算安全线;

  • 火焰图 + 根因分析:链路耗时分布一目了然,慢调用瓶颈一击即破。

图片

与华为深度协同,打造高可用、高性能全栈可观测性解决方案

本次大会,观测云也展示了与华为在数据中心领域的协同实践。基于鲲鹏、昇腾等华为基础设施,观测云可部署于多种异构环境,实现性能保障与数据安全的双重提升,打造高可靠、强弹性的一体化可观测方案。

AI 驱动的智能可观测性,不只是平台功能的迭代,而是企业认知体系的升级。

未来,观测云将继续在 AI 与可观测性的交叉点上发力,探索智能化运维的新边界,构建更懂业务、更懂团队的智能监控观测平台。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值