写点什么

以 DeepSeek 对话机器人为例分享 AI 原生应用全栈可观测实践|QCon 北京

  • 2025-04-03
    北京
  • 本文字数:1368 字

    阅读完需:约 4 分钟

大小:756.15K时长:04:18
以 DeepSeek 对话机器人为例分享AI 原生应用全栈可观测实践|QCon 北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


阿里云高级技术专家夏明已确认出席并发表题为《AI 原生应用全栈可观测实践:以 DeepSeek 对话机器人为例》的主题分享。随着 DeepSeek-V3 & R1 火爆全球,基于大语言模型和 AI 生态技术栈构建的应用与业务场景与日俱增。AI 原生应用架构从研发到生产落地,面临诸多新的挑战,包括模型选择、流程编排、评估分析等等。可观测技术可以帮助 LLM 应用开发及运维人员更好的优化模型性能、成本及效果。


本次演讲将以 DeepSeek 对话机器人为例,深入介绍 AI 原生应用架构的可观测需求、挑战与方案实践。比如 DeepSeek 为何频繁出现服务器繁忙?如何评估 DeepSeek 与其他模型的性能、成本与效果差异?如何优化 DeepSeek 对话机器人的终端用户体验?等等。


夏明现任阿里云高级技术专家。在链路追踪、应用可观测领域从业近十年。先后负责阿里集团 EagleEye、阿里云 ARMS 相关产品设计与研发。GitHub 稳定性专栏 StabilityGuide 发起者。他在本次会议的详细演讲内容如下:


演讲提纲

1. AI 原生应用架构演进与落地挑战

  • 蓬勃发展的 AI 应用生态

  • 微服务应用架构 vs AI 原生应用架构

  • 典型的 LLM 应用观测需求与挑战

2. AI 原生应用架构可观测方案

  • 面向 LLM 应用的领域化 Trace 语义

  • User -> Session -> Trace -> Span

  • LLM Span Kind/Attributes

  • 面向 LLM 应用的领域化指标洞察

  • 系统、模型、失败、延迟、成本、评估

  • 基于 OpenTelemetry 的高质量数据采集

  • 大模型框架无侵入埋点(vLLM)

  • 如何解决超长文本采集与分析

  • LLM 专属领域可视化分析视图

  • 推理性能分析

  • Token 消耗分析

  • LLM TraceView

3. DeepSeek 对话机器人可观测实践

  • 如何构建端到端全链路分析视图?

  • 前端、网关、后端、模型、基础设施

  • 如何解决海量并发下的服务器繁忙?

  • 瓶颈定位、请求缓存、模型切换等

  • 如何评估对话机器人回答效果?

  • 向量索引、语义富化、效果评估等


您认为,这样的技术在实践过程中有哪些痛点?

  • 大模型领域化数据语义、采集、加工与可视化

  • 大模型端到端全栈数据打通与分析

  • 从性能向成本、评估效果的观测重心转移


演讲亮点

  • 面向 AI 原生应用的端到端全栈可观测方案

  • 以 DeepSeek 对话机器人为例,介绍大模型调用性能/成本/效果优化实践


听众收益

  • 了解阿里云面向 AI 原生应用架构的全栈可观测前沿技术

  • 开拓新思路,比如通过 LLM Trace 分析 DeepSeek 对话机器人服务器繁忙性能瓶颈


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-04-03 10:007287

评论

发布
暂无评论

Visual Studio Code:专业编程工具首选,成就卓越代码!

Rose

如CGI一般的分子动力学,让科学家看到了3D渲染后的分子运动「影片」

新消费日报

高效的剪辑和渲染能力 Final Cut Pro X简体中文安装包

Rose

ai2021安装包 及 Illustrator 2021安装教程

Rose

macOS Big Sur(苹果macos11系统)安装包分享及安装教程

Rose

《使用Gin框架构建分布式应用》阅读笔记:p127-p142

codists

golang gin 编程人 codists

Photoshop 2024对电脑配置有什么要求?ps2024破解安装包分享

Rose

适老化产品展|2025广州国际老年人残疾人辅具展会

秋硕展览

京东商品详情API详解:全面掌握返回值字段

代码忍者

API 接口 pinduoduo API

【论文速读】| 攻击图谱:从实践者的角度看生成式人工智能红队测试中的挑战与陷阱

云起无垠

Sketch:专业设计工具首选,成就非凡视觉

Rose

PaddleNLP上新!浪潮信息源2.0全面接入,大模型生态加速进化!

百度Geek说

百度 数据 大模型

麦杰科技携手小伙伴,一起做那些“难而正确的事”

麦杰研究院

2025滋补品展-2025第六届深圳国际保健养生展会

秋硕展览

2025深圳国际耐火材料及工业陶瓷展会(6月)

秋硕展览

指标工厂赋能数据资产,实现标准化管理与高效利用

奇点云

大数据 互联网 数据资产 制造业

氢健康用品展|2025第36届广州国际大健康博览会

秋硕展览

AlDente——Mac 电池管理大师,续航无忧!

Rose

MicrosoftOffice2019密钥 office2019激活教程

Rose

征程 6 环视快启 sample

地平线开发者

自动驾驶 算法

Apache Calcite 快速入门指南

端小强

Calcite

生成式AI时代的内容安全与系统构建:合合信息文档图像篡改检测创新方案

海拥(haiyong.site)

人工智能

Navicat Premium 数据库管理 --Navicat Premium中文汉化包

Rose

浅谈活动中台系统技术债管理实践

vivo互联网技术

技术债 效能提升 项目质量 系统稳定

多模态大模型活动 | 使用 PAI×LLaMA Factory 搭建文旅问答机器人

阿里云大数据AI技术

人工智能 LLM PAI 问答机器人

以 DeepSeek 对话机器人为例分享AI 原生应用全栈可观测实践|QCon 北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章