写点什么

以 DeepSeek 对话机器人为例分享 AI 原生应用全栈可观测实践|QCon 北京

  • 2025-04-03
    北京
  • 本文字数:1368 字

    阅读完需:约 4 分钟

大小:756.15K时长:04:18
以 DeepSeek 对话机器人为例分享AI 原生应用全栈可观测实践|QCon 北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


阿里云高级技术专家夏明已确认出席并发表题为《AI 原生应用全栈可观测实践:以 DeepSeek 对话机器人为例》的主题分享。随着 DeepSeek-V3 & R1 火爆全球,基于大语言模型和 AI 生态技术栈构建的应用与业务场景与日俱增。AI 原生应用架构从研发到生产落地,面临诸多新的挑战,包括模型选择、流程编排、评估分析等等。可观测技术可以帮助 LLM 应用开发及运维人员更好的优化模型性能、成本及效果。


本次演讲将以 DeepSeek 对话机器人为例,深入介绍 AI 原生应用架构的可观测需求、挑战与方案实践。比如 DeepSeek 为何频繁出现服务器繁忙?如何评估 DeepSeek 与其他模型的性能、成本与效果差异?如何优化 DeepSeek 对话机器人的终端用户体验?等等。


夏明现任阿里云高级技术专家。在链路追踪、应用可观测领域从业近十年。先后负责阿里集团 EagleEye、阿里云 ARMS 相关产品设计与研发。GitHub 稳定性专栏 StabilityGuide 发起者。他在本次会议的详细演讲内容如下:


演讲提纲

1. AI 原生应用架构演进与落地挑战

  • 蓬勃发展的 AI 应用生态

  • 微服务应用架构 vs AI 原生应用架构

  • 典型的 LLM 应用观测需求与挑战

2. AI 原生应用架构可观测方案

  • 面向 LLM 应用的领域化 Trace 语义

  • User -> Session -> Trace -> Span

  • LLM Span Kind/Attributes

  • 面向 LLM 应用的领域化指标洞察

  • 系统、模型、失败、延迟、成本、评估

  • 基于 OpenTelemetry 的高质量数据采集

  • 大模型框架无侵入埋点(vLLM)

  • 如何解决超长文本采集与分析

  • LLM 专属领域可视化分析视图

  • 推理性能分析

  • Token 消耗分析

  • LLM TraceView

3. DeepSeek 对话机器人可观测实践

  • 如何构建端到端全链路分析视图?

  • 前端、网关、后端、模型、基础设施

  • 如何解决海量并发下的服务器繁忙?

  • 瓶颈定位、请求缓存、模型切换等

  • 如何评估对话机器人回答效果?

  • 向量索引、语义富化、效果评估等


您认为,这样的技术在实践过程中有哪些痛点?

  • 大模型领域化数据语义、采集、加工与可视化

  • 大模型端到端全栈数据打通与分析

  • 从性能向成本、评估效果的观测重心转移


演讲亮点

  • 面向 AI 原生应用的端到端全栈可观测方案

  • 以 DeepSeek 对话机器人为例,介绍大模型调用性能/成本/效果优化实践


听众收益

  • 了解阿里云面向 AI 原生应用架构的全栈可观测前沿技术

  • 开拓新思路,比如通过 LLM Trace 分析 DeepSeek 对话机器人服务器繁忙性能瓶颈


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-04-03 10:007136

评论

发布
暂无评论

Java进阶(二十二)使用FileOutputStream写入文件

No Silver Bullet

9月月更 FileOutputStream 写文件

腾讯前端一面常考面试题合集

loveX001

JavaScript 前端

恍然大悟,才知道什么是真正的思维导图!

博文视点Broadview

大数据ELK(一):集中式日志协议栈Elastic Stack简介

Lansonli

ELK 9月月更

从零到一构建完整知识体系,阿里最新SpringBoot原理最佳实践真香

程序员小毕

Java spring 源码 面试 SpringBoot 2

C/C++生态工具链——gcc/g++编译器使用指南

独立开发者_CoderZZ

c++ C语言 GCC g++ gcc 编译器

智能湖仓架构实践:利用 Amazon Redshift 的流式摄取构建实时数仓

亚马逊云科技 (Amazon Web Services)

预约直播 | 大规模稀疏模型演进与DeepRec

阿里云大数据AI技术

开源项目 AI技术 模型稀疏训练

漏洞修复实用指南

SEAL安全

开源 漏洞 安全漏洞 漏洞修复 开源漏洞

关关难过关关过!2022年BAT面试通关秘籍:面前规划+面试题集+简历优化+面经分享等!

收到请回复

Java 云计算 开源 架构 编程语言

数据库的schema与数据类型优化

阿柠xn

数据库 sql 高性能 优化技巧 9月月更

阿里云张新涛:连接产业上下游,构建XR协作生态

阿里云弹性计算

交互 XR 视觉计算 沉浸式体验

手把手教大家编译 flowable 源码

江南一点雨

Java workflow flowable

MFC框架下,加密图片加载并显示功能

中国好公民st

c++ 加密 9月月更

前端二面必会面试题(附答案)

beifeng1996

JavaScript 前端

前端高频面试题汇总(一)

loveX001

JavaScript 前端

OKR之剑·理念篇01: OKR带给我们的改变

vivo互联网技术

OKR 目标管理 研发管理

不惧繁杂背景,视频编辑服务一键实现人像抠图

HarmonyOS SDK

想成为数据科学家,哪些技能你必须具备?

雨果

头大了,Mysql写入数据十几秒后被自动删除了

南城FE

MySQL 前端 nodejs

亿级日志队列回放性能测试初探

FunTester

[Go WebSocket] 多房间的聊天室(六)为什么要加锁?不加锁行不行啊?

HullQin

Go golang 后端 websocket 9月月更

Java后端每日学点系列?线程知否,List懂否,垃圾回收器晓得否

知识浅谈

线程 垃圾回收器 9月月更

使用 FSM 管理 osm-edge 服务网格入口流量

Flomesh

Service Mesh 服务网格

Github点击破百万!这部《从零开始学架构》神书就此霸榜

Java-fenn

Java 程序员 java面试 Java书籍 Java面试题

为什么阿里人成长速度极快?看完他们 Java 架构进化笔记,值得学习

Java-fenn

Java 程序员 java面试 Java学习 Java面试题

HUAWEI DevEco Testing注入攻击测试:以攻为守,守护OpenHarmony终端安全

OpenHarmony开发者

OpenHarmony

推荐:实现 SVG 动画的 5 个 JavaScript 库~

掘金安东尼

前端 9月月更

数据库的视图该怎么用?

阿柠xn

MySQL 数据库 视图 9月月更

以 DeepSeek 对话机器人为例分享AI 原生应用全栈可观测实践|QCon 北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章