2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

从原型到生产:AgentOps 加速字节 AI 应用落地实践|QCon 北京

  • 2025-03-21
    北京
  • 本文字数:1212 字

    阅读完需:约 4 分钟

从原型到生产:AgentOps 加速字节 AI 应用落地实践|QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京盛大召开。此次大会以 “智能融合,引领未来” 为主题,将汇聚各领域技术先锋与创新者,共同探讨行业发展新趋势。


字节跳动 AI 应用 DevOps 平台后端技术负责人杨晨已确认出席,并将发表题为《从原型到生产:AgentOps 加速字节 AI 应用落地实践》的主题分享。随着 LLM 的发展,越来越多的业务期望结合大模型能力构建其 AI 应用以智能化解决场景化问题。AI 应用的开发与传统工程开发存在众多开发范式的变革,AI 应用落地的过程中也存在诸多挑战。本次演讲将探讨字节内应对上述挑战的实践,讲述 AgentOps 平台如何助力业务高效开发迭代 AI 应用。



杨晨作为字节跳动 Dev Platform 部门技术专家,AI 应用 DevOps 平台后端技术负责人。持续关注 AI 应用开发者工具平台的前沿动态及创新,从 0-1 落地字节 AI 应用 DevOps 平台,对 AI 应用落地及效果调优有深入的理解与洞见。本次会议中,他的详细演讲内容如下:


演讲提纲

1. 大模型时代的应用开发范式变革

  • 微服务应用架构 VS AI 应用架构 

  • AI 应用开发范式

  • AI Agent 的演进

2. AI 应用开发中的问题与挑战

  • 基于大模型的应用开发迭代方式有何不同?如何高效开发?

  • 面对大模型的不确定性,如何高效评测 AI 应用以达到上生产要求?

  • 如何对大模型自主驱动的 Agent / 应用更好进行观测、运维?

  • 效果不及预期,如何进行推理结果的优化提升?

3. 字节 AgentOps 落地实践

  • 3.1 AgentOps 平台的整体架构

  • AI 应用开发的全生命周期

3.2 Prompt 开发:从设计、调优到应用

  • Prompt 调试优化工具与实践

  • Prompt 版本化管理与生产应用

3.3 效果评测:AI 应用的生存之道

  • 评测标准与流程的建立

  • 评测集与评估器

  • LLM-as-a-Judge

  • Code Evaluator

  • Human-in-the-loop

  • 业务实践

  • 基于 Golden Set 的效果准出评测

  • 基于线上数据回流的在线评测

3.4 可观测:洞察 AI 应用的全链路

  • Tracing 数据的采集与消费

  • 开箱即用的会话聚合与指标分析

  • 业务实践

  • 可观测在 Coze 和豆包上的实践

3.5 数据飞轮:AI 应用效果提升的闭环

3.6 落地情况与经验总结

  • 在字节内场的落地情况

  • 实践难点与经验总结

4. 未来展望

  • AI 应用开发者的核心诉求

  • Agent 元年对 AgentOps 平台的机会与挑战


您认为,这样的技术在实践过程中有哪些痛点?

  • AI 应用开发的范式不断创新与变革,如何寻求 AgentOps 的最佳实践


演讲亮点

  • 字节跳动 AgentOps 的全流程实践

  • AI 应用效果评测、问题定位、效果迭代优化的一手经验


听众收益

  • 深入理解 AI 应用开发过程中会遇到的问题及解法

  • AI 应用落地及效果调优的实践经验及最新认知


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。


2025-03-21 12:086961

评论

发布
暂无评论

研发提效:想快速定制一个OLAP应用?你可以这么做

京东科技开发者

Apifox 更新|编排模式、Markdown 编辑器升级、自动申请 SSL 证书、用户反馈问题优化

Apifox

前端 后端 Apifox API 后端程序员

天津企业采购云管平台需要考虑哪些?选择哪家好?

行云管家

云计算 云管平台 天津

心大陆AI大模型再加速,获批国内首个「人工智能心理算法」国家备案!

心大陆多智能体

文献解读-群体基因组第一期|《对BMI的影响:探究BMI的基因型-环境效应》

INSVAST

基因数据分析 生信服务 群体基因

网络安全行为可控定义以及表现内容简述

行云管家

网络安全 堡垒机 行为可控

百度沈抖:主力模型免费,是为了最大限度降低企业创新试错成本

极客天地

京东二面:为什么Netty要造FastThreadLocal?

王磊

关于Vearch在大模型中使用的一些实践

京东科技开发者

程序员/码农35岁都面临转行或失业?

伤感汤姆布利柏

从0到1:广告营销多智能体架构落地全攻略

百度Geek说

生成式AI 企业号 5 月 PK 榜 企业号2024年5月PK榜 多智能体架构

中国程序员和外国程序员到底哪里不一样?

伤感汤姆布利柏

鸿蒙开发从开源进入到闭源(Harmony OS)开发主流

FinFish

HarmonyOS 鸿蒙开发 鸿蒙OS 小程序容器 混合开发

350种类型、10W+量级的API,企业应该怎么管?

芯盾时代

网络安全 物联网 API网关

深度合作!博睿数据联合中国信通院开展公网服务质量评估工作!

博睿数据

智能单款计划助力品牌利润增长

第七在线

手把手教你基于华为云,实现MindSpore模型训练

华为云开发者联盟

人工智能 深度学习 华为云 华为云开发者联盟 企业号2024年5月PK榜

“有温度”的心理健康AI专业咨询师,陪伴你一路成长!

心大陆多智能体

低代码与人工智能:革新智能客服系统的高效之道

天津汇柏科技有限公司

低代码 智能客服 #人工智能

K8s 小白入门|从电影配乐谈起,聊聊容器编排和 K8s

小猿姐

Kubernetes 云原生 容器化

从原型到生产:AgentOps 加速字节 AI 应用落地实践|QCon北京_字节跳动_QCon全球软件开发大会_InfoQ精选文章