2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

从原型到生产:AgentOps 加速字节 AI 应用落地实践|QCon 北京

  • 2025-03-21
    北京
  • 本文字数:1212 字

    阅读完需:约 4 分钟

从原型到生产:AgentOps 加速字节 AI 应用落地实践|QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京盛大召开。此次大会以 “智能融合,引领未来” 为主题,将汇聚各领域技术先锋与创新者,共同探讨行业发展新趋势。


字节跳动 AI 应用 DevOps 平台后端技术负责人杨晨已确认出席,并将发表题为《从原型到生产:AgentOps 加速字节 AI 应用落地实践》的主题分享。随着 LLM 的发展,越来越多的业务期望结合大模型能力构建其 AI 应用以智能化解决场景化问题。AI 应用的开发与传统工程开发存在众多开发范式的变革,AI 应用落地的过程中也存在诸多挑战。本次演讲将探讨字节内应对上述挑战的实践,讲述 AgentOps 平台如何助力业务高效开发迭代 AI 应用。



杨晨作为字节跳动 Dev Platform 部门技术专家,AI 应用 DevOps 平台后端技术负责人。持续关注 AI 应用开发者工具平台的前沿动态及创新,从 0-1 落地字节 AI 应用 DevOps 平台,对 AI 应用落地及效果调优有深入的理解与洞见。本次会议中,他的详细演讲内容如下:


演讲提纲

1. 大模型时代的应用开发范式变革

  • 微服务应用架构 VS AI 应用架构 

  • AI 应用开发范式

  • AI Agent 的演进

2. AI 应用开发中的问题与挑战

  • 基于大模型的应用开发迭代方式有何不同?如何高效开发?

  • 面对大模型的不确定性,如何高效评测 AI 应用以达到上生产要求?

  • 如何对大模型自主驱动的 Agent / 应用更好进行观测、运维?

  • 效果不及预期,如何进行推理结果的优化提升?

3. 字节 AgentOps 落地实践

  • 3.1 AgentOps 平台的整体架构

  • AI 应用开发的全生命周期

3.2 Prompt 开发:从设计、调优到应用

  • Prompt 调试优化工具与实践

  • Prompt 版本化管理与生产应用

3.3 效果评测:AI 应用的生存之道

  • 评测标准与流程的建立

  • 评测集与评估器

  • LLM-as-a-Judge

  • Code Evaluator

  • Human-in-the-loop

  • 业务实践

  • 基于 Golden Set 的效果准出评测

  • 基于线上数据回流的在线评测

3.4 可观测:洞察 AI 应用的全链路

  • Tracing 数据的采集与消费

  • 开箱即用的会话聚合与指标分析

  • 业务实践

  • 可观测在 Coze 和豆包上的实践

3.5 数据飞轮:AI 应用效果提升的闭环

3.6 落地情况与经验总结

  • 在字节内场的落地情况

  • 实践难点与经验总结

4. 未来展望

  • AI 应用开发者的核心诉求

  • Agent 元年对 AgentOps 平台的机会与挑战


您认为,这样的技术在实践过程中有哪些痛点?

  • AI 应用开发的范式不断创新与变革,如何寻求 AgentOps 的最佳实践


演讲亮点

  • 字节跳动 AgentOps 的全流程实践

  • AI 应用效果评测、问题定位、效果迭代优化的一手经验


听众收益

  • 深入理解 AI 应用开发过程中会遇到的问题及解法

  • AI 应用落地及效果调优的实践经验及最新认知


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。


2025-03-21 12:086913

评论

发布
暂无评论

开放原子开源基金会TOC(技术监督委员会)第七十九次全体会议

开放原子开源基金会

开源

首期"源规律"开源公益课程正式上线

开放原子开源基金会

开源 合规 法律法规

如何解决大量小文件传输慢的问题

镭速

小文件传输

利用文心千帆打造一个属于自己的小师爷

为自己带盐

大语言模型 文心千帆

使用低代码平台提高生产力

树上有只程序猿

低代码 生产力 全栈开发 JNPF

ThreadLocal实践案例两则

FunTester

飞书深诺数仓低代码方案实战

飞书深诺技术团队

软件测试 | mysqlhotcopy(MyISAM表热备份工具)

测吧(北京)科技有限公司

测试

接口测试|Postman发送带参数的Get请求

霍格沃兹测试开发学社

校源行 | 2023年开放原子校源行开源大使培训圆满结束,考试时间正式公布

开放原子开源基金会

开源

安全文件传输的重要性及其对企业的影响

镭速

文件传输

基于低代码平台快速搭建应用

互联网工科生

低代码 低代码开发 JNPF java低代码开发平台

软件测试 | 日志的删除

测吧(北京)科技有限公司

测试

平台工程社区:与全球 2w+ 早期实践者同行

杨振涛

DevOps 云原生 社区 平台工程 平台工程师

GPTCache 悬赏令!寻找最佳捉虫猎手,豪华赏格等你来拿!

Zilliz

Zilliz AIGC ChatGPT LLM gptcache

校源行|开放原子开源社团(山东大学)授牌仪式隆重举行

开放原子开源基金会

开源 山东大学

saas堡垒机定义以及优势简单说明-行云管家

行云管家

SaaS 堡垒机 saas堡垒机

【十万个等保小知识】等保测评报告是在等保整改之后发吗?

行云管家

等保 等级保护 等保测评 等保整改

开放原子开源基金会代表团出席Open Source Congress并参与专题研讨

开放原子开源基金会

LeetCode题解:剑指 Offer 56 - I. 数组中数字出现的次数,哈希表,JavaScript,详细注释

Lee Chen

JavaScript LeetCode

铜锁 SM2 算法性能优化实践(二)|快速模约减算法实现

铜锁开源密码库

开源 开发者 算法 同态加密 密码学

AI+游戏,内容生产力的又一次变革

澳鹏Appen

人工智能 AR vr 生成式AI 游戏AI

直击运维痛点,大数据计算引擎 EasyMR 的监控告警设计优化之路

袋鼠云数栈

监控 监控告警

DLRover 在 K8s 上千卡级大模型训练稳定性保障的技术实践

AI Infra

人工智能 开源 AI 开发者 kubernetes 运维

时序数据高基问题揭秘:根因分析与解决之道

Greptime 格睿科技

时序数据库 云原生数据库 国产时序数据库 高基问题

软件测试 | mysqlshow(数据库对象查看工具)

测吧(北京)科技有限公司

测试

定档!WAVE SUMMIT 2023@全球开发者,8月16日北京见!

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

作为CTO,我真正想要的可观测性平台

JainChen

开发者 监控 可观测性

让数据管理由繁至简的低代码开发平台

力软低代码开发平台

从原型到生产:AgentOps 加速字节 AI 应用落地实践|QCon北京_字节跳动_QCon全球软件开发大会_InfoQ精选文章