50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

基于容器构建的 AI 智能体基础设施落地实践|AICon 北京站

  • 2025-11-06
    北京
  • 本文字数:1305 字

    阅读完需:约 4 分钟

大小:700.46K时长:03:59
基于容器构建的 AI 智能体基础设施落地实践|AICon北京站

12 月 19-20 日, AICon全球人工智能开发与应用大会收官之站将在北京举办,本次大会 将以 “探索 AI 应用边界” 为主题,聚焦企业级 Agent 落地、上下文工程、AI 产品创新等多个热门方向,围绕企业如何通过大模型提升研发与业务运营效率的实际应用案例,邀请来自阿里、字节、华为、京东、快手、美团等头部企业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


阿里云资深技术专家黄涛已确认出席并将在「大模型系统工程」专题发表题为基于容器构建的 AI 智能体基础设施落地实践的主题分享。在生产场景中,AI 智能体展现出了长生命周期、突发算力需求、强隔离性以及成本效益并重的多重诉求。


本次分享将探讨 AI Agent 对容器基础设施带来的全新挑战,并深入分析如何在新时代下构建支撑 AI 基础设施的新一代容器环境,重点关注 Node-aware 容器场景和 Serverless 容器场景的应用。


具体而言,在 Node-aware 场景中,引入 Pod 级虚拟化,以提供更强的隔离性和秒级启动时间。在 Serverless 容器场景中,则采用容器休眠机制能够实现低成本的快速唤醒。结合可调整的 VPA(Vertical Pod Autoscaler),我们可以根据实际需求动态优化资源配置,并通过镜像缓存技术加速冷启动。本议题将基于真实实践,总结 AI Agent 与推理业务的关键需求,分析容器平台的能力边界,并分享在工程化落地过程中的最佳实践经验。


黄涛是阿里云智能容器服务资深技术专家,容器计算服务 ACS 技术负责人,Koordinator 容器混部调度开源发起者。作为阿里巴巴全面云原生化技术负责人,主导并实现了阿里集团数千万核规模的云原生化上云全过程。当前正带领团队构建支撑阿里云 AI Infra 的新一代统一容器基础设施。他在本次会议的详细演讲内容如下:

1.AI Agent 对容器基础设施的全新挑战 需求画像:

  • 长生命周期与多会话、成本敏感与弹性、 不可信代码与沙箱隔离

  • Node-aware 容器场景如何保障 AI Agent 安全性

  • Serverless 容器场景支持智能体的实践:安全沙箱运行环境、镜像缓存技术、容器休眠技术、容器柔性技术


2.推理服务基础设施

  • 模型服务作为 AI Agent 的执行大脑,工程化落地中,LLM 的规模化部署挑战

  • PD 分离架构下,RoleBasedGroup(RBG)基于角色的编排、发布管理和故障处理


3.最佳实践

  • AI Agent 基于容器的实践和架构:基于休眠、唤醒和状态保持的智能体业务实践

  • 开源 RoleBasedGroup 在 PD 分离场景的落地与工程化实践


4.总结与展望


听众收益:

  • 理解 AI Agent 的运行与成本模型,AI Agent 对容器平台的核心诉求

  • 理解基于容器的休眠 &唤醒、PVM、柔性变配、镜像缓存、隔离等关键实现思路与取舍

  • 学习基于容器的 AI Agent 工程化落地最佳实践


除此之外,本次大会还策划了LLM 时代的软件研发新范式Context EngineeringData+AI / Agent 落地实践大模型系统工程企业级 Agent 的设计与落地大模型时代下的搜广推系统实践多模态从技术突破到创新应用落地等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 8 折优惠,单张门票立省 1160 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-11-06 13:001

评论

发布
暂无评论

EDS从小白到专家丨生态产业链高效协同的一计良策

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 8 月 PK 榜

TiDB 源码编译之 TiProxy 篇

TiDB 社区干货传送门

版本测评 新版本/特性解读 7.x 实践

揭秘 | RocketMQ文件清理机制~

java易二三

Java 程序员 计算机

生命数字化时代来临:全基因组计算成本不到1美元

INSVAST

基因测序 基因数据分析

使用Sentieon加速甲基化WGBS数据分析

INSVAST

基因测序 dna WGBS 甲基化

财务数智化十年“老兵”的六条财务共享中心建设体会

用友BIP

智能财务 财务共享

高效模拟常见业务数据的 Mock 功能

Apifox

程序员 前端 API Mock Mock 服务

项目开展CICD的实践探路 | 京东物流技术团队

京东科技开发者

CI/CD 测试 单元测试 Bamboo 企业号 8 月 PK 榜

用好「留存」,闭环小程序运营链路

FinClip

Android图片资源检测插件实现

java易二三

Java 程序员 计算机 插件 APK

Sentieon DNAscope:适配多测序平台数据的快速精准分析流程

INSVAST

基因测序 基因数据分析 DNAscope

Hap-eval:Sentieon开源的多测序平台SV精度评估工具

INSVAST

代码 基因测序 Hap-eval

【保护你的上线】风险治理的防范与排查之路 | 京东云技术团队

京东科技开发者

运维 测试 企业号 8 月 PK 榜 上线风险 风险排查

似懂非懂的 AspectJ

江南一点雨

spring

DNAscope白皮书: 基于机器学习的高精度胚系变异检测流程

INSVAST

基因测序 基因数据分析

基因组大数据计算: CPU和GPU加速方案深度评测

INSVAST

基因测序 基因数据分析

靶向RNA-seq全面解决方案和加速分析,只看这篇就够了!

INSVAST

基因测序 基因数据分析 RNAseq

苹果电脑推荐 Office 2019 v16.77 beta永久激活版+激活工具

胖墩儿不胖y

Mac软件 office办公套件 Office 2019中文版

tidb数据库5.4.3和6.5.3版本性能测试对比

TiDB 社区干货传送门

版本测评 性能测评 6.x 实践

Apache Kyuubi & Celeborn (Incubating) 助力 Spark 拥抱云原生

网易数帆

大数据 spark 云原生 Kyuubi Celeborn

诚邀报名 | 开放原子开发者工作坊:源安全——论开源项目的安全之道

开放原子开源基金会

开源

解放双手!ChatGPT助力编写JAVA框架! | 京东云技术团队

京东科技开发者

Java java框架 ChatGPT 企业号 8 月 PK 榜

常见API架构介绍

java易二三

Java 程序员 计算机 API

一文了解新能源汽车中包含多少种芯片

华秋电子

英伟达 汽车

理解TiDB集群的P99计算方式

TiDB 社区干货传送门

数据库架构设计 应用适配

基于容器构建的 AI 智能体基础设施落地实践|AICon北京站_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章