
12 月 19-20 日, AICon全球人工智能开发与应用大会收官之站将在北京举办,本次大会 将以 “探索 AI 应用边界” 为主题,聚焦企业级 Agent 落地、上下文工程、AI 产品创新等多个热门方向,围绕企业如何通过大模型提升研发与业务运营效率的实际应用案例,邀请来自阿里、字节、华为、京东、快手、美团等头部企业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!
阿里云资深技术专家黄涛已确认出席并将在「大模型系统工程」专题发表题为《基于容器构建的 AI 智能体基础设施落地实践》的主题分享。在生产场景中,AI 智能体展现出了长生命周期、突发算力需求、强隔离性以及成本效益并重的多重诉求。
本次分享将探讨 AI Agent 对容器基础设施带来的全新挑战,并深入分析如何在新时代下构建支撑 AI 基础设施的新一代容器环境,重点关注 Node-aware 容器场景和 Serverless 容器场景的应用。
具体而言,在 Node-aware 场景中,引入 Pod 级虚拟化,以提供更强的隔离性和秒级启动时间。在 Serverless 容器场景中,则采用容器休眠机制能够实现低成本的快速唤醒。结合可调整的 VPA(Vertical Pod Autoscaler),我们可以根据实际需求动态优化资源配置,并通过镜像缓存技术加速冷启动。本议题将基于真实实践,总结 AI Agent 与推理业务的关键需求,分析容器平台的能力边界,并分享在工程化落地过程中的最佳实践经验。
黄涛是阿里云智能容器服务资深技术专家,容器计算服务 ACS 技术负责人,Koordinator 容器混部调度开源发起者。作为阿里巴巴全面云原生化技术负责人,主导并实现了阿里集团数千万核规模的云原生化上云全过程。当前正带领团队构建支撑阿里云 AI Infra 的新一代统一容器基础设施。他在本次会议的详细演讲内容如下:
1.AI Agent 对容器基础设施的全新挑战 需求画像:
长生命周期与多会话、成本敏感与弹性、 不可信代码与沙箱隔离
Node-aware 容器场景如何保障 AI Agent 安全性
Serverless 容器场景支持智能体的实践:安全沙箱运行环境、镜像缓存技术、容器休眠技术、容器柔性技术
2.推理服务基础设施
模型服务作为 AI Agent 的执行大脑,工程化落地中,LLM 的规模化部署挑战
PD 分离架构下,RoleBasedGroup(RBG)基于角色的编排、发布管理和故障处理
3.最佳实践
AI Agent 基于容器的实践和架构:基于休眠、唤醒和状态保持的智能体业务实践
开源 RoleBasedGroup 在 PD 分离场景的落地与工程化实践
4.总结与展望
听众收益:
理解 AI Agent 的运行与成本模型,AI Agent 对容器平台的核心诉求
理解基于容器的休眠 &唤醒、PVM、柔性变配、镜像缓存、隔离等关键实现思路与取舍
学习基于容器的 AI Agent 工程化落地最佳实践
除此之外,本次大会还策划了LLM 时代的软件研发新范式、Context Engineering、Data+AI / Agent 落地实践、大模型系统工程、企业级 Agent 的设计与落地、大模型时代下的搜广推系统实践、多模态从技术突破到创新应用落地等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。
现在报名即可以享受 8 折优惠,单张门票立省 1160 元,详情可扫码或联系票务经理 13269078023 咨询。








评论