写点什么

基于容器构建的 AI 智能体基础设施落地实践|AICon 北京站

  • 2025-11-06
    北京
  • 本文字数:1305 字

    阅读完需:约 4 分钟

大小:700.46K时长:03:59
基于容器构建的 AI 智能体基础设施落地实践|AICon北京站

12 月 19-20 日, AICon全球人工智能开发与应用大会收官之站将在北京举办,本次大会 将以 “探索 AI 应用边界” 为主题,聚焦企业级 Agent 落地、上下文工程、AI 产品创新等多个热门方向,围绕企业如何通过大模型提升研发与业务运营效率的实际应用案例,邀请来自阿里、字节、华为、京东、快手、美团等头部企业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


阿里云资深技术专家黄涛已确认出席并将在「大模型系统工程」专题发表题为基于容器构建的 AI 智能体基础设施落地实践的主题分享。在生产场景中,AI 智能体展现出了长生命周期、突发算力需求、强隔离性以及成本效益并重的多重诉求。


本次分享将探讨 AI Agent 对容器基础设施带来的全新挑战,并深入分析如何在新时代下构建支撑 AI 基础设施的新一代容器环境,重点关注 Node-aware 容器场景和 Serverless 容器场景的应用。


具体而言,在 Node-aware 场景中,引入 Pod 级虚拟化,以提供更强的隔离性和秒级启动时间。在 Serverless 容器场景中,则采用容器休眠机制能够实现低成本的快速唤醒。结合可调整的 VPA(Vertical Pod Autoscaler),我们可以根据实际需求动态优化资源配置,并通过镜像缓存技术加速冷启动。本议题将基于真实实践,总结 AI Agent 与推理业务的关键需求,分析容器平台的能力边界,并分享在工程化落地过程中的最佳实践经验。


黄涛是阿里云智能容器服务资深技术专家,容器计算服务 ACS 技术负责人,Koordinator 容器混部调度开源发起者。作为阿里巴巴全面云原生化技术负责人,主导并实现了阿里集团数千万核规模的云原生化上云全过程。当前正带领团队构建支撑阿里云 AI Infra 的新一代统一容器基础设施。他在本次会议的详细演讲内容如下:

1.AI Agent 对容器基础设施的全新挑战 需求画像:

  • 长生命周期与多会话、成本敏感与弹性、 不可信代码与沙箱隔离

  • Node-aware 容器场景如何保障 AI Agent 安全性

  • Serverless 容器场景支持智能体的实践:安全沙箱运行环境、镜像缓存技术、容器休眠技术、容器柔性技术


2.推理服务基础设施

  • 模型服务作为 AI Agent 的执行大脑,工程化落地中,LLM 的规模化部署挑战

  • PD 分离架构下,RoleBasedGroup(RBG)基于角色的编排、发布管理和故障处理


3.最佳实践

  • AI Agent 基于容器的实践和架构:基于休眠、唤醒和状态保持的智能体业务实践

  • 开源 RoleBasedGroup 在 PD 分离场景的落地与工程化实践


4.总结与展望


听众收益:

  • 理解 AI Agent 的运行与成本模型,AI Agent 对容器平台的核心诉求

  • 理解基于容器的休眠 &唤醒、PVM、柔性变配、镜像缓存、隔离等关键实现思路与取舍

  • 学习基于容器的 AI Agent 工程化落地最佳实践


除此之外,本次大会还策划了LLM 时代的软件研发新范式Context EngineeringData+AI / Agent 落地实践大模型系统工程企业级 Agent 的设计与落地大模型时代下的搜广推系统实践多模态从技术突破到创新应用落地等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 8 折优惠,单张门票立省 1160 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-11-06 13:005393

评论

发布
暂无评论

Week 3 Assignment

Yinan

JD-GUI反编译jar包为Java源代码

MySQL从删库到跑路

Java jar 程序员 Spring Boot jar包的小秘密

Golang单例模式手写稿

Jacky.Chen

架构师训练营 Week3 代码重构 - 学习总结 设计模式

spring 设计模式 JUnit

架构师训练营第三周学习总结

成长者

极客大学架构师训练营

架构师训练营第二周作业

xs-geek

Mongodb异常关闭,再次启动报错

MySQL从删库到跑路

mongodb

最完整的PyTorch数据科学家指南(2)

计算机与AI

学习 PyTorch

架构师训练营第二周总结

xs-geek

架构师训练营第 1 期 week3

张建亮

极客大学架构师训练营

设计模式第三周作业「架构师训练营第 1 期」

天天向善

单例模式 组合模式

spring-boot-route(二)读取配置文件的几种方式

Java旅途

Java Spring Boot

第三周作业

icydolphin

极客大学架构师训练营

week03

……

为什么Rust的println!不会发生所有权转移?

袁承兴

rust 元编程

vagrant 开发环境配置

孙志平

LeetCode题解:242. 有效的字母异位词,数组计数,JavaScript,详细注释

Lee Chen

大前端 LeetCode

集中日志系统ELK

Java个体户

ELK

分布式系统的核心:共识问题

多颗糖

分布式计算 计算机基础 分布式系统 架构师

[Python3]三子棋游戏!祝大家中国71周年国庆节快乐!

MengZian

Python

区块链3.0时代:大规模商业应用开发即将实现

CECBC

区块链 数字金融

区块链可以为物联网做些什么?

CECBC

区块链 物联网

架构师训练营第 1 期 week2

张建亮

极客大学架构师训练营

架构师训练营第 1 期 week2 总结

张建亮

极客大学架构师训练营

架构一期第三周作业

Airs

Linux忘记root密码怎么办

MySQL从删库到跑路

Linux 服务器 root密码 root

设计模式第三周总结「架构师训练营第 1 期」

天天向善

当区块链遇见共享经济,会碰撞出怎样的火花?

CECBC

区块链

第三周-代码重构-学习总结

刘希文

Springboot 邮件任务

hepingfly【gzh:和平本记】

springboot 发送邮件

第三周作业

极客大学架构师训练营

基于容器构建的 AI 智能体基础设施落地实践|AICon北京站_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章