云原生 AI 支撑大模型服务落地的创新与实践｜AICon深圳_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章

50万奖金+官方证书，深圳国际金融科技大赛正式启动，点击报名了解详情 



 写点什么

登录/注册



大小：619.25K时长：03:31

云原生 AI 支撑大模型服务落地的创新与实践｜AICon深圳

8 月 22 日 -23 日，首届AICon 全球人工智能开发与应用大会深圳站即将拉开帷幕。本次大会将聚焦 Agent、多模态、AI 产品设计等热门方向，围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例，邀请来自阿里、腾讯、字节跳动、微软、华为等头部企业以及商汤、Plaud、Rokid 等 AI 明星公司的专家，分享 AI 落地实战经验。一起探索 AI 应用的更多可能，发掘 AI 驱动业务增长的新路径！

阿里云资深技术专家张凯已确认出席并发表题为《云原生 AI 支撑大模型服务落地的创新与实践》的主题分享。大模型算法和 AI 工程技术的发展日新月异，同时对 AI 基础设施的规模，效率和稳定性提出更多挑战。本话题将介绍，社区基于 Kubernetes、算力调度、数据编排、可观测、AI 网关和微服务等技术，在构建云原生 AI 基础设施方向的最新进展。并以 LLM 推理负载管理和模型服务化管理为例，讨论如何加速大模型能力高效落地，降低企业生产和使用 AI 的门槛。

张凯负责阿里云容器智算产品研发，多年云计算领域研发经历，深耕云原生技术在企业应用、微服务、AI、大数据、高性能计算等众多场景的落地。带领团队开拓云原生 AI 领域，创立 Fluid、Kube-Queue、GPUShare、Arena 等多个相关开源项目。他在本次会议的详细演讲内容如下：

演讲提纲：

大模型对 AI Infra 的挑战，云原生 AI 技术如何发展和应对
云原生 AI Infra 的架构和关键技术详解，介绍整体架构和主要技术
大规模 GPU 集群稳定性提升，如端到端的故障自愈体系
精细化 AI 算力可观测能力，如 GPU 监控和实时 Profiling 技术
高弹性 AI 数据处理流水线，如统一调度 Spark、Ray、Slurm on K8s 技术方案
数据缓存和模型冷启动优化，如 Fluid 数据集编排和访问加速技术
LLM 推理生产落地实践，利用云原生技术构建完整的 LLM 推理服务系统，适配 PD 分离等分布式推理架构，管理推理服务全生命周期，优化推理性能

听众收益：

了解通如何过优化数据访问速度，提升训练效率与推理服务性能
了解如何通过完善 GPU 可观测性和自动化故障处理机制，洞察 GPU 资源效率和 AI 任务性能的波动，以应对集群稳定性挑战
了解如何围绕新的 LLM 推理工作负载，构建完整的 LLM 模型服务架构和技术栈，帮助客户跨越从尝试大模型到生产使用的鸿沟

除此之外，本次大会还策划了AI Infra、AI 产品研发与商业落地探索、Agent 应用新范式与 MCP 生态实践、AI 驱动业务重塑与提效、智能硬件与具身智能创新实践、AI 原生时代的卓越架构治理、、多模态与空间智能技术创新、Agent + Data 落地探索、AI 赋能研发体系变革、Agent 核心技术与系统架构创新、大模型在金融领域的创新实践等 10 多个专题论坛，届时将有来自不同行业、不同领域、不同企业的 70+资深专家在 AICon 深圳站现场带来前沿技术洞察和一线实践经验。

现在报名即可以享受 9 折优惠，单张门票立省 580 元，详情可扫码或联系票务经理 13269078023 咨询。

评论

发布

暂无评论

开源分布式链路追踪对比

穿过生命散发芬芳

链路追踪 7月月更

查策，查策，python字体反爬再一次实践

梦想橡皮擦

Python 爬虫 7月月更

全新出品！Github总榜排行第七的SpringCloud生态全栈笔记我粉了

Java全栈架构师

Java 程序员面试微服务 SpringCloud

Docker安装Elasticsearch、ik分词器、可视化工具

Docker Elastic Stack 7月月更

做一个有职业操守的软件匠人

技术敏捷 TDD Agile

Vue Router 守卫

程序员海军

MySQL数据库索引

索引 7月月更

IntelliJ IDEA使用

【Go实现】实践GoF的23种设计模式：观察者模式

Go 设计模式观察者模式 Go 语言

一时跳槽一时爽，一直跳槽一直爽？

基于 Web SDK 实现视频通话场景 | 声网 SDK 教程

视频 SDK 教程

mysql进阶(十九)SQL语句如何精准查找某一时间段的数据

No Silver Bullet

MySQL 7月月更精确查找

接口测试

接口测试工具

自动驾驶产品化竞备开启：百度Apollo如何定义量产车？

springMvc参数获取

Java 7月月更

界面设计四大原则

设计模式 7月月更

Java开发环境配置 / Vscode搭建

攻城狮杰森

Java jdk 7月月更

节流和防抖的说明和实现

南极一块修炼千年的大冰块

参与开源社区还有证书拿？

玩转Devop和研发效能DevStream/DevLake

GitHub 开源开发者证书

图的存储结构与方法（二）

深入浅出边缘云 | 1. 概述

架构边缘计算网络深入浅出边缘云

7大专题详解SpringBoot，阿里这套SpringBoot全栈笔记真香

Java永远的神

Java 程序员面试程序人生 springboot

python小知识-代码规范最佳实践

7月月更 pyhon小知识

阿里onedate分层思想

奔向架构师

数据中台 7月月更

类的基础

OSI模型第一层：物理层，基石般的存在！

物理层网络技术 OSI模型 7月月更

多线程＆高并发（全网最新：面试题+导图+笔记）面试手稳心不慌

Java 编程多线程并发高并发系统资料分享

李宏毅《机器学习》丨7. Conclusion（总结）

作为一名后台开发人员，你必须知道的两种过滤器

C++后台开发

后台开发后端开发 Linux服务器开发 C/C++后台开发 C/C++开发

Protocol buffers 的问题和滥用

@Entity 里面的 JPA 注解