写点什么

云原生 AI 支撑大模型服务落地的创新与实践|AICon 深圳

  • 2025-07-23
    北京
  • 本文字数:1144 字

    阅读完需:约 4 分钟

大小:619.25K时长:03:31
云原生 AI 支撑大模型服务落地的创新与实践|AICon深圳

8 月 22 日 -23 日,首届AICon 全球人工智能开发与应用大会深圳站即将拉开帷幕。本次大会将聚焦 Agent、多模态、AI 产品设计等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自阿里、腾讯、字节跳动、微软、华为等头部企业以及商汤、Plaud、Rokid 等 AI 明星公司的专家,分享 AI 落地实战经验。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


阿里云资深技术专家张凯已确认出席并发表题为云原生 AI 支撑大模型服务落地的创新与实践的主题分享。大模型算法和 AI 工程技术的发展日新月异,同时对 AI 基础设施的规模,效率和稳定性提出更多挑战。本话题将介绍,社区基于 Kubernetes、算力调度、数据编排、可观测、AI 网关和微服务等技术,在构建云原生 AI 基础设施方向的最新进展。并以 LLM 推理负载管理和模型服务化管理为例,讨论如何加速大模型能力高效落地,降低企业生产和使用 AI 的门槛。



张凯负责阿里云容器智算产品研发,多年云计算领域研发经历,深耕云原生技术在企业应用、微服务、AI、大数据、高性能计算等众多场景的落地。带领团队开拓云原生 AI 领域,创立 Fluid、Kube-Queue、GPUShare、Arena 等多个相关开源项目。他在本次会议的详细演讲内容如下:

演讲提纲:

  1. 大模型对 AI Infra 的挑战,云原生 AI 技术如何发展和应对

  2. 云原生 AI Infra 的架构和关键技术详解,介绍整体架构和主要技术

    大规模 GPU 集群稳定性提升,如端到端的故障自愈体系

    精细化 AI 算力可观测能力,如 GPU 监控和实时 Profiling 技术

    高弹性 AI 数据处理流水线,如统一调度 Spark、Ray、Slurm on K8s 技术方案

    数据缓存和模型冷启动优化,如 Fluid 数据集编排和访问加速技术

  3. LLM 推理生产落地实践,利用云原生技术构建完整的 LLM 推理服务系统,适配 PD 分离等分布式推理架构,管理推理服务全生命周期,优化推理性能

听众收益:

  • 了解通如何过优化数据访问速度,提升训练效率与推理服务性能

  • 了解如何通过完善 GPU 可观测性和自动化故障处理机制,洞察 GPU 资源效率和 AI 任务性能的波动,以应对集群稳定性挑战

  • 了解如何围绕新的 LLM 推理工作负载,构建完整的 LLM 模型服务架构和技术栈,帮助客户跨越从尝试大模型到生产使用的鸿沟


除此之外,本次大会还策划了AI InfraAI 产品研发与商业落地探索Agent 应用新范式与 MCP 生态实践AI 驱动业务重塑与提效智能硬件与具身智能创新实践AI 原生时代的卓越架构治理、、多模态与空间智能技术创新Agent + Data 落地探索AI 赋能研发体系变革Agent 核心技术与系统架构创新大模型在金融领域的创新实践等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 70+资深专家在 AICon 深圳站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-07-23 12:215216

评论

发布
暂无评论

排查指南 | 当 mPaaS 小程序提示“应用更新错误(1001)”时

蚂蚁集团移动开发平台 mPaaS

小程序 问题排查 mPaaS

数字经济跨越五个融合发展阶段,区块链正成为基础支撑结构

CECBC

数字经济

读写分离这个坑,你应该踩过吧?

楼下小黑哥

MySQL 主从同步 读写分离

《Python深度学习》第二版重磅来袭——(Keras之父亲自编写)

计算机与AI

Windows下MySQL无法启动万能解决方案

MySQL从删库到跑路

MySQL

甲方日常 64

句子

工作 随笔杂谈 日常

Bitmap为什么那么快?

Man

redis 中间件

生产环境压测建设历程之三 淘宝网2009年的痛

数列科技杨德华

2. Spring早期类型转换,基于PropertyEditor实现

YourBatman

Spring Framework 类型转换 PropertyEditor

谷燕西:不需要银行的银行业务

CECBC

移动互联网

架构词典:语言

lidaobing

架构 语言

Spock单元测试框架实战指南四 - 异常测试

Java老k

Java 单元测试 spock

话题讨论 | 作为地地道道的程序员半年内都没摸过代码是什么样的体验?

xcbeyond

话题讨论

Redis 子进程开销监控和优化方式

李尚智

Redis开发与运维

Redis 持久化方式-RDB

李尚智

redis redis持久化

S型曲线不止关乎身材?|技术人应知的创新思维模型(2)

Alan

创新 思维模型

拆解增长黑客之实战(二):留存与变现

懒杨杨

读书 增长 产品运营

算法训练营课程纲要

陈皓07

第十一周作业

solike

5种分布式事务方案与阿里的 Seata 中间件

Bruce Duan

分布式事务 seata

基于有限状态机与消息队列的三方支付系统补单实践

Java架构师迁哥

Newbe.ObjectVisitor 0.4.4 发布,模型验证器上线

newbe36524

.net core ASP.NET Core dotnet

百篇已过,又是一个新篇章,谈谈感受吧

良知犹存

代码人生

「生产事故」MongoDB复合索引引发的灾难

Kerwin

数据库 mongodb

告别“效率内卷化”,华为用一年时间让职场人支棱起来

脑极体

国家计算机网络与信息安全管理中心官员:数字货币的风险仍需关注

CECBC

信息安全

第六周-学习总结

Mr_No爱学习

面试被问线程安全怎么保障,我的回答让面试官眼前一亮

996小迁

Java 架构 面试 多线程

警察营救安徽望江县17岁女生跳河自尽过程中,现场看热闹的旁观者们在做什么?

wbliu85

第六周-作业1

Mr_No爱学习

报销发票抵扣工资的CTO,该不该? | 法庭上的CTO(5)

赵新龙

CTO 法庭上的CTO

云原生 AI 支撑大模型服务落地的创新与实践|AICon深圳_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章