写点什么

云原生 AI 支撑大模型服务落地的创新与实践|AICon 深圳

  • 2025-07-23
    北京
  • 本文字数:1144 字

    阅读完需:约 4 分钟

大小:619.25K时长:03:31
云原生 AI 支撑大模型服务落地的创新与实践|AICon深圳

8 月 22 日 -23 日,首届AICon 全球人工智能开发与应用大会深圳站即将拉开帷幕。本次大会将聚焦 Agent、多模态、AI 产品设计等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自阿里、腾讯、字节跳动、微软、华为等头部企业以及商汤、Plaud、Rokid 等 AI 明星公司的专家,分享 AI 落地实战经验。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


阿里云资深技术专家张凯已确认出席并发表题为云原生 AI 支撑大模型服务落地的创新与实践的主题分享。大模型算法和 AI 工程技术的发展日新月异,同时对 AI 基础设施的规模,效率和稳定性提出更多挑战。本话题将介绍,社区基于 Kubernetes、算力调度、数据编排、可观测、AI 网关和微服务等技术,在构建云原生 AI 基础设施方向的最新进展。并以 LLM 推理负载管理和模型服务化管理为例,讨论如何加速大模型能力高效落地,降低企业生产和使用 AI 的门槛。



张凯负责阿里云容器智算产品研发,多年云计算领域研发经历,深耕云原生技术在企业应用、微服务、AI、大数据、高性能计算等众多场景的落地。带领团队开拓云原生 AI 领域,创立 Fluid、Kube-Queue、GPUShare、Arena 等多个相关开源项目。他在本次会议的详细演讲内容如下:

演讲提纲:

  1. 大模型对 AI Infra 的挑战,云原生 AI 技术如何发展和应对

  2. 云原生 AI Infra 的架构和关键技术详解,介绍整体架构和主要技术

    大规模 GPU 集群稳定性提升,如端到端的故障自愈体系

    精细化 AI 算力可观测能力,如 GPU 监控和实时 Profiling 技术

    高弹性 AI 数据处理流水线,如统一调度 Spark、Ray、Slurm on K8s 技术方案

    数据缓存和模型冷启动优化,如 Fluid 数据集编排和访问加速技术

  3. LLM 推理生产落地实践,利用云原生技术构建完整的 LLM 推理服务系统,适配 PD 分离等分布式推理架构,管理推理服务全生命周期,优化推理性能

听众收益:

  • 了解通如何过优化数据访问速度,提升训练效率与推理服务性能

  • 了解如何通过完善 GPU 可观测性和自动化故障处理机制,洞察 GPU 资源效率和 AI 任务性能的波动,以应对集群稳定性挑战

  • 了解如何围绕新的 LLM 推理工作负载,构建完整的 LLM 模型服务架构和技术栈,帮助客户跨越从尝试大模型到生产使用的鸿沟


除此之外,本次大会还策划了AI InfraAI 产品研发与商业落地探索Agent 应用新范式与 MCP 生态实践AI 驱动业务重塑与提效智能硬件与具身智能创新实践AI 原生时代的卓越架构治理、、多模态与空间智能技术创新Agent + Data 落地探索AI 赋能研发体系变革Agent 核心技术与系统架构创新大模型在金融领域的创新实践等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 70+资深专家在 AICon 深圳站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-07-23 12:215255

评论

发布
暂无评论

如何用一个端口同时暴露 HTTP1/2、gRPC、Dubbo 协议?

阿里巴巴云原生

阿里云 云原生 dubbo

「硬核实操」如何拥有一个自己的数字人模型

京东科技开发者

京东云 数字人 企业号 4 月 PK 榜

极客时间运维进阶训练营第十九周作业

忙着长大#

Python:如何写输入与输出

强劲九

Python

Java异常处理和最佳实践(含案例分析)

阿里巴巴云原生

Java 阿里云 云原生 JVM

Spring Cloud Alibaba 应用如何平滑迁移至 IPv6?

阿里巴巴云原生

阿里云 云原生 Spring Cloud Aliababa

Go flag 标准库源码解读

江湖十年

后端 命令行 Go 语言

自动化测试理解

测试 自动化测试

超级视频播放器:nPlayer for Macv1.4.0中文激活版

真大的脸盆

Mac Mac 系统 视频播放器 视频播放 视频播放软件

全栈声明式可观测:KubeVela 开箱即用且灵活定制的云原生应用洞察

阿里巴巴云原生

阿里云 开源 云原生 KubeVela

声明式编程:by example

agnostic

声明式

提升集群吞吐量与稳定性的秘诀: Dubbo 自适应负载均衡与限流策略实现解析

阿里巴巴云原生

阿里云 开源 云原生 dubbo

故障处理与自动驾驶(63/100)

hackstoic

架构设计

​openEuler 23.03 正式发布,聚集社区创新力量,增强基础技术能力,协同全场景创新

openEuler

Linux 运维 操作系统 openEuler 桌面开发

极客时间运维进阶训练营第二十周作业

忙着长大#

MySql序号递增

源字节1号

软件开发 小程序开发

Low-Code,一定“low”吗?

京东科技开发者

低代码 京东云 京东技术 京东科技 企业号 4 月 PK 榜

释放商业潜力:掌握成功IT数字化转型的三大关键

L3C老司机

数字化转型 工程效能 业务赋能 胜任力 IT咨询

我没能实现始终在一个线程上运行 task

newbe36524

C#

【原理揭秘】Vite 是怎么兼容老旧浏览器的?你以为仅仅依靠 Babel?

京东科技开发者

前端 企业号 4 月 PK 榜

阿里架构师花近十年时间整理出来的Java核心知识pdf(Java岗)

Java你猿哥

Java java面试 Java工程师 Java面经 春招

架构训练营 - 模块八作业

Sam

架构实战营

极客时间运维进阶训练营第二十一周作业

忙着长大#

Activity登堂入室

芯动大师

windows Activity View

SSD 存储领域厂商大普微加入龙蜥社区,完成与龙蜥操作系统适配

OpenAnolis小助手

开源 操作系统 龙蜥社区 CLA 大普微

PyTorch深度学习实战 | 预测工资——线性回归

TiAmo

深度学习 线性回归 PyTorch 梯度下降法

5 分钟读懂开源服务框架 Dubbo 及其最新规划

阿里巴巴云原生

阿里云 云原生 dubbo

想拿到10k-40k的offer,这些技能必不可少!作为程序员的你了解吗

Java你猿哥

Java 面试 架构师 面经 Java工程师

Spring探索丨既生@Resource,何生@Autowired?

阿里巴巴云原生

spring 阿里云 云原生

前端里那些你不知道的事儿之 【window.onload】

京东科技开发者

前端 京东云 京东技术 京东科技 企业号 4 月 PK 榜

云原生 AI 支撑大模型服务落地的创新与实践|AICon深圳_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章