阿里云ODPS普惠算力再升级,Data+AI全产品降价低至59元! 了解详情
写点什么

云原生 AI 支撑大模型服务落地的创新与实践|AICon 深圳

  • 2025-07-23
    北京
  • 本文字数:1144 字

    阅读完需:约 4 分钟

大小:619.25K时长:03:31
云原生 AI 支撑大模型服务落地的创新与实践|AICon深圳

8 月 22 日 -23 日,首届AICon 全球人工智能开发与应用大会深圳站即将拉开帷幕。本次大会将聚焦 Agent、多模态、AI 产品设计等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自阿里、腾讯、字节跳动、微软、华为等头部企业以及商汤、Plaud、Rokid 等 AI 明星公司的专家,分享 AI 落地实战经验。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


阿里云资深技术专家张凯已确认出席并发表题为云原生 AI 支撑大模型服务落地的创新与实践的主题分享。大模型算法和 AI 工程技术的发展日新月异,同时对 AI 基础设施的规模,效率和稳定性提出更多挑战。本话题将介绍,社区基于 Kubernetes、算力调度、数据编排、可观测、AI 网关和微服务等技术,在构建云原生 AI 基础设施方向的最新进展。并以 LLM 推理负载管理和模型服务化管理为例,讨论如何加速大模型能力高效落地,降低企业生产和使用 AI 的门槛。



张凯负责阿里云容器智算产品研发,多年云计算领域研发经历,深耕云原生技术在企业应用、微服务、AI、大数据、高性能计算等众多场景的落地。带领团队开拓云原生 AI 领域,创立 Fluid、Kube-Queue、GPUShare、Arena 等多个相关开源项目。他在本次会议的详细演讲内容如下:

演讲提纲:

  1. 大模型对 AI Infra 的挑战,云原生 AI 技术如何发展和应对

  2. 云原生 AI Infra 的架构和关键技术详解,介绍整体架构和主要技术

    大规模 GPU 集群稳定性提升,如端到端的故障自愈体系

    精细化 AI 算力可观测能力,如 GPU 监控和实时 Profiling 技术

    高弹性 AI 数据处理流水线,如统一调度 Spark、Ray、Slurm on K8s 技术方案

    数据缓存和模型冷启动优化,如 Fluid 数据集编排和访问加速技术

  3. LLM 推理生产落地实践,利用云原生技术构建完整的 LLM 推理服务系统,适配 PD 分离等分布式推理架构,管理推理服务全生命周期,优化推理性能

听众收益:

  • 了解通如何过优化数据访问速度,提升训练效率与推理服务性能

  • 了解如何通过完善 GPU 可观测性和自动化故障处理机制,洞察 GPU 资源效率和 AI 任务性能的波动,以应对集群稳定性挑战

  • 了解如何围绕新的 LLM 推理工作负载,构建完整的 LLM 模型服务架构和技术栈,帮助客户跨越从尝试大模型到生产使用的鸿沟


除此之外,本次大会还策划了AI InfraAI 产品研发与商业落地探索Agent 应用新范式与 MCP 生态实践AI 驱动业务重塑与提效智能硬件与具身智能创新实践AI 原生时代的卓越架构治理、、多模态与空间智能技术创新Agent + Data 落地探索AI 赋能研发体系变革Agent 核心技术与系统架构创新大模型在金融领域的创新实践等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 70+资深专家在 AICon 深圳站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-07-23 12:212049

评论

发布
暂无评论
发现更多内容

使用 Python 和 mitmproxy 实现基于队列的路径管理

IT蜗壳-Tango

SpringBoot 使用 Sa-Token 完成注解鉴权功能

Java spring Sa-Token

机器学习服务语音合成,解锁智能养娃新趋势

HarmonyOS SDK

HMS Core

生态伙伴 | 硬创大赛新起航!携手华强科创广场,助力硬科技创业者

华秋电子

赋能企业数智转型新动力,迈向票据等分化新时代

用友BIP

元宇宙链游系统软件开发

Congge420

硬科技,创未来!第十五届深创赛福田预选赛-华秋第九届硬创大赛正式启幕

华秋电子

EhViewer软件2023最新白色版中文语言

ehviewer

EhViewer

海量主机自动化运维软件用哪款好?具体功能有哪些?

行云管家

主机 云主机 自动化运维

基于Sentinel自研组件的系统限流、降级、负载保护最佳实践探索 | 京东云技术团队

京东科技开发者

开源 京东云 企业号 5 月 PK 榜

包管理工具:pnpm | 京东云技术团队

京东科技开发者

京东云 pnpm 企业号 5 月 PK 榜

【AI思维空间】ChatGPT纵横编程世界,点亮智慧火花 | 京东云技术团队

京东科技开发者

人工智能 京东云 ChatGPT 企业号 5 月 PK 榜

IPv6定义以及优势说明-行云管家

行云管家

网络 ipv6

限速神器RateLimiter源码解析 | 京东云技术团队

京东科技开发者

限流算法 京东云 企业号 5 月 PK 榜

从前后端的角度分析options预检请求

华为云开发者联盟

前端 开发 华为云 华为云开发者联盟 企业号 5 月 PK 榜

LP流动性质押挖矿系统软件开发

Congge420

央国企数字化转型 6 大挑战如何应对?中国信通院 IOMM 方法论提 6 点参考对策

信通院IOMM数字化转型团队

数字化转型 IOMM 央国企数字化转型

Python从零到壹丨详解图像锐化Roberts、Prewitt算子实现边缘检测

华为云开发者联盟

人工智能 华为云 图像 华为云开发者联盟 企业号 5 月 PK 榜

本周精彩!关于 Linux 内核宕机和超融合 Kata 虚拟化容器技术介绍 | 第 77-78 期

OpenAnolis小助手

开源 云原生 系统运维 龙蜥大讲堂 浪潮

高效联调,可靠发布!华为云推出CodeArts Release发布管理服务

华为云开发者联盟

云计算 开发工具 华为云 华为云开发者联盟 企业号 5 月 PK 榜

一种通用的业务监控触发方案设计 | 京东云技术团队

京东科技开发者

京东云 业务监控 企业号 5 月 PK 榜

TOB行业头条专访伙伴云CEO戴志康:GPT带来的AIGC热潮,改造了低代码?

联营汇聚

JMeter笔记6 | JMeter录制(配置代理)

测试 Jmeter 性能测试 自动化测试 接口测试

即时通讯技术文集(第15期):IM跨平台和社交软件红包技术 [共19篇]

JackJiang

网络编程 即时通信 即时通讯IM

MobLink 创建应用

MobTech袤博科技

FEELM在英国发布全新升级一次性解决方案,思摩尔打造增长新引擎

科技热闻

Java开发实践:合理使用线程池及线程变量

阿里技术

Java 线程池

Midjourney|文心一格prompt教程[基础篇]:注册使用教程、风格设置、参数介绍、隐私模式等

汀丶人工智能

人工智能 深度学习 ChatGPT MidJourney prompt learning

消息推送平台有没有保证数据不丢?

刷Github时发现了一本阿里大神的算法笔记!标星70.5K

Java 数据结构 算法 LeetCode

云原生 AI 支撑大模型服务落地的创新与实践|AICon深圳_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章