AICon 北京站 Keynote 亮点揭秘,想了解 Agent 智能体来就对了! 了解详情
写点什么

GMI Cloud 全球化高性能分布式推理服务构建实践|AICon 上海

  • 2025-04-25
    北京
  • 本文字数:1004 字

    阅读完需:约 3 分钟

大小:551.96K时长:03:08
GMI Cloud 全球化高性能分布式推理服务构建实践|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


GMI Cloud 亚太区总裁 King 已确认出席 AICon 上海并在企业全球化发展的策略路径专题发表题为《GMI Cloud 全球化高性能分布式推理服务构建实践》的主题分享。AI 应用全球化浪潮下, 推理效率与算力供给成为破局关键。本次演讲以 GMI Cloud Inference Engine 为锚点,拆解其高并发、低延迟、动态扩缩容能力如何支撑全球 AI 业务爆发,深度分享 GMI Cloud 自研推理平台的架构设计、跨区域合规部署及软硬协同优化实践,揭秘其实现推理成本、指数级效率提升的关键路径。


GMI Cloud 亚太区总裁 King 拥有 14+ 年云计算经验,历经产品研发、解决方案、销售管理。是前阿里云资深总监,带领团队完成年销售额数百亿 RMB;中国云计算早期开拓者,前百度云创始团队成员。不仅拥有丰富且敏锐的商业洞察力和丰富的行业解决方案经验,还拥有深刻的云计算技术理解力和发展趋势判断力。他在本次会议的详细演讲内容如下:


演讲提纲:

1. AI 应用爆发背景下模型推理服务的核心挑战分析

2. GMI Cloud 推理优化技术分享

  • 单集群内推理服务自动扩容技术

  • 跨集群跨地区的推理服务自动扩容技术

  • 单集群的 PD 分离技术

  • 基于共享持久化存储的跨集群 PD 分离技术

  • 推理参数自动化评测工具介绍

  • 推理服务全面主动监控技术

  • 推理服务的自动容错恢复

3. GMI Cloud Inference Engine 落地实践


听众收益:

  • 明晰 AI 应用爆发时,模型推理服务在效率与算力上存在核心挑战

  • 深度了解 GMI Cloud 的推理优化技术,如自动扩容、PD 分离、评测监控及容错恢复等

  • 知悉 GMI Cloud Inference Engine 如何动态应对高并发,保障数据处理,精准评估与监控推理服务

  • 复制 GMI Cloud Inference Engine 的优秀实践到自身业务中


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-25 09:005408

评论

发布
暂无评论

DirectX 修复工具增强版:Direct 官方中文修复利器免费下载

小焱

dll DLL库 directx directx不兼容 dll缺失

就医体验飙升的背后,是CPU在“悄悄打工”?

E科讯

【6.12 直播】内存泄漏怎么办?时序数据库 IoTDB 官方避坑指南“面对面”告诉你!

Apache IoTDB

HTAP 技术:融合事务与分析的数据处理新范式

镜舟科技

OLAP OLTP HTAP 数据库架构 实时分析

摩尔线程重磅亮相2025北京智源大会,传递国产算力发展加速度

新消费日报

组件库实战-基建思路

溪抱鱼

typescript Vue Rest

腾讯云TencentOS Server AI,助力荣耀打造高性能AI底座

极客天地

懒懒笔记 | 课代表带你梳理【RAG课程 11&12:优化和加速你的RAG】

商汤万象开发者

AI LLM rag实战

AI实时对话开启粉丝互动新时代

腾讯云音视频

人工智能 腾讯云 实时音视频 trtc AI实时对话

短信验证码服务最佳实践:个人开发者如何选择和集成现代化短信服务

外滩运维专家

Framework失败问题,全面整理.NET Framework 各种安装失败及异常情况

小焱

Framework

实时多模态如何重塑未来交互?我们邀请 Gemini 解锁了 39 个实时互动新可能丨Voice Agent 学习笔记

声网

焱融存储成为 AMD 中国行业生态共建计划首批合作伙伴

焱融科技

人工智能 AMD AMD EPYC 处理器 焱融全闪存储

鸿蒙Next仓颉语言开发实战教程:店铺详情页

幽蓝计划

AWS EKS 集群日志上报观测云实践

观测云

aws lambda

中烟创新智能稽核平台:为烟草行业定制的数字化风控引擎

中烟创新

DJ舞台设计:重塑电子音乐体验

Dylan

Dj LED显示屏 全彩LED显示屏 led显示屏厂家 舞台表演

加速数字化转型:低代码平台在关键业务领域的四大高效落地场景

不在线第一只蜗牛

低代码

报名启动|隐语开源社区Meetup大湾区站 x 数据安全沙龙来啦

隐语SecretFlow

数据安全 隐私计算 数据流通 数据要素流通

2025全球人形机器人领域深度报告:人形机器人、具身智能技术、商业化壁垒、产业链公司及投资分析

机器人头条

科技 大模型 人形机器人 具身智能

吴恩达:AI 被过度炒作,但语音 AI 产品却被低估;ChatGPT 升级语音翻译功能丨日报

声网

准确率从 19% 提升至 95%!文本审核模型优化的三个阶段实践(下)

亚马逊云科技 (Amazon Web Services)

图解JavaScript原型:原型链及其分析 | JavaScript图解

电子尖叫食人鱼

JavaScript

华为云重磅亮相 KubeCon China 2025 ! 精彩议程一览

华为云开源

开源 云原生 华为云

2026深圳电子展,中国(深圳)国际电子信息展览会

AIOTE智博会

电子展 深圳电子展 电子信息展 电博会

4种比常见的线程池和线程同步买票问题

量贩潮汐·WholesaleTide

Java Python

BOE(京东方)“照亮成长路”公益项目新十年启幕 科技无界照亮美好未来

科技热闻

小程序容器驱动SuperApp生态:下一代前端技术范式

xuyinyin

BaikalDB 架构演进实录:打造融合向量化与 MPP 的 HTAP 查询引擎

百度Geek说

MPP 分布式数据 MPP 架构 向量化引擎

ES Serverless 8.17王牌发布:向量检索「火力全开」,智能扩缩「秒级响应」!

阿里云大数据AI技术

大数据 运维 数据处理 Server 向量检索

内网IM选型逻辑:企业为何青睐自研或外采私有化IM

BeeWorks

即时通讯 IM

GMI Cloud 全球化高性能分布式推理服务构建实践|AICon 上海_云计算_AICon 全球人工智能开发与应用大会_InfoQ精选文章