10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

GMI Cloud 全球化高性能分布式推理服务构建实践|AICon 上海

  • 2025-04-25
    北京
  • 本文字数:1004 字

    阅读完需:约 3 分钟

大小:551.96K时长:03:08
GMI Cloud 全球化高性能分布式推理服务构建实践|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


GMI Cloud 亚太区总裁 King 已确认出席 AICon 上海并在企业全球化发展的策略路径专题发表题为《GMI Cloud 全球化高性能分布式推理服务构建实践》的主题分享。AI 应用全球化浪潮下, 推理效率与算力供给成为破局关键。本次演讲以 GMI Cloud Inference Engine 为锚点,拆解其高并发、低延迟、动态扩缩容能力如何支撑全球 AI 业务爆发,深度分享 GMI Cloud 自研推理平台的架构设计、跨区域合规部署及软硬协同优化实践,揭秘其实现推理成本、指数级效率提升的关键路径。


GMI Cloud 亚太区总裁 King 拥有 14+ 年云计算经验,历经产品研发、解决方案、销售管理。是前阿里云资深总监,带领团队完成年销售额数百亿 RMB;中国云计算早期开拓者,前百度云创始团队成员。不仅拥有丰富且敏锐的商业洞察力和丰富的行业解决方案经验,还拥有深刻的云计算技术理解力和发展趋势判断力。他在本次会议的详细演讲内容如下:


演讲提纲:

1. AI 应用爆发背景下模型推理服务的核心挑战分析

2. GMI Cloud 推理优化技术分享

  • 单集群内推理服务自动扩容技术

  • 跨集群跨地区的推理服务自动扩容技术

  • 单集群的 PD 分离技术

  • 基于共享持久化存储的跨集群 PD 分离技术

  • 推理参数自动化评测工具介绍

  • 推理服务全面主动监控技术

  • 推理服务的自动容错恢复

3. GMI Cloud Inference Engine 落地实践


听众收益:

  • 明晰 AI 应用爆发时,模型推理服务在效率与算力上存在核心挑战

  • 深度了解 GMI Cloud 的推理优化技术,如自动扩容、PD 分离、评测监控及容错恢复等

  • 知悉 GMI Cloud Inference Engine 如何动态应对高并发,保障数据处理,精准评估与监控推理服务

  • 复制 GMI Cloud Inference Engine 的优秀实践到自身业务中


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-25 09:005541

评论

发布
暂无评论

企业app软件定制开发的重点是什么?|小程序网站搭建

Geek_16d138

网站建设 小程序开发 app定制开发

Util应用框架基础(七)- 缓存

何镇汐

开源 后端 .net core

Util应用框架基础(七)- 本地缓存

何镇汐

开源 后端 .net core

软件测试/人工智能丨引领未来:软件测试中的人工智能

测试人

人工智能 软件测试

Camunda、Activiti、Flowable等各大工作流对比选择

小狗围观科幻

Util应用框架基础(七)- Redis 缓存

何镇汐

开源 后端 .net core

影视行业如何远程完整快速传输大文件?

镭速

传输大文件

Java多线程消费消息

不在线第一只蜗牛

Java 多线程 RocketM

技术分享| anyRTC之RTN网络

anyRTC开发者

音视频 网络 RTC RTN

JNPF开发平台凭什么火?

互联网工科生

低代码 JNPF

最新demo版|如何0-1开发支付宝小程序之如何调试小程序(二)

盐焗代码虾

支付宝小程序 小程序调试 如何调试

Util应用框架基础(七)- API

何镇汐

开源 后端 .net core

2G内存搞定一亿数据的分析引擎

Western Panda

数据库 大数据 开源 数据分析 OLAP

文心一言 VS 讯飞星火 VS chatgpt (140)-- 算法导论11.4 5题

福大大架构师每日一题

福大大架构师每日一题

云桌面架构的全面剖析

青椒云云电脑

云桌面 云桌面解决方案 云桌面系统

这6个复盘模型,你知道几个?让你轻松搞定年终总结

彭宏豪95

个人成长 复盘 年终总结 在线白板 项目复盘

软件测试/人工智能丨视觉与图像识别在自动化测试领域的应用

测试人

人工智能 软件测试

区块链开发公司

区块链技术

Util应用框架基础(七)- 二级缓存

何镇汐

开源 后端 .net core

国内外传输大文件有哪些好用又便宜的文件传输工具?

镭速

传输大文件 文件传输工具 国内外传输大文件

杜绝硬编码,为系统安全保驾护航

尚思卓越

网络安全 硬编码 内嵌账号

青椒云云桌面系统_企业上云桌面云服务解决方案

青椒云云电脑

云桌面 云桌面解决方案 云桌面系统

Util应用框架开发环境搭建(十)- 安装 Redis

何镇汐

开源 后端 .net core

GMI Cloud 全球化高性能分布式推理服务构建实践|AICon 上海_云计算_AICon 全球人工智能开发与应用大会_InfoQ精选文章