9 月 13 日,2025 Inclusion・外滩大会「开源嘉年华」正在限量报名中! 了解详情
写点什么

开源赤兔推理引擎助力国产算力突破 FP8 挑战|AICon 北京

  • 2025-06-10
    北京
  • 本文字数:1018 字

    阅读完需:约 3 分钟

大小:576.01K时长:03:16
开源赤兔推理引擎助力国产算力突破FP8挑战|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


清程极智 CEO 汤雄超已确认出席并发表题为《开源赤兔推理引擎助力国产算力突破FP8挑战》的主题分享。随着国产大模型技术的快速发展,如何利用国产算力芯片高效部署和运行这些模型成为关键问题。当前,FP8 精度模型的推理高度依赖英伟达 Hopper 架构 GPU,这使得国内企业在部署时面临硬件成本高昂、依赖进口芯片等困境。为解决这一问题,清程极智与清华团队联合开源了赤兔推理引擎,本次演讲将分享赤兔推理引擎如何通过底层技术革新,实现了在非英伟达 Hopper 架构 GPU 及各类国产芯片上原生运行 FP8 精度模型,并确保模型精度无损。



汤雄超现任清程极智 CEO。2019 年博士毕业于清华计算机系。主要研究领域为性能分析及性能优化、并行计算、异构计算、集群资源调度等。发表 CCF-A 类论文十余篇,申请发明专利十余项。他在本次会议的详细演讲内容如下:


演讲提纲

1. 赤兔推理引擎的诞生背景

  • 问题的提出

  • 合作与开源

2. 赤兔推理引擎的核心技术革新

  • 介绍赤兔推理引擎的底层技术框架

  • 如何实现对不同架构芯片的适配

3. 关键技术创新点

  • 在非英伟达 Hopper 架构 GPU 上的优化策略

  • 针对国产芯片的定制化开发

  • 确保 FP8 精度模型的无损运行

  • 通过技术手段降低硬件成本,提升部署效率

4. 赤兔推理引擎的实践与效果

  • 在非英伟达 H 系列 GPU 芯片上运行 FP8 精度模型的案例

  • 对比使用赤兔推理引擎前后的性能提升和成本降低

5. 行业意义和未来规划

  • 对国产大模型部署的推动作用

  • 对自主可控算力生态的贡献

  • 未来技术发展方向和行业合作倡议


您认为,这样的技术在实践过程中有哪些痛点?

  • 适配不同国产芯片需要时间。


听众收益

  • 有限硬件资源下的大模型推理取舍

  • 赤兔软 FP8 方案:软件工程优化弥补硬件不足


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-10 15:003438

评论

发布
暂无评论

自动化测试之模拟器控制

霍格沃兹测试开发学社

gitlab 服务端 hook, 拦截糟糕的提交到仓库

霍格沃兹测试开发学社

软件测试/测试开发丨Python 模块与包 学习笔记

测试人

Python 程序员 软件测试 自动化测试 测试开发

Serverless 应用托管助力企业加速创新

阿里巴巴云原生

阿里云 Serverless 云原生

智能多通道系统实现消息推送更智能更高效

MobTech袤博科技

前端 前端开发 消息推送 APP开发

Docker 搭建Web服务器nginx

霍格沃兹测试开发学社

K8s 常见面试题

互联网工科生

Kubernetes k8s

k8s中无声的性能杀手:cpu thorttling(限流)

摸鱼编程

k8s 性能 高并发

Appium WebView 技术原理

霍格沃兹测试开发学社

APP自动化之Toast识别

霍格沃兹测试开发学社

Docker 搭建性能监控平台

霍格沃兹测试开发学社

mutex vs atomic

Geek_44385e

Atomic mutex 互斥锁

腾讯云 CODING 荣获 TiD 质量竞争力大会 2023 软件研发优秀案例

CODING DevOps

App自动化控件定位

霍格沃兹测试开发学社

小灯塔系列-中小企业数字化转型系列研究——MICE测评报告

向量智库

计算机网络知识,一文搞定

霍格沃兹测试开发学社

TestNG 与 Junit如何选择

霍格沃兹测试开发学社

LCR 089. 打家劫舍

红袖添香

动态规划 力扣 打家劫舍

Andriod微信小程序自动化测试

霍格沃兹测试开发学社

java程序员应该知道的k8s容器资源申请攻略

摸鱼编程

Java 容器 k8s JVM

web自动化解决文件上传和弹框

霍格沃兹测试开发学社

Postman做 接口自动化测试

霍格沃兹测试开发学社

google borg(k8s亲爹) 论文读后感

摸鱼编程

k8s Google borg

2023-08-18:用go写算法。你会得到一个字符串 text, 你应该把它分成 k 个子字符串 (subtext1, subtext2,…, subtextk)。 要求满足: subtexti 是

福大大架构师每日一题

福大大架构师每日一题

LLM 落地电商行业的最佳实践来了?Zilliz X AWS 有话说

Zilliz

AWS Zilliz 向量数据库 电商行业 大模型落地

开放原子开源基金会六、七月新增捐赠人

开放原子开源基金会

开源

Docker 容器技术与常用命令

霍格沃兹测试开发学社

OpenCloudOS WOW 活动上线啦!千份社区好礼等你来拿!

OpenCloudOS

操作系统

APP自动化如何使用参数化用例

霍格沃兹测试开发学社

数据库变革:HashData云数仓实现事务级实时性

酷克数据HashData

开源赤兔推理引擎助力国产算力突破FP8挑战|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章