2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

开源赤兔推理引擎助力国产算力突破 FP8 挑战|AICon 北京

  • 2025-06-10
    北京
  • 本文字数:1018 字

    阅读完需:约 3 分钟

大小:576.01K时长:03:16
开源赤兔推理引擎助力国产算力突破FP8挑战|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


清程极智 CEO 汤雄超已确认出席并发表题为《开源赤兔推理引擎助力国产算力突破FP8挑战》的主题分享。随着国产大模型技术的快速发展,如何利用国产算力芯片高效部署和运行这些模型成为关键问题。当前,FP8 精度模型的推理高度依赖英伟达 Hopper 架构 GPU,这使得国内企业在部署时面临硬件成本高昂、依赖进口芯片等困境。为解决这一问题,清程极智与清华团队联合开源了赤兔推理引擎,本次演讲将分享赤兔推理引擎如何通过底层技术革新,实现了在非英伟达 Hopper 架构 GPU 及各类国产芯片上原生运行 FP8 精度模型,并确保模型精度无损。



汤雄超现任清程极智 CEO。2019 年博士毕业于清华计算机系。主要研究领域为性能分析及性能优化、并行计算、异构计算、集群资源调度等。发表 CCF-A 类论文十余篇,申请发明专利十余项。他在本次会议的详细演讲内容如下:


演讲提纲

1. 赤兔推理引擎的诞生背景

  • 问题的提出

  • 合作与开源

2. 赤兔推理引擎的核心技术革新

  • 介绍赤兔推理引擎的底层技术框架

  • 如何实现对不同架构芯片的适配

3. 关键技术创新点

  • 在非英伟达 Hopper 架构 GPU 上的优化策略

  • 针对国产芯片的定制化开发

  • 确保 FP8 精度模型的无损运行

  • 通过技术手段降低硬件成本,提升部署效率

4. 赤兔推理引擎的实践与效果

  • 在非英伟达 H 系列 GPU 芯片上运行 FP8 精度模型的案例

  • 对比使用赤兔推理引擎前后的性能提升和成本降低

5. 行业意义和未来规划

  • 对国产大模型部署的推动作用

  • 对自主可控算力生态的贡献

  • 未来技术发展方向和行业合作倡议


您认为,这样的技术在实践过程中有哪些痛点?

  • 适配不同国产芯片需要时间。


听众收益

  • 有限硬件资源下的大模型推理取舍

  • 赤兔软 FP8 方案:软件工程优化弥补硬件不足


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-10 15:001

评论

发布
暂无评论

面试官:order by 是怎样排序的?怎么优化?

一个优秀的废人

Java MySQL 数据库 后端 order by

膜拜!阿里内部都在强力进阶学习springboot实战派文档

Java spring 程序员 架构 面试

了解一下缓存分类、更新、清理策略以及如何处理缓存带来的风险

Jokay

缓存 缓存穿透 缓存击穿 缓存雪崩 缓存设计

干掉 Postman?测试接口直接生成API文档,这个工具贼好用

程序员小富

Java 编程 程序员 开发工具 大学生

深度解析HashMap底层实现架构

华为云开发者联盟

Java hashmap 底层 底层架构 Map接口

网络攻防学习笔记 Day76

穿过生命散发芬芳

网络攻防 7月日更

HarmonyOS Connect伙伴峰会重庆站举办 生态建设持续完善

科技汇

WorkPlus综合企业数字化解决方案—华侨城

BeeWorks

企业 移动开 开源软件

名列GitHub必看榜!腾讯架构师纯手敲Spring Boot高级进阶笔记

Java架构追梦

Java 架构 腾讯 面试 springboot

国内首发!阿里高工手码分布式系统速成笔记!

Java 编程 程序员

Gemini Mining双子矿业系统APP开发模板

【从零开始学爬虫】采集京东商品信息

前嗅大数据

大数据 爬虫 数据采集 采集商城 采集京东

阿里云低延时直播 RTS 能力升级 让直播推流效果更佳

阿里云CloudImagine

阿里云 音视频 直播技术 视频云

Ubuntu Server 20.04搭建Redis集群

玏佾

redis redis集群 搭建 redis cluster

电脑有什么超简单的录屏方法

淋雨

视频剪辑 Camtasia 录屏软件

BTAU比特金盾系统软件开发内容

喜讯:恒拓高科荣获“2020年度华侨城集团优秀数字化服务商”称号

BeeWorks

开源 解决方案 即时通讯 开源软件

Redis on AEP 实践

BUG侦探

redis 傲腾AEP

从Encoder-Decoder模型入手,探索语境偏移解决之道

华为云开发者联盟

神经网络 ASR 语境偏移 CLAS ASR模型

华为首次发布HarmonyOS职业认证,助力开发者实现职业进阶

科技汇

PHA挖矿|PHA云算力挖矿系统开发案例

Geek_23f0c3

区块链 云算力挖矿系统开发详解 PHA矿机挖矿

10分钟理解REACT概念

加百利

React 7月日更

我可以减肥失败,但我的 Docker 镜像一定要瘦身成功!

尔达Erda

Docker 开源 云原生 镜像 瘦身

北鲲云超算与传统的超算中心有什么不同?

北鲲云

科创人|决策易赵祝维:从满足应用需求到服务业务目标,从SaaS服务商到业务合作伙伴

科创人

优评海洋APP系统开发模板

差点跳起来了!阿里首推22w字Java面试复盘宝典成功助我入职美团

白亦杨

Java 编程 程序员

WorkPlus高端制造业数字化解决方案—中集集团

BeeWorks

企业 即时通讯 协同办公 开源软件

事件Event:带你体验鸿蒙轻内核中一对多、多对多任务同步

华为云开发者联盟

鸿蒙 任务 OpenHarmony 事件 LiteOS-M

视觉生产技术入门篇

若尘

视觉 7月日更

商业智能BI,会成为下一个风口吗?

瓴羊企业智能服务

阿里云 数据中台 数据分析 BI 商业智能

开源赤兔推理引擎助力国产算力突破FP8挑战|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章