写点什么

昇腾 DeepSeek 大模型推理架构|AICon 北京

  • 2025-06-10
    北京
  • 本文字数:931 字

    阅读完需:约 3 分钟

大小:520.32K时长:02:57
昇腾DeepSeek大模型推理架构|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


华为昇腾架构师王建辉已确认出席并发表题为《昇腾DeepSeek大模型推理架构》的主题分享。在大模型加速部署进入深水区的今天,如何在国产算力平台上高效运行大模型,已成为影响应用落地的重要一环。本次分享将介绍昇腾 DeepSeek 大模型推理架构,性能优化方案及关键优化措施,以及优化建议。



华为计算产品线昇腾推理架构师王建辉,主要从事昇腾计算推理产品架构设计与竞争力规划,擅长技术领域包括软硬件协同设计,系统性能优化及实时计算。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景缘由

  • 大模型推理的计算挑战:参数规模持续增长带来的推理延迟、资源瓶颈问题

  • 国产算力平台的适配需求与技术突破窗口

  • DeepSeek 模型场景需求与推理优化目标设定

2. 昇腾推理解决思路

  • 昇腾芯片架构简述与深度学习模型推理特性匹配分析

  • 昇腾 CANN 生态支持在推理侧的核心能力

  • DeepSeek 在昇腾平台的部署路径与模块解耦设计思路

3. DeepSeek 推理加速关键技术

  • 大规模专家并行调度优化

  • 集合通信(All2all)优化策略

  • 异构资源调度与算子融合:

4. 效果与总结

  • 推理加速前后主要性能指标对比(吞吐、延迟、资源利用率)

  • 可推广的优化经验总结

  • 对昇腾平台下大模型推理未来演进方向的初步展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 部署相对复杂,需要大并发量才能发挥价值。


您的演讲有哪些前沿亮点?

  • 大规模专家并行

  • 集合通信优化

  • 调度优化


听众收益

  • 基于昇腾的 MoE 推理性能优化方案及关键技术


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-10 17:003784

评论

发布
暂无评论

聚势启新,赢未来!网银互联通航云计算数据中心三期盛大落地!

科技热闻

Trapcode Particular(AE经典粒子插件)绿色破解版

互联网搬砖工作者

分布式存储中建立高效回收站的设计思考

焱融科技

文件存储 分布式文件存储 回收站 高性能存储 全闪存储

智维数据加入信创工委会,助力国产化智能运维自主创新

智维数据

信创 国产化 智能运维 网络运维 智维数据

获得华为技术认证,智维数据携手华为云初创生态再添新坐标!

智维数据

华为云 智能运维 网络运维 智维数据 技术认证

高性能、高稳定、高扩展:解读ByteHouse实时导入技术演进

Openlab_cosmoplat

云原生 开源社区 大数据‘’

阿里云Elasticsearch让搜索上云像使用“水电”一样简单

阿里云大数据AI技术

阿里云 搜索 Elasticearch

Serverless:基于个性化服务画像的弹性伸缩实践

百度Geek说

云原生 成本优化 Servelress 弹性伸缩 企业号 3 月 PK 榜

AltCLIP:改变语言编码器,扩展语言功能

Zilliz

计算机视觉 openai

何为神经网络卷积层

华为云开发者联盟

人工智能 神经网络 华为云 华为云开发者联盟 企业号 3 月 PK 榜

GifGun for Mac(快速输出GIF动图格式AE插件)

互联网搬砖工作者

graphpad prism基础使用教程

互联网搬砖工作者

带你全方面了解字节A/B实验的文化与工具

字节跳动数据平台

大数据 AB testing实战 实验 A/B测试 企业号 3 月 PK 榜

智维数据荣获2022金融科技应用创新奖

智维数据

金融科技 智能运维 金融电子化 智维数据

京东云总裁曹鹏:安全可控的数字基础设施提升产业链韧性

京东科技开发者

数字化 产业数字化 京东云 国产化替代 京东云峰会

感谢大家对我的捐赠和鼓励

源字节1号

PS磨皮插件DR5白金版:支持ps 2022

互联网搬砖工作者

带你掌握如何查看并读懂昇腾平台的应用日志

华为云开发者联盟

人工智能 华为云 昇腾 华为云开发者联盟 企业号 3 月 PK 榜

通过HTTP/2通道实时获取IoT设备状态和数据——设备管理运维类

阿里云AIoT

Java 物联网

阿里云IoT物联网平台基础版和高级版数据进入规则引擎的流转详解——普及类

阿里云AIoT

物联网

谷歌Android things物联网硬件接入阿里云IoT物联网套件实战——设备接入类

阿里云AIoT

物联网 传感器 Android开发

Dapr实战—RabbitMQ binding

青柚1943

Docker RabbitMQ dapr 发布订阅 Binding

现货合约量化机器人开发对冲交易策略

薇電13242772558

量化策略

直播 | StarRocks 实战系列第四期--查询性能优化

StarRocks

数据库

InstructPix2Pix: 动动嘴皮子,超越PS

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 3 月 PK 榜 文本编辑图像

干货,在差分对信号的应用中需要注意些什么?

华秋PCB

电路 PCB PCB设计 共模

昇腾DeepSeek大模型推理架构|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章