写点什么

昇腾 DeepSeek 大模型推理架构|AICon 北京

  • 2025-06-10
    北京
  • 本文字数:931 字

    阅读完需:约 3 分钟

大小:520.32K时长:02:57
昇腾DeepSeek大模型推理架构|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


华为昇腾架构师王建辉已确认出席并发表题为《昇腾DeepSeek大模型推理架构》的主题分享。在大模型加速部署进入深水区的今天,如何在国产算力平台上高效运行大模型,已成为影响应用落地的重要一环。本次分享将介绍昇腾 DeepSeek 大模型推理架构,性能优化方案及关键优化措施,以及优化建议。



华为计算产品线昇腾推理架构师王建辉,主要从事昇腾计算推理产品架构设计与竞争力规划,擅长技术领域包括软硬件协同设计,系统性能优化及实时计算。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景缘由

  • 大模型推理的计算挑战:参数规模持续增长带来的推理延迟、资源瓶颈问题

  • 国产算力平台的适配需求与技术突破窗口

  • DeepSeek 模型场景需求与推理优化目标设定

2. 昇腾推理解决思路

  • 昇腾芯片架构简述与深度学习模型推理特性匹配分析

  • 昇腾 CANN 生态支持在推理侧的核心能力

  • DeepSeek 在昇腾平台的部署路径与模块解耦设计思路

3. DeepSeek 推理加速关键技术

  • 大规模专家并行调度优化

  • 集合通信(All2all)优化策略

  • 异构资源调度与算子融合:

4. 效果与总结

  • 推理加速前后主要性能指标对比(吞吐、延迟、资源利用率)

  • 可推广的优化经验总结

  • 对昇腾平台下大模型推理未来演进方向的初步展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 部署相对复杂,需要大并发量才能发挥价值。


您的演讲有哪些前沿亮点?

  • 大规模专家并行

  • 集合通信优化

  • 调度优化


听众收益

  • 基于昇腾的 MoE 推理性能优化方案及关键技术


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-10 17:003470

评论

发布
暂无评论

开发一个交易所需要哪些技术

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

如何判断这个品牌的堡垒机是否安全?

行云管家

网络安全 堡垒机 堡垒机安全

2025开源数据工程全景图,九大技术赛道演进趋势预测

白鲸开源

大数据 开源 数据工程 全景图

情人节用 DeepSeek+通义灵码玩花样!在 IDE 中使用满血版 DeepSeek R1 试试

阿里巴巴云原生

阿里云 云原生 通义灵码 AI程序员

llama2 70B mindie推理开箱报错问题

AI布道Mr.Jin

MobPush智能推送系统的用户行为分析:驱动精准运营的核心引擎

MobTech袤博科技

53 倍性能提升!TiDB 全局索引如何优化分区表查询?

PingCAP

数据库 TiDB

QT开发的测试方法

北京木奇移动技术有限公司

软件外包公司 QT外包开发 QT开发公司

以 Serverless 低成本的⽅式 快速在亚马逊云科技上部署 DeepSeek

伊克罗德信息科技

企业要把DeepSeek部署到本地吗?

秃头小帅oi

25年辽宁省等保测评机构新名单看这里!

行云管家

网络安全 等保 等保测评 辽宁

Node.js技术原理分析系列——如何在Node.js中新增一个内置模块

OpenTiny社区

node.js 开源 前端 OpenTiny

电机工厂数字化转型MES系统解决方案

万界星空科技

mes 万界星空科技mes 制造业工厂 电机行业 电机MES

情人节用 DeepSeek+通义灵码玩花样!在 IDE 中使用满血版 DeepSeek R1 试试

阿里云云效

阿里云 云原生 通义灵码 AI程序员

HarmonyOS 应用开发赋能套件:鸿蒙原生应用开发的 “神助攻”

HarmonyOS开发者

瑞典头部直播方案供应商Intinor接入微帧视频编码,引领高清直播市场

微帧Visionular

AI代码生成器如何降低系统复杂度

伤感汤姆布利柏

应用程序中的网络协议:原理、应用与挑战

运维有小邓

协议 #HTTP

HarmonyOS官网上线“稳定性”专栏 助力更稳定流畅的鸿蒙原生应用开发

HarmonyOS开发者

昇腾DeepSeek大模型推理架构|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章