2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

昇腾 DeepSeek 大模型推理架构|AICon 北京

  • 2025-06-10
    北京
  • 本文字数:931 字

    阅读完需:约 3 分钟

大小:520.32K时长:02:57
昇腾DeepSeek大模型推理架构|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


华为昇腾架构师王建辉已确认出席并发表题为《昇腾DeepSeek大模型推理架构》的主题分享。在大模型加速部署进入深水区的今天,如何在国产算力平台上高效运行大模型,已成为影响应用落地的重要一环。本次分享将介绍昇腾 DeepSeek 大模型推理架构,性能优化方案及关键优化措施,以及优化建议。



华为计算产品线昇腾推理架构师王建辉,主要从事昇腾计算推理产品架构设计与竞争力规划,擅长技术领域包括软硬件协同设计,系统性能优化及实时计算。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景缘由

  • 大模型推理的计算挑战:参数规模持续增长带来的推理延迟、资源瓶颈问题

  • 国产算力平台的适配需求与技术突破窗口

  • DeepSeek 模型场景需求与推理优化目标设定

2. 昇腾推理解决思路

  • 昇腾芯片架构简述与深度学习模型推理特性匹配分析

  • 昇腾 CANN 生态支持在推理侧的核心能力

  • DeepSeek 在昇腾平台的部署路径与模块解耦设计思路

3. DeepSeek 推理加速关键技术

  • 大规模专家并行调度优化

  • 集合通信(All2all)优化策略

  • 异构资源调度与算子融合:

4. 效果与总结

  • 推理加速前后主要性能指标对比(吞吐、延迟、资源利用率)

  • 可推广的优化经验总结

  • 对昇腾平台下大模型推理未来演进方向的初步展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 部署相对复杂,需要大并发量才能发挥价值。


您的演讲有哪些前沿亮点?

  • 大规模专家并行

  • 集合通信优化

  • 调度优化


听众收益

  • 基于昇腾的 MoE 推理性能优化方案及关键技术


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-10 17:001

评论

发布
暂无评论

鼎茂科技获得阿里云首批产品生态集成认证,携手阿里云共建新合作

阿里巴巴云原生

阿里云 云原生 加速器 企业招募

居民消费价格指数变化新鲜出炉,这类商品同比涨幅最大

前嗅大数据

数据分析 数据采集 居民消费 居民消费指数

RocketMQ 5.0 API 与 SDK 的演进

阿里巴巴云原生

阿里云 RocketMQ 云原生

实践分享:30分钟在电脑端运行小程序

FN0

桌面应用 桌面应用开发

Spring Boot框架下实现Excel服务端导入导出

葡萄城技术团队

前端 Excel 控件

如何在SpringBoot项目中,实现记录用户登录的IP地址及归属地信息?

wljslmz

日志 IP springboot 登录 11月月更

数据分析er看过来,五款工具有你需要的

葡萄城技术团队

数据分析 前端 数据可视化

Baklib|信息管理和知识管理是如何影响你的业务的?

Baklib

知识管理

Baklib|SaaS产品,实现企业流程数字化

Baklib

SaaS

教学:制作 GitHub 同步近期博客卡片

小鑫同学

前端 Github' 11月月更

Kotlin变量的空安全(Null Safety)

子不语Any

android kotlin 11月月更

Docgeni 2.0 发布,开启自动化

PingCode研发中心

数字化时代,企业需要怎样的数据中台?报名元年微课堂,一起来探索

元年技术洞察

数据中台

8分钟带你学会SpringBoot整合Redis来实现缓存技术

好程序员IT教育

redis Spring Boot

技术解读倚天 ECS 实例——Arm 芯片的 Python-AI 算力优化 | 龙蜥技术

OpenAnolis小助手

Python AI arm ECS sig

IM开源项目OpenIM部署文档-从准备工作到nginx配置

Geek_1ef48b

web前端面试技巧-如何自我介绍?如何应对hr?

肥晨

前端面试 面试技巧 11月月更

算法题学习---两个链表的第一个公共结点

桑榆

算法题 11月月更

以用户为导向,vivo打造安全新范式

极客天地

关于Web3.0,你了解多少?个推与您畅聊下一代互联网

个推

互联网 元宇宙 Web3.0

【LeetCode】数组元素积的符号Java题解

Albert

算法 LeetCode 11月月更

OpenSergo 流量路由:从场景到标准化的探索

阿里巴巴云原生

阿里云 微服务 云原生

Baklib|我的企业是不是需要一个维基页面呢?

Baklib

维基

组织赋能,统一企业门户实现高效化、移动化协作

BeeWorks

有趣的 Go HttpClient 超时机制

捉虫大师

Go HTTP 11月月更

漫画|微信群聊的程序员们

肥晨

程序员生活 11月月更 程序员漫画

【倒计时4天】杭州专场-单元测试产品体验样板间,等你加入!

TRaaS

基于Jmeter的百万级tps性能测试实践

环信

Jmeter 性能测试

Pytorch实现经典模型AlexNet模型

Studying_swz

深度学习 11月月更

10 分钟部署一个 API 工具

Scar 

开源 Serverless 接口测试 Vercel

IM即时通讯私有化部署,WorkPlus助力企业构建安全办公环境

BeeWorks

昇腾DeepSeek大模型推理架构|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章