写点什么

昇腾 DeepSeek 大模型推理架构|AICon 北京

  • 2025-06-10
    北京
  • 本文字数:931 字

    阅读完需:约 3 分钟

大小:520.32K时长:02:57
昇腾DeepSeek大模型推理架构|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


华为昇腾架构师王建辉已确认出席并发表题为《昇腾DeepSeek大模型推理架构》的主题分享。在大模型加速部署进入深水区的今天,如何在国产算力平台上高效运行大模型,已成为影响应用落地的重要一环。本次分享将介绍昇腾 DeepSeek 大模型推理架构,性能优化方案及关键优化措施,以及优化建议。



华为计算产品线昇腾推理架构师王建辉,主要从事昇腾计算推理产品架构设计与竞争力规划,擅长技术领域包括软硬件协同设计,系统性能优化及实时计算。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景缘由

  • 大模型推理的计算挑战:参数规模持续增长带来的推理延迟、资源瓶颈问题

  • 国产算力平台的适配需求与技术突破窗口

  • DeepSeek 模型场景需求与推理优化目标设定

2. 昇腾推理解决思路

  • 昇腾芯片架构简述与深度学习模型推理特性匹配分析

  • 昇腾 CANN 生态支持在推理侧的核心能力

  • DeepSeek 在昇腾平台的部署路径与模块解耦设计思路

3. DeepSeek 推理加速关键技术

  • 大规模专家并行调度优化

  • 集合通信(All2all)优化策略

  • 异构资源调度与算子融合:

4. 效果与总结

  • 推理加速前后主要性能指标对比(吞吐、延迟、资源利用率)

  • 可推广的优化经验总结

  • 对昇腾平台下大模型推理未来演进方向的初步展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 部署相对复杂,需要大并发量才能发挥价值。


您的演讲有哪些前沿亮点?

  • 大规模专家并行

  • 集合通信优化

  • 调度优化


听众收益

  • 基于昇腾的 MoE 推理性能优化方案及关键技术


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-10 17:003579

评论

发布
暂无评论

Flutter 路由及路由拦截跳转404

岛上码农

flutter ios Android开发 移动端 3月月更

Paxos vs. Raft:我们对共识算法达成共识了吗?

多颗糖

分布式系统 raft PAXOS

kubeadm工作原理-kubeadm init原理分析-kubeadm join原理分析

良凯尔

容器 云原生 kubeadm #Kubernetes# Kubernetes 集群

一文带你了解 Python 中的生成器

踏雪痕

Python 生成器 3月程序媛福利 3月月更

架构实战营-模块一-作业

CityAnimal

架构实战营 #架构实战营 「架构实战营」

java版gRPC实战之三:服务端流

程序员欣宸

gRPC

java版gRPC实战之六:客户端动态获取服务端地址

程序员欣宸

gRPC grpc双向流

区块链等技术助力北京海关监管

CECBC

java版gRPC实战之四:客户端流

程序员欣宸

gRPC grpc双向流

服务器防渗透--信息收集

喀拉峻

网络安全

高层次人才一站式服务平台系统开发

a13823115807

URL的四种形式对比说明

源字节1号

前端开发 后端开发 网站开发

黑匣子为什么难成为“云匣子”?

脑极体

前端食堂技术周刊第 30 期:Vercel 支持零配置部署使用 pnpm 项目、React 新文档更新、Angular Roadmap、Remix Stacks

童欧巴

JavaScript 编程 前端 周刊 资讯

在线正则表达式大全测试

入门小站

工具

java版gRPC实战之二:服务发布和调用

程序员欣宸

Java gRPC

开放报名丨《音视频社交新风口》线上峰会,聚焦海外社交生态升级

融云 RongCloud

java版gRPC实战之五:双向流

程序员欣宸

gRPC grpc双向流

基于微信小程序的实验室预约小程序平台详细设计

CC同学

超分算法在 WebRTC 高清视频传输弱网优化中的应用

融云 RongCloud

PyTorch

360大数据技术专家 程建云:IoTDB在360的落地实践 | Apache IoTDB Talk

Apache IoTDB

时序数据库 IoTDB Apache IoTDB

小程序电商业务微服务拆分及微服务基础设施选型

Geek_36cc7c

加密货币监控和区块链分析如何帮助避免加密货币欺诈?

CECBC

区块链架构下 智慧城市发展加速

CECBC

“中本聪岛”加密乌托邦

CECBC

[Day3]-[快慢指针]解决链表问题

方勇(gopher)

LeetCode 数据结构与算法

Linux之file命令

入门小站

Linux

深入浅出 Java FileChannel 的堆外内存使用

Apache IoTDB

融云猿桌派:35 岁程序员,正值当打之年,尚有星辰大海

融云 RongCloud

程序员

在线Javascript美化格式化工具

入门小站

工具

数字医疗时代的数据安全如何保障?

CECBC

昇腾DeepSeek大模型推理架构|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章