限时领|《AI 百问百答》专栏课+实体书(包邮)! 了解详情
写点什么

开源大模型创新背后的 RISC-V 算力架构革新|AICon 上海

  • 2025-04-29
    北京
  • 本文字数:1379 字

    阅读完需:约 5 分钟

大小:750.45K时长:04:16
开源大模型创新背后的 RISC-V 算力架构革新|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


知合计算首席 AI 科学家苏中已确认出席 AICon 上海并将在大模型架构创新与端侧智能落地实践专题发表题为《开源大模型创新背后的 RISC-V 算力架构革新》的主题分享。以 DeepSeek 为代表的开源大模型创新让普惠“满血大模型”走入千行百业成为可能,而在作为大模型应用基础的算力层面,特别是端侧推理场景,同样也已掀起了一场以开源架构实现普惠高性能算力的“革命”。


传统算力架构因迭代缓慢、成本高昂等原因已逐渐无法适应大模型创新飞速变化的算力需求,开源、开放的 RISC-V 架构正成为算力架构创新的主力。本次演讲将从算力厂商的角度,介绍开源大模型创新为端侧推理算力带来的机遇与挑战,并分享 RISC-V 架构如何凭借开源、开放的优势,成为算力架构创新的“最终答案”。


苏中 1993 年考入清华大学计算机系,2002 年获得清华大学计算机系博士学位后加入 IBM 中国研究院,曾担任 IBM 中国研究院大数据及人工智能研究方向负责人,IBM 全球技术委员会委员、大中华区技术专家委员会主席,阿里研究院未来技术中心负责人。


拥有 100 余项发明专利,迄今为止已经在国际顶级会议及期刊发表学术论文百余篇,谷歌学术引用超过 10,000 次,2020 ACM SigKDD Test of Time award, IBM Master Inventor,多次获得 IBM 全球技术成就奖,两次获得 IBM 全球杰出技术成就奖。曾担任南开大学兼职教授,上海交通大学计算机系客座教授,现担任中国中文信息学会理事,中国计算机学会人工智能专委会常务委员,北师大中国社会管理研究院客座研究员。他在本次会议的详细演讲内容如下:


演讲提纲:

1. 大语言模型及其背后算力的发展历程

  • AI 语言模型发展的三个阶段

  • 应用于 AI 语言模型的算力的发展历程

2. 大模型端侧应用的发展情况与典型应用场景分享

  • 大模型端侧应用推动千行百业全面升级

  • 热门应用场景分享(具身智能、汽车等)

3. DeepSeek 等开源大模型创新给端侧推理算力带来的新需求与新机遇(算力、内存容量、内存带宽、推理成本等)

  • DeepSeek 在算力相关层面的创新技术解析

  • 算力层面的新需求

4. 端侧推理算力领域目前发展所遇到的挑战

  • 算力架构的挑战

  • 软件生态的挑战

  • 算力成本的挑战

5. RISC-V 架构如何满足开源大模型的全新需求,实现更普惠的端侧推理应用

  • RISC-V 架构的特点介绍

  • RISC-V 架构如何针对 AI 端侧推理打造标杆产品

6. 未来端侧推理场景中,RISC-V 架构算力应用落地的展望


听众收益:

  • 了解大模型端侧部署中算力层面的发展现状与主流趋势

  • 了解开源 RISC-V 架构的基本情况,以及在 AI 端侧推理中的应用前景

  • 共同探讨开源硬件架构如何与开源大模型创新融合,造就更强大的“普惠大模型”


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-29 10:0010168

评论

发布
暂无评论

惊喜!1行Python代码,瞬间测你工作量,分享一个统计代码行数的神器

程序员晚枫

Python GitHub 开源项目 工作量

PoseiSwap:通过 RWA 的全新叙事,反哺 Nautilus Chain 生态

鳄鱼视界

ShareSDK 国外平台登陆返回参数

MobTech袤博科技

前端 App

javascript数组基础

timerring

JavaScript

加速数字化转型:龙智专家分享DevSecOps和ITSM工具性能优化策略——2023 DevOps国际峰会现场访谈

龙智—DevSecOps解决方案

DevSecOps devops国际峰会

Apache IoTDB v1.1.1/v1.1.2 发布|增加 ZSTD 压缩,show variables 增加时间精度

Apache IoTDB

IoTDB Apache IoTDB

北岩律师事务所:50000余家客户的选择,全国首家专注大消费领域的精品律所

联营汇聚

中文多模态医学大模型智能分析X光片,实现影像诊断,完成医生问诊多轮对话

汀丶人工智能

人工智能 自然语言处理 计算机视觉 多模态大模型

云原生大数据平台CloudEon V1.1.0版本发布!

CloudEon开源

大数据 云原生 容器化

时序数据库 TDengine 被帆软纳入数据源,可视化方案多样化

爱倒腾的程序员

数据库

金蝶管易云 X Hologres:新一代全渠道电商ERP最佳实践

阿里云大数据AI技术

ERP

​加速大规模团队创新,开发安全、可靠、合规的汽车软件

龙智—DevSecOps解决方案

ACT汽车电子与软件技术周 汽车电子与软件技术周

2023-07-31:用r、e、d三种字符,拼出一个回文子串数量等于x的字符串。 1 <= x <= 10^5。 来自百度。

福大大架构师每日一题

福大大架构师每日一题

Requests+Etree+BeautifulSoup+Pandas+Path+Pyinstaller应用 | 获取页面指定区域数据存入html、excel文档

Python pandas pyinstaller requests BeautifulSoup

小白也能基于OpenAI搭建自己的英语学习工具

派大星

openai

配置 Sublime Text4为 C++ 编辑器的方法

芯动大师

Sprint Boot学习路线2

小万哥

Java spring Spring Cloud Spring Boot 后端

在 Amazon DocumentDB 里处理 Decimal128类型数据的解决方案

亚马逊云科技 (Amazon Web Services)

在Go中使用Arm的SIMD指令

geange

Go 汇编 neon arm64

人工智能如何应对 DevOps 监控和可观测性挑战

SEAL安全

人工智能 DevOps 运维

平台工程动态 MonthlyNews 2023-7

杨振涛

云原生 研发效能 平台工程 开发者体验 内部开发者平台

ChatPaper全流程加速科研:论文阅读+润色+优缺点分析与改进建议+审稿回复

汀丶人工智能

人工智能 自然语言处理 nlp chatpaper

柴洪峰院士:大模型赋能金融科技思考与展望

NLP资深玩家

人工智能 金融科技 大模型 WAIC

远程控制软件安全吗?一文看懂ToDesk、RayLink、TeamViewer、Splashtop相关安全机制

颜淡慕潇

安全 远程控制 远程桌面工具 ToDesk

大会议程正式公布 华为开发者大会看点前瞻

极客天地

C++异步编程开源项目Workflow三岁啦 \^0^/

1412

开源项目 异步编程 异步任务编程 workflow C++

不用再写FlinkSQL了,使用开源XL-LightHouse轻松实现海量数据实时统计

feng

大数据 流式计算 流式大数据统计 流式统计 企业数据化运营

静态分析全解析:助力高质量软件开发,降低成本风险

龙智—DevSecOps解决方案

静态分析 静态代码分析 静态代码分析工具

开源大模型创新背后的 RISC-V 算力架构革新|AICon 上海_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章