2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

面壁智能 CTO 曾国洋确认出席 QCon 北京,分享迈向 AGI 的关键技术实践

  • 2025-03-24
    北京
  • 本文字数:973 字

    阅读完需:约 3 分钟

面壁智能CTO曾国洋确认出席QCon北京,分享迈向 AGI 的关键技术实践

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


面壁智能联合创始人 & CTO 曾国洋已确认出席并发表题为《端侧模型的知识密度:迈向 AGI 的关键技术实践》的主题分享。近几年大模型技术快速发展,取得了一系列重大突破,大模型能力的核心“知识密度”逐渐为大家所认知。面壁智能一直以来致力于研发更高知识密度的大模型,在业内首先提出知识密度概念并在模型研发过程中取得实践。本次分享内容将围绕大模型知识密度展开,介绍知识密度与大模型的关系以及知识密度长期发展方向,帮助大家更好的理解大模型技术在未来一段时间的发展趋势,提前布局保障企业的核心竞争力。


曾国洋于 2015 年 NOI 金牌进入清华大学计算机系,曾获清华大学挑战杯一等奖、首都大学生挑战杯一等奖、智能体大赛一等奖等。2017 年加入清华大学自然语言处理实验室,2020 年以骨干身份加入「悟道·文源」中文预训练大模型团队,参与 CPM 系列模型的训练和研发,在此期间编写了大模型高效训练和推理工具 BMTrain、BMInf 等,并获多项发明专利。自 2021 年起担任智源研究院语言大模型加速技术创新中心副主任,并于 2022 年创立面壁智能并担任 CTO,入选 2024 年度“北京市科技新星计划”,致力于推动大模型技术的落地应用。他在本次会议的详细演讲内容如下:


演讲提纲

1. 大模型技术趋势

  • 从 GPT-3 到 Deepseek-R1 大模型技术演变历程

  • 下一次 Deepseek 时刻会发生在哪

  • 预训练终结后的大模型前景

2. 知识密度的现状与挑战

  • 知识密度的定义与模型发展规律

  • 知识密度与模型能力上限的关系

  • 突破知识密度的技术实践

3. 思维链与强化学习

  • 大模型为什么需要思维链

  • 强化学习与思维链技术结合对大模型的意义

4. 大模型应用落地展望

  • 未来大模型格局如何演变

  • 知识密度之外,大模型应用落地还存在哪些障碍

  • 大模型快速发展时代,如何不落后于潮流



本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-24 15:475033

评论

发布
暂无评论

架构设计篇之微服务实战笔记(五)

小诚信驿站

架构师 刘晓成 小诚信驿站 成长笔记 28天写作

2021年,是时候把技术债务管理提上日程了

禅道项目管理

效率 产品 创新 技术债

MT马特量化机器人软件开发|MT马特量化机器人APP系统开发

系统开发

数据中心架构设计比较

java-时间的使用

建安

Java android SpringBoot 2

立足智能化发展,风电能源产业互联网平台加快建设

一只数据鲸鱼

物联网 数据可视化 3D可视化 能源管理 风力发电

园区网为主的 DNS 架构设计

冯骐

程序员 运维 监控 网络 DNS

【LeetCode】翻转图像Java题解

Albert

算法 LeetCode 28天写作 2月春节不断更

话题讨论 | 如何看待公司发开工红包?

happlyfox

话题讨论 28天写作 2月春节不断更 话题王者 红包

流批一体生产应用!Bigo 实时计算平台建设实践

Apache Flink

flink

C语言重要的知识点

c 考核 重要知识 简单清楚 好看

大数据时代

Mr.cool

新一代信息技术赋能山东政务!区块链政务平台解决方案

源中瑞-龙先生

Open-Falcon 中的交换机监控

冯骐

运维 监控 网络 交换机 Go 语言

Kafka 是怎么存储的?为什么速度那么快?

李尚智

Java kafka 架构

Java 集合处理/ 空值处理/ 异常处理,使用心得分享!

brother ben

为什么挤破头进大厂,大厂如何设置薪资职级体系?

不脱发的程序猿

HR 校园招聘 28天写作 二月春节不断更 互联网行业薪资

新时代计算机技术

细节完美炸裂!GtiHub上点赞已破百万的并发编程四套全彩手册

Java架构追梦

Java 阿里巴巴 架构 面试 并发

一周信创舆情观察(2.8~2.21)

统小信uos

Flink 如何实时分析 Iceberg 数据湖的 CDC 数据

Apache Flink

flink

Idea快捷键操作

刘大明

IDEA

深入理解Deno是如何借助PowerShell进行安装脚本

梁龙先森

大前端 deno shell脚本编写 PowerShell 28天写作

使用PG_STAT_REPLICATION监视复制

PostgreSQLChina

数据库 postgresql 开源 软件 开源社区

API策略量化机器人系统开发|API策略量化机器人APP软件开发

系统开发

你真的懂 MP4 格式吗?

阿里云CloudImagine

音视频 视频

MySQL索引原理,一篇从头到尾讲清楚

数据库 架构

中小公司开展NPS的好处

字节码角度分析i++和++i的区别

现实中游走

Java 字节码

算力平台软件开发|算力平台系统APP开发

系统开发

一个员工的离职成本,很恐怖!

不脱发的程序猿

职场 HR 28天写作 二月春节不断更 员工离职

面壁智能CTO曾国洋确认出席QCon北京,分享迈向 AGI 的关键技术实践_AI&大模型_QCon全球软件开发大会_InfoQ精选文章