阿里云飞天发布时刻,领先大模型限免,超7000万 tokens免费体验 了解详情
写点什么

AI 大模型重塑学习硬件:从工具到伙伴 | 网易有道孟旭

作者:孟旭

  • 2025-06-18
    北京
  • 本文字数:3102 字

    阅读完需:约 10 分钟

大小:1.52M时长:08:52
AI大模型重塑学习硬件:从工具到伙伴 | 网易有道孟旭

在近期举办的 AICon 全球人工智能开发与应用大会·上海站(2025)现场,网易有道词典笔产品负责人孟旭以一款全新的 AI 原生硬件【有道 AI 答疑笔】为例,分享了智能学习硬件在大模型技术催化下的变革逻辑——从解决单一需求的“学习工具”,进化为陪伴学习的“智能伙伴”。


孟旭指出,从多年的经验和认知出发,有道智能学习硬件的进化本质是用户需求、硬件创新与 AI 技术三者的螺旋推进,三者像齿轮一样咬合转动,推动产品进化。即使是在大模型爆发的当下,纯软件升级或者纯硬件创新都更像是炫技,唯有软硬结合才能让技术润物无声地渗入场景,去解决用户的真问题 ,这也是垂类硬件在技术爆发时代的生存法则。


以下根据演讲实录整理(部分内容有删改),供大家深入了解:


大家好,我来自网易有道硬件产品团队,我叫孟旭。


现在 AI 可以说无处不在了,作为智能学习硬件的产品团队,我们也一直在思考:当 AI 教育碰撞,如何让这项前沿技术真正成为孩子学习成长路上的"智慧引路人”? 如何突破传统学习工具的局限,解决孩子在学习过程中遇到的实际痛点,为他们打造更高效、更沉浸、更个性化的学习体验?


今天我会以我们今年推出的全新品类——有道 AI 答疑笔——的创新点来展开说说,大模型催化下的 AI 学习硬件经历了什么样的变革



网易有道被大家熟知是因为有道词典、有道翻译官、有道云笔记等应用,所以我们在查词翻译、语言学习上有非常深的积累,而我们有道词典笔也在智能学习硬件领域深耕多年,今年年初有道词典笔累计销量突破了 1000 万台,这对于我们是一个里程碑,代表了这么多年超过千万的孩子和家长对我们的信任。


在这个过程中,我们发现学习硬件产品迭代过程呈现“需求牵引 - 技术支撑 - 体验升级”的螺旋式发展路径。即先由用户场景需求牵引,推动硬件创新和人工智能技术在产品中的应用;随着硬件和技术的提升,又为用户带来更好的使用体验,而新的体验又会催生用户更多、更高级的需求,如此循环往复,推动智能硬件不断向前演进。


具体来说,

需求牵引

这是智能硬件发展的起点,也是核心驱动力。需求场景虽然会随着时代进行变化,但变化的路径和方向是有迹可循的。我们在最开始推出有道词典笔,解决的是在用户英语学习时候提供一个趁手的智能工具。基于有道词典在语言翻译方面积累了大量的专业数据,同时硬件技术能够实现扫描 - 识别 - 输出的快捷过程,词典笔就应运而生。


后来,我们在大量用户的使用日志中发现,因为扫描翻译这个动作很方便,用户在学习中文遇到不懂的字词,也会习惯性的扫一下,所以我们紧接着丰富了扫描翻译的语种和内容,不光是双语的学习,还引入了小语种和古诗文的释义,乃至文言文的讲解。


再接下来,我们又看到,随着孩子年龄的增长,会面临学习任务的升级,他们也会自然而然地想到,随手拿起词典笔能不能解决下数学、物理、化学这些学科问题,乃至能不能脱离桌面学习的空间,到随时随地都能够互动学习……这就是为什么从需求层面,我们会从词典笔扩展到 AI 答疑笔这个路径上来。

硬件创新

当明确用户需求后,就需要通过硬件创新来实现。这涉及到材料科学、电子工程等多领域技术突破。例如,为了让有道词典笔更便于携带和操作,可能需要在保证性能的前提下,对其外观尺寸、材质进行优化;为了实现更快速的识别和处理速度,要升级芯片等硬件组件。同时,也要考虑规模化的成本问题。可以说,硬件创新是将用户需求转化为实际产品功能的关键环节。

技术迭代

人工智能技术为智能硬件注入了“智慧”灵魂。像图像识别技术能让词典笔精准识别文字;自然语言处理技术使其能够理解用户提问,并给出准确解答。人工智能技术的不断进步,如算法优化、深度学习能力提升等,为智能硬件实现更智能、更人性化的功能提供了技术支撑。



那今天,前沿的 AI 大模型和教育场景碰撞带来了什么新的变化呢


首先,在语言交互方面,大模型具有先天优势,尤其是在语言学习领域。有道早在 2023 年就在词典笔上落地并优化大模型,优先应用于翻译和多语言学习场景。大模型能够更好地理解自然语言,尤其是结合上下文,从而显著提升翻译的准确度、表达方式、情绪色彩和流畅度。


这里可以提一下,其实我们去年率先在行业内首次落地了端侧离线大模型,主要用于中英离线翻译,团队还在推进文言文翻译和小语种翻译功能的开发。选择离线大模型的原因在于,许多孩子的学习场景中存在无网络或网络不稳定的情况,如学校、图书馆等,离线模型能够保证低延迟、高质量的学习体验,同时降低成本。


为此,有道定制了首颗 AI 芯片,提升芯片算力以满足大模型需求,同时实现超低功耗,满足孩子长时间使用不充电的需求。离线大模型的落地面临诸多挑战,如算力、内存、功耗和成本的限制,但团队成功实现了高质量的翻译,使得离线大模型翻译质量优于原有的 NMT 模型。



其次,推理模型展示了类真人的逻辑思考链,在答疑辅导场景中进行应用,让 AI 更接近真人老师的讲解方式,实现了自然语言交互模拟一对一的对话过程,真正实现了教与学的双向交互。


以我们自己的产品突破为例,在最新的有道 AI 答疑笔上,与传统基于题库的答疑方式不同,小 P 老师能够随时随地解答多学科、新题难题,不限制学科和题目来源,就像前段时间我们拿 AI 答疑笔试了下今年北京海淀的高考二模题,也能拿下不错的成绩,达到了清北分数线。


同时,小 P 老师能够做到分步骤讲解解题思路,单独抽离知识点供用户追问,并提供举一反三的练习,包括真题练习和大模型生成的练习。并且,大模型的知识覆盖面直接拓展到了全学科领域,契合当下教育目标迈向学科融合发展的趋势,能够更好地承担起多学科高效辅助的角色。


这样,大模型解决了传统人力问题,孩子在学习过程中遇到问题可以随时获得精细化讲解,无需等待固定时段询问老师。此外,多模态技术的发展让有道 AI 答疑笔能支持多种交互方式,如扫描、拍照、语音等,也让用户能够拓展更多个性化学习体验,比如拍照朗读不同风格的文章、拍照自定义背单词等功能。



可以看到,目前大模型应用已经能够解决一些以往产品没能很好解决的问题。但是如果看长远一点,我们认为下一个阶段可能是 AI Ag ent 和教育生态的深度融合,也是我们正在探索的方向。


随着孩子学习方式从以老师为中心转变为以学生为中心,以及从单一学科到多学科融合、从被动接受到主动探索的各种转变,传统学习工具的局限性愈发明显。


比如,我们看到学生在预习课本的时候,就会探究课本以外的发散知识,有的孩子可能会好奇作者的生平,有的孩子可能会想了解文章的写作背景和故事等等,其实就是学习的个性化本质,也是教育的终极诉求。我们一直追求“因材施教”,但现在没有任何一个工具、一个产品能真正做到。


我们也还在往这个方向去努力,哪个孩子不希望自己有个随身家教呢?所以我们一方面在答疑智能化上做功夫,比如让 AI 答疑笔可以根据你的“错题本”记录,提供更好的讲解;另外一个方面,是进一步提高产品层面端到端的成熟度,现在 AI 答疑笔里面有几十个应用,不同的应用处理不同的学习需求,比如背单词有专门的 APP,口语训练又是专门的 APP,然后课内同步学习又是不同的入口。


那未来是不是能把这些散点功能串联成整个学习流程?


基于这样的构想,我们 AI 答疑笔一开始就是定位于 AI 原生智能硬件,软硬件相结合的自研系统具备集成的条件,或许未来能实现人、内容和流程的整合,当 AI Agent 解决孩子各类学习问题的时候,AI 答疑笔就能真正成为孩子专属的 AI 设备

活动推荐

6 月 27~28 日的 AICon 北京站将继续聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent 构建、多模态应用、大模型推理性能优化、数据智能实践、AI 产品创新等热门议题,深入探讨技术与应用融合的最新趋势。欢迎持续关注,和我们一起探索 AI 应用的无限可能!



2025-06-18 10:002

评论

发布
暂无评论

50强诞生!2021 OceanBase 数据库大赛百所高校争霸!

OceanBase 数据库

数据库 开源 开发者 比赛 oceanbase

Remix.run 新手教程

程序员铮铮

JavaScript 大前端 React SSR 教程分享

Linux一学就会之Linux详细基本命令操作

学神来啦

bash Linux centos 运维 Shell

TMF国际大奖技术揭秘:5G智能动态步长

鲸品堂

5G 计费模式 通信运营商

Linux学习方法,《Linux一学就会》教你如何学习Linux

侠盗安全

Linux 运维 linux运维 云计算架构师 linux电子书

连续 14 年!IBM 荣获 2021 年 Gartner 主存储魔力象限领导者

BeeWorks

盘点分布式软总线数据传输技术中的黑科技|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

拿捏这10点,玩转云原生应用

BeeWorks

安全架构|云安全框架及虚拟化技术

明亮安全观

云计算 网络安全 云安全 安全架构

还有人不知道鸿蒙智联设备认证咋搞?|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

HBase 调优详细剖析

五分钟学大数据

11月日更

35岁程序员创业,为何选择云原生赛道

行云创新

云计算 创业 程序员 云原生 CEO

Flutter 异常监控、符号解析及聚合分流实践

贝壳大前端技术团队

flutter 监控 异常 符号化

spark2.0笔记

Clarke

淘宝客户端安全生产体系建设

阿里巴巴终端技术

ios android 淘宝 客户端 安全生产

阿里一面灵魂一问:RPC或者HTTP什么时候需要序列化和反序列化?

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

前端开发环境搭建在内网是如何搭建的

@零度

大前端

鸿蒙智联生态服务平台——智能硬件伙伴的最佳拍档|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

智能楼宇管理系统开发,智慧楼宇管控系统开发

电微13828808271

Webpack 性能之使用 Cache 提升构建性能

编程江湖

大前端 webpack

Java中对象的初始化生成过程

编程江湖

Java JAVA开发 java编程

Hadoop、Spark、Hive到底是什么,做算法要不要学?

编程江湖

大数据

质量基础设施“一站式”服务信息平台建设,NQI一站式线上搭建

电微13828808271

“元宇宙”究竟是什么

华为云开发者联盟

云计算 AI AR vr 云宇宙

Java开发之集成开发环境

@零度

JAVA开发 Java学习 IED

大会回顾丨游戏用户体验优化如何实践,看大咖怎么说(附PPT下载)

WeTest

自动驾驶汽车的安全架构体系 易筋 ARTS 打卡 Week 77

John(易筋)

ARTS 打卡计划

Hadoop企业级生产调优手册(一)

大数据技术指南

11月日更

面试官问:mysql中时间日期类型和字符串类型的选择

华为云开发者联盟

MySQL timestamp 时间日期 字符串类型

大数据开发之如何用Scala进行spark开发

@零度

scala 大数据 spark

《新程序员》走进微软亚洲研究院

刘旭东

微软 hololens

AI大模型重塑学习硬件:从工具到伙伴 | 网易有道孟旭_AI&大模型_InfoQ精选文章