2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

LLM 技术在有道词典笔上的应用实践|AICon 北京

  • 2025-06-13
    北京
  • 本文字数:1271 字

    阅读完需:约 4 分钟

大小:706.58K时长:04:01
LLM技术在有道词典笔上的应用实践|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


网易有道研发总监程桥已确认出席并发表题为《LLM技术在有道词典笔上的应用实践》的主题分享。本次分享将聚焦端侧大模型,深入探讨其落地过程中的挑战与实践。通过大模型摩尔定律及相关技术阐述原因,并对比端侧 AI 与云侧 AI 的优劣,介绍端侧 AI 应用场景及有道教育智能硬件特点。端侧大模型落地面临算力、内存、功耗、成本、算法质量、多应用部署等挑战,需平衡各项指标。以有道子曰大模型为例,分享云侧、云端结合、端侧 LLM 三种落地模式。在端侧大模型算法方面,详细介绍模型压缩技术及 LLM 带来的变化与新问题,通过实验确定蒸馏、DPO、词表裁剪、量化等方案,并对推理进行性能优化,端侧大模型成功落地有道词典笔 X7、X7 Pro,开启词典笔部署本地大模型新时代,未来还计划扩展功能。



程桥是网易有道机器翻译及大模型业务负责人,承担多项技术攻坚项目,为有道翻译,有道智云,词典笔等产品提供人工智能技术支持,产品服务近亿用户;在 NLP 领域国际顶级学术会议上发表多篇论文,担任 ACL、EMNLP 等顶级会议的审稿人,拥有多项发明专利的授权。他在本次会议的详细演讲内容如下:


演讲提纲

  1. 有道智能硬件应用介绍

  2. 端侧大模型面临的挑战

  3. 有道子曰大模型的落地模式

  4. 端侧大模型的算法优化与推理性能提升


您认为,这样的技术在实践过程中有哪些痛点?端侧大模型落地面临多方面挑战。算力和内存上,与云侧相比差距大,如端侧 RK3562 芯片对比云侧 4090GPU,算力低千倍以上,内存低 20 多倍。功耗方面,端侧设备如手机、词典笔需考虑待机时长,优化底层 AI 引擎与上层 APP 功耗难度大。成本限制下,为有市场竞争力需降低成本,可能导致所选芯片更弱。此外,要保证模型质量,且端侧设备常部署多个应用,各模块抢资源,需综合优化满足用户体验。


您的演讲有哪些前沿亮点?为解决端侧内存限制问题,采用模型压缩技术。以有道子曰大模型为例,运用蒸馏技术,引入片段级语料并确定合适训练集规模,有效提升模型效果。采用 DPO 算法进行强化学习,进一步优化模型性能。通过词表裁剪,在保证模型质量的同时减少内存占用,并选用 AWQ 量化算法,在量化过程中兼顾模型精度与内存优化 。


听众收益

  • 理解端侧模型与硬件深度融合的关键路径,助力本地智能化部署。

  • 了解端侧大模型的技术挑战与应对策略,掌握行业最新趋势。


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-13 11:306178

评论

发布
暂无评论

EMAS 移动 DevOps 解决方案 —— Mobile DevOps

移动研发平台EMAS

阿里云 DevOps 运维 开发 emas

“通证经济”实质是生产关系的变革

CECBC

通证经济

美团架构师总结整理的这份GitHub标星150K+的神仙笔记,我花了两个月肝完成功面进了阿里定级P7,现在分享出来希望大家也能有所提升!

Java架构之路

Java 程序员 架构 面试 编程语言

架构师训练营第一周UML图

Geek_xq

区块链跨境溯源平台搭建,助力跨境电商防伪溯源

13530558032

清华大佬马士兵告诉你从阿里P5级一直学到P8架构师的成长路线+视频教程!

比伯

Java 编程 架构 面试 计算机

一周信创舆情观察(11.16~11.22)

统小信uos

5G矿山,工业真金,以及智能体矿井

脑极体

架构师训练营第 10 周学习总结

netspecial

极客大学架构师训练营

去“测试”下的测试重生,不为焦虑买单

陈磊@Criss

软件测试 自动化测试 测试开发 智能化测试

架构师训练营第一周架构方法学习总结

Geek_xq

ThinkPad X1 Carbon与MacBook有何不同?不止是专业

E科讯

如何保护视频资源?这几个防盗链使用技巧你一定要知道!

腾讯云音视频

音视频 防盗链 内容安全 视频防盗 视频资源防盗

【得物技术】供应链库存幂等实战分享

得物技术

幂等 供应链 得物技术部 实战 得物

架构师训练营 -week10-总结

大刘

极客大学架构师训练营

架构方法

raox

极客大学架构师训练营

跨国区块链投资 花式“割韭菜”骗光你的钱

CECBC

区块链

Week 1 学习总结

J

极客大学架构师训练营

如何保障企业数据资产的全生命周期安全?看这篇就够了

华为云开发者联盟

数据 数据资产 数据安全

区块链数字版权应用落地开发,区块链版权溯源解决方案

13530558032

数字时代,如何跟上互联网医院的建设潮?

CECBC

数字化医疗

食堂就餐卡系统设计

我们新四军不拿群众一针一线

从数据库巨人身上撕开一道口子

数据君

有了它,数据库也能空中加油,一边迁移一边跑起来

数据君

腾讯云数据库登陆印尼,金融行业显神威

数据君

tdsql

一文带你了解两种Transformer文字识别方法

华为云开发者联盟

人工智能 AI 文字识别

《迅雷链精品课》第八课:迅雷链多链结构

迅雷链

区块链

涨薪神作!华为内部操作系统与网络协议笔记爆火,这也太香了吧

Java架构之路

Java 程序员 架构 面试 编程语言

通过python基于netconf协议获取网络中网元的配置数据,助力企业网络控制自动化轻松实现!

华为云开发者联盟

通信 企业 网络自动化

分享一份大佬的MySQL数据库设计规范,值得收藏

小Q

学习 架构 面试 JVM 多线程

深入内核,拒绝蒙圈!阿里巴巴一位P7级架构师总结整理的这份《Java架构成长笔记》彻底火了。

Java架构之路

Java 程序员 架构 面试 编程语言

LLM技术在有道词典笔上的应用实践|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章