写点什么

LLM 技术在有道词典笔上的应用实践|AICon 北京

  • 2025-06-13
    北京
  • 本文字数:1271 字

    阅读完需:约 4 分钟

大小:706.58K时长:04:01
LLM技术在有道词典笔上的应用实践|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


网易有道研发总监程桥已确认出席并发表题为《LLM技术在有道词典笔上的应用实践》的主题分享。本次分享将聚焦端侧大模型,深入探讨其落地过程中的挑战与实践。通过大模型摩尔定律及相关技术阐述原因,并对比端侧 AI 与云侧 AI 的优劣,介绍端侧 AI 应用场景及有道教育智能硬件特点。端侧大模型落地面临算力、内存、功耗、成本、算法质量、多应用部署等挑战,需平衡各项指标。以有道子曰大模型为例,分享云侧、云端结合、端侧 LLM 三种落地模式。在端侧大模型算法方面,详细介绍模型压缩技术及 LLM 带来的变化与新问题,通过实验确定蒸馏、DPO、词表裁剪、量化等方案,并对推理进行性能优化,端侧大模型成功落地有道词典笔 X7、X7 Pro,开启词典笔部署本地大模型新时代,未来还计划扩展功能。



程桥是网易有道机器翻译及大模型业务负责人,承担多项技术攻坚项目,为有道翻译,有道智云,词典笔等产品提供人工智能技术支持,产品服务近亿用户;在 NLP 领域国际顶级学术会议上发表多篇论文,担任 ACL、EMNLP 等顶级会议的审稿人,拥有多项发明专利的授权。他在本次会议的详细演讲内容如下:


演讲提纲

  1. 有道智能硬件应用介绍

  2. 端侧大模型面临的挑战

  3. 有道子曰大模型的落地模式

  4. 端侧大模型的算法优化与推理性能提升


您认为,这样的技术在实践过程中有哪些痛点?端侧大模型落地面临多方面挑战。算力和内存上,与云侧相比差距大,如端侧 RK3562 芯片对比云侧 4090GPU,算力低千倍以上,内存低 20 多倍。功耗方面,端侧设备如手机、词典笔需考虑待机时长,优化底层 AI 引擎与上层 APP 功耗难度大。成本限制下,为有市场竞争力需降低成本,可能导致所选芯片更弱。此外,要保证模型质量,且端侧设备常部署多个应用,各模块抢资源,需综合优化满足用户体验。


您的演讲有哪些前沿亮点?为解决端侧内存限制问题,采用模型压缩技术。以有道子曰大模型为例,运用蒸馏技术,引入片段级语料并确定合适训练集规模,有效提升模型效果。采用 DPO 算法进行强化学习,进一步优化模型性能。通过词表裁剪,在保证模型质量的同时减少内存占用,并选用 AWQ 量化算法,在量化过程中兼顾模型精度与内存优化 。


听众收益

  • 理解端侧模型与硬件深度融合的关键路径,助力本地智能化部署。

  • 了解端侧大模型的技术挑战与应对策略,掌握行业最新趋势。


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-13 11:305807

评论

发布
暂无评论

利用外部数据源 JSON 管理测试:灵活的数据驱动测试方法

测吧(北京)科技有限公司

测试

和鲸社区地球科学轻科研交流局:在这个卷来卷去的时代,我们都想要找到一些答案

ModelWhale

数据科学 气象 地球科学 DDE 深时数字地球 大气

C# 单例模式的多种实现

不在线第一只蜗牛

JavaScript C#

智源举办2024具身与世界模型专题峰会 产学研共促技术创新与产业应用

智源研究院

改变财务规划思维方式,迎接创新技术新时代

智达方通

技术创新 预算管理 财务规划

ETLCloud异常问题分析ai功能

RestCloud

人工智能 AI 数据分析 ETL 数据集成工具

利用外部数据源 CSV 管理测试:轻量化数据驱动测试方案

测吧(北京)科技有限公司

测试

全面升级的“新清影”,给AI生成视频带来了哪些新玩法?

Alter

深入理解 fixture 的作用范围:优化测试环境的管理

测吧(北京)科技有限公司

测试

七届“全勤生”高通已经确认参加明年第八届进博会

业界

快递鸟单号识别API接口代码流程

快递鸟

快递

智慧代表信息系统(源码+文档+部署+讲解)

深圳亥时科技

全球最大电池制造商根据统一可持续性绩效预期进行报告

财见

Pytest 并行与分布式运行测试用例的实现与优化

测吧(北京)科技有限公司

测试

深入理解 Fixture 作为参数使用的技巧:提升测试代码的灵活性和复用性

测吧(北京)科技有限公司

测试

深入理解 yield 用法:从生成器到高级测试场景的应用

测吧(北京)科技有限公司

测试

【通义灵码】@workspace 和 @terminal 新功能体验分享

申公豹

通义灵码

自动泊车端到端算法 ParkingE2E 介绍

地平线开发者

自动驾驶 算法

Robotaxi三国杀

脑洞汽车

AI

什么是公共数据资源授权运营?

郑州埃文科技

公共数据

鸿蒙开发实战:鸿蒙应用开发中的页面管理工具类详解

王二蛋和他的张大花

鸿蒙

关于虚拟仿真云实验教学_解决方案及优势介绍!

3DCAT实时渲染

仿真云 虚拟仿真云教学 虚拟仿真实训教学

11.组合模式设计思想

杨充

这些实时互动 AI 场景正在涌现生长,也预示着多模态 AI 的未来|RTE2024 声网CEO赵斌演讲实录

声网

Pytest 内置插件 Hook 体系:深入了解与实践

测吧(北京)科技有限公司

测试

LLM技术在有道词典笔上的应用实践|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章