写点什么

LLM 技术在有道词典笔上的应用实践|AICon 北京

  • 2025-06-13
    北京
  • 本文字数:1271 字

    阅读完需:约 4 分钟

大小:706.58K时长:04:01
LLM技术在有道词典笔上的应用实践|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


网易有道研发总监程桥已确认出席并发表题为《LLM技术在有道词典笔上的应用实践》的主题分享。本次分享将聚焦端侧大模型,深入探讨其落地过程中的挑战与实践。通过大模型摩尔定律及相关技术阐述原因,并对比端侧 AI 与云侧 AI 的优劣,介绍端侧 AI 应用场景及有道教育智能硬件特点。端侧大模型落地面临算力、内存、功耗、成本、算法质量、多应用部署等挑战,需平衡各项指标。以有道子曰大模型为例,分享云侧、云端结合、端侧 LLM 三种落地模式。在端侧大模型算法方面,详细介绍模型压缩技术及 LLM 带来的变化与新问题,通过实验确定蒸馏、DPO、词表裁剪、量化等方案,并对推理进行性能优化,端侧大模型成功落地有道词典笔 X7、X7 Pro,开启词典笔部署本地大模型新时代,未来还计划扩展功能。



程桥是网易有道机器翻译及大模型业务负责人,承担多项技术攻坚项目,为有道翻译,有道智云,词典笔等产品提供人工智能技术支持,产品服务近亿用户;在 NLP 领域国际顶级学术会议上发表多篇论文,担任 ACL、EMNLP 等顶级会议的审稿人,拥有多项发明专利的授权。他在本次会议的详细演讲内容如下:


演讲提纲

  1. 有道智能硬件应用介绍

  2. 端侧大模型面临的挑战

  3. 有道子曰大模型的落地模式

  4. 端侧大模型的算法优化与推理性能提升


您认为,这样的技术在实践过程中有哪些痛点?端侧大模型落地面临多方面挑战。算力和内存上,与云侧相比差距大,如端侧 RK3562 芯片对比云侧 4090GPU,算力低千倍以上,内存低 20 多倍。功耗方面,端侧设备如手机、词典笔需考虑待机时长,优化底层 AI 引擎与上层 APP 功耗难度大。成本限制下,为有市场竞争力需降低成本,可能导致所选芯片更弱。此外,要保证模型质量,且端侧设备常部署多个应用,各模块抢资源,需综合优化满足用户体验。


您的演讲有哪些前沿亮点?为解决端侧内存限制问题,采用模型压缩技术。以有道子曰大模型为例,运用蒸馏技术,引入片段级语料并确定合适训练集规模,有效提升模型效果。采用 DPO 算法进行强化学习,进一步优化模型性能。通过词表裁剪,在保证模型质量的同时减少内存占用,并选用 AWQ 量化算法,在量化过程中兼顾模型精度与内存优化 。


听众收益

  • 理解端侧模型与硬件深度融合的关键路径,助力本地智能化部署。

  • 了解端侧大模型的技术挑战与应对策略,掌握行业最新趋势。


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-13 11:302

评论

发布
暂无评论

【漏洞分析】Apache ShardingSphere-Proxy <5.3.0 身份认证绕过

墨菲安全

开源 安全漏洞 软件供应链安全

华为云数据库助力微鲤科技智能升级

爱科技的水月

阿里最新产:SpringCloud微服务架构进阶笔记(2023终极版)

程序员小毕

程序员 微服务 后端 架构师 java面试

这一篇让你彻底搞懂微信生态里的二维码

产品海豚湾

产品经理 产品设计 二维码 微信扫码 SaaS 产品

华为云数据库GaussDB(for MySQL)全方位守护企业云上数据安全

爱科技的水月

AI技术赋能数智化转型,激发企业变革创新

用友BIP

单测在商家前端业务中的实践

得物技术

架构 前端 Web 测试 单元测试 12 月 PK 榜

「实操」结合图数据库、图算法、机器学习、GNN 实现一个推荐系统

NebulaGraph

推荐系统 图数据库 图算法 GNN

架构实战营第10期模块3作业

Geek_4db2d5

HTTP实体首部字段

穿过生命散发芬芳

HTTP 12月月更

Git使用教程之本地仓库的基本操作

芯动大师

git git 学习 Git命令行

天猫联合瓴羊、贝恩,打造“产品致胜”的DTC发展模式

瓴羊企业智能服务

如何在 15 分钟内度量 DORA 指标?

思码逸研发效能

研发效能

企业数据上云,华为云数据库 GaussDB(for MySQL)轻松解决

科技之光

MAXHUB+腾讯会议:为未来办公造一部动力引擎

脑极体

基于Redis实现DelayQueue延迟队列设计方案(附源码)

石臻臻的杂货铺

redis

Mysql到TiDB迁移,双写数据库兜底方案

京东科技开发者

数据库 开源 开发 迁移 双写数据库

内卷时代,华为云引领移动办公新潮流

清欢科技

云上数字化时代,华为云桌面助力政企办公升级

IT科技苏辞

架构实战营模块三作业

张贺

如何写一个深度学习编译器

MegEngineBot

深度学习 开源 编译器 MegEngine MegCC

使用 QuTrunk+Amazon ParallelCluster3 进行并行计算

亚马逊云科技 (Amazon Web Services)

亚马逊云科技 Hero 专栏

直呼内行,华为云桌面就是这么专业

IT科技苏辞

2022-12-27:etcd是无界面的,不好看,joinsunsoft/etcdv3-browser是etcd的web可视化工具之一。请问在k3s中部署,yaml如何写?

福大大架构师每日一题

云原生 k8s etcd k3s 福大大

【web 开发基础】PHP数组元素的添加和删除操作 (49)

迷彩

数组 数组操作 PHP基础 先进先出 后进先出

TCP-SYN超时重传问题排查

Kevin Wu

高并发 网关 TCP协议

Elasticsearch查询及聚合类DSL语句宝典

京东科技开发者

数据库 存储 ES dsl 查询语句

Content-Length使用不规范导致Socket Hang Up问题

Kevin Wu

TCP HTTP HttpClient content-length

守护企业数据安全,华为云数据库 GaussDB(for MySQL)有绝招

科技之光

数字孪生赋能智慧港口解决方案,助力港口数字化转型

袋鼠云数栈

数字孪生

数据可视化软件有哪些?

优秀

数据可视化工具

LLM技术在有道词典笔上的应用实践|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章