AICon日程100%就绪,9折倒计时最后一周 了解详情
写点什么

OPPO 推出自主训练大模型 AndesGPT,初衷是智能助手的技术升级

  • 2023-11-16
    北京
  • 本文字数:928 字

    阅读完需:约 3 分钟

大小:474.34K时长:02:41
OPPO推出自主训练大模型AndesGPT,初衷是智能助手的技术升级

11 月 16 日,在2023 OPPO开发者大会上,OPPO 正式推出了自主训练的大模型 AndesGPT。


据介绍,AndesGPT 拥有对话增强、个性专属和端云协同三大技术特征,对于大模型带来的变革,OPPO 认为体现在四个方面:知识、 记忆、工具和创作


  • 在知识能力方面,AndesGPT 融合了知识图谱及通用搜索能力,为用户提供更专业的问答。通过知识增强技术,将外部知识与模型融合生成结果,降低幻觉。

  • 在记忆能力方面,AndesGPT 实现长期记忆机制,以支持无限长度的上下文和有状态服务。而长期记忆带来首字推理延迟这个技术挑战。为了解决该难题,OPPO 研发了一种注意力算 法命名为 SwappedAttention。SwappedAttention 能够在多轮长上下文对话中,有效降低每个 query 的首字推理时长。其核心技术原理是,通过外部存储和 KV 压缩的方式实现会话级 KV 缓存。结合 PagedAttention 算法一起使用,能够带来 50%的首字延迟降低,以及 30%的推理吞吐提升。

  • 工具使用也是 AndesGPT 一项核心能力,更好的理解设备控制与服务 API,端到端生成可执行指令。 目前 AndesGPT 已支持使用系统设置、一方应用、三方服务、代码解释器等各类工具。

  • 在创作方面,AndesGPT 已全面支持文生图与图生图场景。



AndesGPT 主要训练三种参数规格的模型——AndesGPT-Tiny、AndesGPT-Turbo 和 AndesGPT-Titan,可根据不同场景灵活选择。AndesGPT 使用行业主流的网络结构,主要做了两个组合优化:

  1. RoPE 位置编码探索了 base 的最优值,结合 log-scale 和 attention 加 bias,扩展外推能力;

  2. GQA 结合复杂移动窗口(Dilated Attention)加速了训练和推理,实现了 O(Nd)的线性复杂度。


OPPO 数智工程事业部总裁刘海锋在接受 InfoQ 采访时表示,OPPO 做大模型的一个最基本的初衷就是升级智能助手产品,让小布助手变得更有用更智能。“对于手机厂商或者智能终端厂商、本来就有智能助手的团队来说,这个事儿是非常自然且水到渠成的,因为我们有现实的用户的需求,有数据的积累,也有一些 knowhow 积累,那么我们肯定要做技术升级。”


除了落地应用,OPPO 还在推进产学研联合促进前沿技术研究。去年 OPPO 联合中国科学技术大学成立的智能计算联合实验室,已将大模型技术作为核心研究方向。此外,OPPO 还和国内外超过 45 所重点院校建立了 AI 相关的合作。未来,AndesGPT 还将面向开发者开放核心的智能体开发平台。

2023-11-16 16:336893

评论

发布
暂无评论
发现更多内容

架构师训练营第 11 周——练习

李伟

极客大学架构师训练营

第11周 安全和高可用

陆不得

导致系统不可用的原因有哪些?

leis

奈学:红黑树(RedBlackTree)的概述

奈学教育

AVL

架构师训练营——第11周作业

jiangnanage

甲方日常1

句子

工作 随笔杂谈 日常

区块链技术可提高数据可信性和安全性

CECBC

区块链技术 安全性

架构师训练营第十一章作业

吴吴

week11 作业

雪涛公子

week11 总结

雪涛公子

架构师培训第十一周练习

小蚂蚁

Java二进制和位运算,这一万字准能喂饱你

YourBatman

位运算 二进制

架构师课程第十一周总结

dongge

《黑神话:悟空》出圈背后,国产3A游戏的技术新机

脑极体

奈学:红黑树(RedBlackTree)的概述

古月木易

图解 K8s 核心概念和术语

后端进阶

Docker Kubernetes 容器 云原生 k8s

系统高可用

陈皮

极客大学架构师训练营---习题

李朋

架构师训练营第十一章作业

叮叮董董

Week11总结

leis

【Elasticsearch 技术分享】—— Elasticsearch 存储一条数据, put 过程是什么样子的?

程序员小航

Java elasticsearch 搜索 ES Lucene Elastic Search

架构师训练营——第11周学习总结

jiangnanage

week 11作业

Geek_z9dmvw

LeetCode题解:20. 有效的括号,while循环replace,JavaScript,详细注释

Lee Chen

大前端 LeetCode

合同、封条、电梯……通通上链!

CECBC

区块链技术 监管平台

不可用与高可用

dongge

Cause: java.sql.SQLTimeoutException: ORA-01013: user requested cancel of current

Java个体户

Druid

架构师训练营-第十一周-命题作业

sljoai

极客大学架构师训练营 命题作业 第十一周

对于三千万攀登者来说,云是安全绳,是登山杖,是趋顶之路

脑极体

架构师培训 -11 安全、高可用

刘敏

手写Spring框架之IOC

简爱W

OPPO推出自主训练大模型AndesGPT,初衷是智能助手的技术升级_生成式 AI_罗燕珊_InfoQ精选文章