NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

OPPO 推出自主训练大模型 AndesGPT,初衷是智能助手的技术升级

  • 2023-11-16
    北京
  • 本文字数:928 字

    阅读完需:约 3 分钟

大小:474.34K时长:02:41
OPPO推出自主训练大模型AndesGPT,初衷是智能助手的技术升级

11 月 16 日,在2023 OPPO开发者大会上,OPPO 正式推出了自主训练的大模型 AndesGPT。


据介绍,AndesGPT 拥有对话增强、个性专属和端云协同三大技术特征,对于大模型带来的变革,OPPO 认为体现在四个方面:知识、 记忆、工具和创作


  • 在知识能力方面,AndesGPT 融合了知识图谱及通用搜索能力,为用户提供更专业的问答。通过知识增强技术,将外部知识与模型融合生成结果,降低幻觉。

  • 在记忆能力方面,AndesGPT 实现长期记忆机制,以支持无限长度的上下文和有状态服务。而长期记忆带来首字推理延迟这个技术挑战。为了解决该难题,OPPO 研发了一种注意力算 法命名为 SwappedAttention。SwappedAttention 能够在多轮长上下文对话中,有效降低每个 query 的首字推理时长。其核心技术原理是,通过外部存储和 KV 压缩的方式实现会话级 KV 缓存。结合 PagedAttention 算法一起使用,能够带来 50%的首字延迟降低,以及 30%的推理吞吐提升。

  • 工具使用也是 AndesGPT 一项核心能力,更好的理解设备控制与服务 API,端到端生成可执行指令。 目前 AndesGPT 已支持使用系统设置、一方应用、三方服务、代码解释器等各类工具。

  • 在创作方面,AndesGPT 已全面支持文生图与图生图场景。



AndesGPT 主要训练三种参数规格的模型——AndesGPT-Tiny、AndesGPT-Turbo 和 AndesGPT-Titan,可根据不同场景灵活选择。AndesGPT 使用行业主流的网络结构,主要做了两个组合优化:

  1. RoPE 位置编码探索了 base 的最优值,结合 log-scale 和 attention 加 bias,扩展外推能力;

  2. GQA 结合复杂移动窗口(Dilated Attention)加速了训练和推理,实现了 O(Nd)的线性复杂度。


OPPO 数智工程事业部总裁刘海锋在接受 InfoQ 采访时表示,OPPO 做大模型的一个最基本的初衷就是升级智能助手产品,让小布助手变得更有用更智能。“对于手机厂商或者智能终端厂商、本来就有智能助手的团队来说,这个事儿是非常自然且水到渠成的,因为我们有现实的用户的需求,有数据的积累,也有一些 knowhow 积累,那么我们肯定要做技术升级。”


除了落地应用,OPPO 还在推进产学研联合促进前沿技术研究。去年 OPPO 联合中国科学技术大学成立的智能计算联合实验室,已将大模型技术作为核心研究方向。此外,OPPO 还和国内外超过 45 所重点院校建立了 AI 相关的合作。未来,AndesGPT 还将面向开发者开放核心的智能体开发平台。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-11-16 16:336142

评论

发布
暂无评论
发现更多内容

Zabbix 产品周期

耳东@Erdong

zabbix 4月日更 lifecycle

css中的动画效果

赫鲁小夫

4月日更

签约作者可视化

IT蜗壳-Tango

4月日更

线上服务 CPU 100%?一键定位 so easy!

Java小咖秀

性能 cpu 负载 线上排障 线上问题

边缘计算应用的价值

浪潮云

云计算

有了这个数据强一致“利器”,DBA们轻松修复数据对加班“say no”

华为云开发者联盟

存算分离 华为云数据库 GaussDB(for Cassandra) 强一致 开源Cassandra

「免费开源」基于Vue和Quasar的前端SPA项目crudapi后台管理系统实战之docker部署(八)

crudapi

Docker Vue crud crudapi quasar

清理SpringBoot应用无用的metrics指标

远鹏

Java springboot metrics micrometer

转正还是离职?这是一个问题么?

escray

面试 面经 4月日更

HECO火币生态链智能合约Dapp软件系统APP开发

系统开发

nginx性能优化--配置解析

箭上有毒

nginx 性能测试 4月日更

智慧公安重点人员管控系统搭建,重点人员管控解决方案

13828808769

智慧交通

架構設計訓練營作業 2

海罗沃德

架构实战营

微服务网关的一点思考

程序员架构进阶

架构 自我提升 api 网关 28天写作 4月日更

Spark数据倾斜解决方案实战(三)

小舰

4月日更

nginx.conf核心配置

马里奥

nginx Configuration 配置

【LeetCode】二叉搜索树节点最小距离Java题解

Albert

算法 LeetCode 4月日更

变易世界,简易战略,不易华为

脑极体

区块链农产品防伪溯源平台,助力赣南脐橙产业发展

13828808769

区块链+ #区块链#

区块链电子合同签署平台,区块链电子合同解决方案

13828808769

区块链+ #区块链#

基于拉链式和线性探测式散列表实现Map

Silently9527

Java hashmap 线性探测 拉链式散列表 散列表

新特性巨量来袭,MindSpore开源一周年实力“狂欢”

华为云开发者联盟

开源 modelarts mindspore 数据预处理加速 分子模拟库

Linux crontab 命令

一个大红包

Linux linux命令 4月日更

方寸之间,书写天地

小天同学

个人总结 4月日更 1 周年盛典 我和写作平台的故事 InfoQ 写作平台 1 周年

带你全面认识CMMI V2.0(终)——实施落地

IPD产品研发管理

项目管理 软件 CMMI

计算机原理学习笔记 Day3

穿过生命散发芬芳

计算机原理 4月日更

领域驱动设计(DDD):领域和子域

xcbeyond

领域驱动设计 DDD 4月日更

Dubbo 编解码那些事

vivo互联网技术

dubbo RPC 序列化 编解码

产品 0 期 - 第八周作业

vipyinzhiwei

Python OpenCV 边缘滤波保留(EPF)

梦想橡皮擦

Python OpenCV 4月日更

可视化运行Python的神器Jupyter Notebook

程序那些事

Python Jupyter Notebook 程序那些事

OPPO推出自主训练大模型AndesGPT,初衷是智能助手的技术升级_生成式 AI_罗燕珊_InfoQ精选文章