写点什么

OPPO 推出自主训练大模型 AndesGPT,初衷是智能助手的技术升级

  • 2023-11-16
    北京
  • 本文字数:928 字

    阅读完需:约 3 分钟

大小:474.34K时长:02:41
OPPO推出自主训练大模型AndesGPT,初衷是智能助手的技术升级

11 月 16 日,在2023 OPPO开发者大会上,OPPO 正式推出了自主训练的大模型 AndesGPT。


据介绍,AndesGPT 拥有对话增强、个性专属和端云协同三大技术特征,对于大模型带来的变革,OPPO 认为体现在四个方面:知识、 记忆、工具和创作


  • 在知识能力方面,AndesGPT 融合了知识图谱及通用搜索能力,为用户提供更专业的问答。通过知识增强技术,将外部知识与模型融合生成结果,降低幻觉。

  • 在记忆能力方面,AndesGPT 实现长期记忆机制,以支持无限长度的上下文和有状态服务。而长期记忆带来首字推理延迟这个技术挑战。为了解决该难题,OPPO 研发了一种注意力算 法命名为 SwappedAttention。SwappedAttention 能够在多轮长上下文对话中,有效降低每个 query 的首字推理时长。其核心技术原理是,通过外部存储和 KV 压缩的方式实现会话级 KV 缓存。结合 PagedAttention 算法一起使用,能够带来 50%的首字延迟降低,以及 30%的推理吞吐提升。

  • 工具使用也是 AndesGPT 一项核心能力,更好的理解设备控制与服务 API,端到端生成可执行指令。 目前 AndesGPT 已支持使用系统设置、一方应用、三方服务、代码解释器等各类工具。

  • 在创作方面,AndesGPT 已全面支持文生图与图生图场景。



AndesGPT 主要训练三种参数规格的模型——AndesGPT-Tiny、AndesGPT-Turbo 和 AndesGPT-Titan,可根据不同场景灵活选择。AndesGPT 使用行业主流的网络结构,主要做了两个组合优化:

  1. RoPE 位置编码探索了 base 的最优值,结合 log-scale 和 attention 加 bias,扩展外推能力;

  2. GQA 结合复杂移动窗口(Dilated Attention)加速了训练和推理,实现了 O(Nd)的线性复杂度。


OPPO 数智工程事业部总裁刘海锋在接受 InfoQ 采访时表示,OPPO 做大模型的一个最基本的初衷就是升级智能助手产品,让小布助手变得更有用更智能。“对于手机厂商或者智能终端厂商、本来就有智能助手的团队来说,这个事儿是非常自然且水到渠成的,因为我们有现实的用户的需求,有数据的积累,也有一些 knowhow 积累,那么我们肯定要做技术升级。”


除了落地应用,OPPO 还在推进产学研联合促进前沿技术研究。去年 OPPO 联合中国科学技术大学成立的智能计算联合实验室,已将大模型技术作为核心研究方向。此外,OPPO 还和国内外超过 45 所重点院校建立了 AI 相关的合作。未来,AndesGPT 还将面向开发者开放核心的智能体开发平台。

2023-11-16 16:336560

评论

发布
暂无评论
发现更多内容

SpringCloud Alibaba微服务实战二 - 服务注册

AI乔治

Java 架构 微服务 Spring Cloud

SpringCloud Alibaba微服务实战七 - 分布式事务

AI乔治

Java 架构 微服务 Spring Cloud

耗子尾汁,你居然还不懂什么是架构师?那你编码为了什么?还不看阿里人怎么判定吗?

小Q

Java 学习 编程 架构 面试

智慧公安二维码报警定位系统,高速路二维码定位报警开发

13530558032

对于CRM之于现代化企业的影响以及作用的分析

Learun

敏捷开发 CRM 客户关系管理

数据库:我没有带闪,不讲武德

比伯

Java 编程 程序员 面试 计算机

一文带你读懂!华为云在ACMUG技术沙龙上都透露了些啥?

华为云开发者联盟

数据库 大数据 数据

字节跳动总监总结的开发笔记火了!在知乎上已超5000赞!

Java架构师迁哥

利用区块链数字化人民币,中国有望从追随者变为新秩序的领导者

CECBC

区块链 数字人民币

SpringCloud Alibaba微服务实战六 - 配置隔离

AI乔治

Java 架构 微服务 Spring Cloud

Docker基础与实战,看这一篇就够了

AI乔治

Java Docker spring 架构

区块链+数字版权:区块链助力版权保护

13530558032

字节跳动的这份《算法中文手册》火了,完整版PDF开放下载!不少小伙伴靠这份指南成功掌握了算法的核心技能,成功拿到了 BATJ等大厂offer。

Java架构之路

Java 程序员 架构 面试 编程语言

SpringCloud Alibaba微服务实战四 - 版本管理

AI乔治

Java 架构 微服务 Spring Cloud

年轻人不讲武德!Security五套「源码级」笔记哪里来的?

小Q

学习 编程 面试 spring security SpringCloud

阿里P8熬夜完成这两份800页Java面试核心知识原理+框架

Java~~~

Java 程序员 面试 编程语言 架构师

区块链的常识之,什么是区块链股份授权证明机制DPoS?

CECBC

区块链 共识机制

SpringCloud Alibaba微服务实战三 - 服务调用

AI乔治

Java 架构 微服务 Spring Cloud

SpringCloud Alibaba微服务实战五 - 限流熔断

AI乔治

Java 架构 微服务 Spring Cloud

SpringCloud Alibaba微服务实战十 - 服务网关SpringCloud Gateway

AI乔治

Java 架构 微服务 Spring Cloud

第11代酷睿处理器出色体验的奥秘原来是这个!

E科讯

一次带你全面解析Nginx,从安装JDK开始讲起,收藏当手册

996小迁

Java 学习 编程 架构 面试

奉劝各位准备面试的Java程序员耗子尾汁赶紧扔掉网上那些千篇一律的面试题,这份《写给大忙人看的Java核心技术》能够让你快速复习

Java架构之路

Java 程序员 架构 面试 编程语言

朋友不讲武德急催我给他Java干货教程,我劝他耗子尾汁并丢给他一份GitHub上标星115k+的Java教程,他看了之后连忙向我道歉!

Java架构之路

Java 程序员 架构 面试 编程语言

SpringCloud Alibaba微服务实战八 - Seata 整合Nacos

AI乔治

Java 架构 微服务 Spring Cloud

如何在ForeSpider数据采集器中设置代理IP

前嗅大数据

大数据 爬虫 数据采集 代理IP 代理IP设置

面试官都爱问的ThreadLocal

执墨

ThreadLocal 哈希表 弱引用

SpringCloud Alibaba微服务实战一基础环境准备

AI乔治

Java 架构 微服务 Spring Cloud

SpringCloud Alibaba微服务实战九 - Seata 容器化

AI乔治

Java 架构 微服务 Spring Cloud

区块链农产品溯源解决方案,农产品追溯系统价格

13530558032

想了解物联网应用的自动部署,看这篇就够了

华为云开发者联盟

服务器 华为云 部署

OPPO推出自主训练大模型AndesGPT,初衷是智能助手的技术升级_生成式 AI_罗燕珊_InfoQ精选文章