【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

OPPO 推出自主训练大模型 AndesGPT,初衷是智能助手的技术升级

  • 2023-11-16
    北京
  • 本文字数:928 字

    阅读完需:约 3 分钟

大小:474.34K时长:02:41
OPPO推出自主训练大模型AndesGPT,初衷是智能助手的技术升级

11 月 16 日,在2023 OPPO开发者大会上,OPPO 正式推出了自主训练的大模型 AndesGPT。


据介绍,AndesGPT 拥有对话增强、个性专属和端云协同三大技术特征,对于大模型带来的变革,OPPO 认为体现在四个方面:知识、 记忆、工具和创作


  • 在知识能力方面,AndesGPT 融合了知识图谱及通用搜索能力,为用户提供更专业的问答。通过知识增强技术,将外部知识与模型融合生成结果,降低幻觉。

  • 在记忆能力方面,AndesGPT 实现长期记忆机制,以支持无限长度的上下文和有状态服务。而长期记忆带来首字推理延迟这个技术挑战。为了解决该难题,OPPO 研发了一种注意力算 法命名为 SwappedAttention。SwappedAttention 能够在多轮长上下文对话中,有效降低每个 query 的首字推理时长。其核心技术原理是,通过外部存储和 KV 压缩的方式实现会话级 KV 缓存。结合 PagedAttention 算法一起使用,能够带来 50%的首字延迟降低,以及 30%的推理吞吐提升。

  • 工具使用也是 AndesGPT 一项核心能力,更好的理解设备控制与服务 API,端到端生成可执行指令。 目前 AndesGPT 已支持使用系统设置、一方应用、三方服务、代码解释器等各类工具。

  • 在创作方面,AndesGPT 已全面支持文生图与图生图场景。



AndesGPT 主要训练三种参数规格的模型——AndesGPT-Tiny、AndesGPT-Turbo 和 AndesGPT-Titan,可根据不同场景灵活选择。AndesGPT 使用行业主流的网络结构,主要做了两个组合优化:

  1. RoPE 位置编码探索了 base 的最优值,结合 log-scale 和 attention 加 bias,扩展外推能力;

  2. GQA 结合复杂移动窗口(Dilated Attention)加速了训练和推理,实现了 O(Nd)的线性复杂度。


OPPO 数智工程事业部总裁刘海锋在接受 InfoQ 采访时表示,OPPO 做大模型的一个最基本的初衷就是升级智能助手产品,让小布助手变得更有用更智能。“对于手机厂商或者智能终端厂商、本来就有智能助手的团队来说,这个事儿是非常自然且水到渠成的,因为我们有现实的用户的需求,有数据的积累,也有一些 knowhow 积累,那么我们肯定要做技术升级。”


除了落地应用,OPPO 还在推进产学研联合促进前沿技术研究。去年 OPPO 联合中国科学技术大学成立的智能计算联合实验室,已将大模型技术作为核心研究方向。此外,OPPO 还和国内外超过 45 所重点院校建立了 AI 相关的合作。未来,AndesGPT 还将面向开发者开放核心的智能体开发平台。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-11-16 16:336147

评论

发布
暂无评论
发现更多内容

E往无前|腾讯云大数据ES索引原理剖析及写入性能优化最佳实践

腾讯云大数据

ES

联邦云,一站式多云多活平台!

如水

联邦云 多云多活

InterSystems 数据库的存储过程存在哪里

HoneyMoose

技术人的 2023 用QCon大会画上完美句号

IT蜗壳-Tango

Qcon

Databend 部署与运维概要:本地部署 Meta 服务并利用 Kubernetes 管理 Query 服务

Databend

QCN9274, QCN9024-QCA9880 three different chips - how are they connected?

wifi6-yiyi

QCN9024 qcn9274

畅捷通的 Serverless 探索实践之路

阿里巴巴云原生

阿里云 Serverless 云原生

作为铭文跨链赛道龙头,SoBit 有何突出之处?

长安区块链

一款降压型开关模式转换器解决方案

智趣匠

软件开发者必读!2024年30大趋势提前曝光!

SoFlu软件机器人

基于深度学习的探地雷达图像去杂波

小酌江风雪

基于开源模型搭建实时人脸识别系统(六):人脸识别(人脸特征提取)

EquatorCoco

开源 刷脸支付 人脸

TDengine 2023 年成绩单“曝光”,六大维度彰显卓越成就

TDengine

tdengine 时序数据库

2023 年总结与技术心得

Geek_231712

仪表盘、数据分析新增分享功能及应用服务下新增服务实例菜单

博睿数据

聚道云软件连接器助力企业微信与U9无缝对接,审批通知考勤一网打尽

聚道云软件连接器

案例分享

钉钉集成金蝶云星辰丨聚道云助力企业实现财务流程自动化

聚道云软件连接器

案例分享

大模型和深度学习的工作总结

6个核桃

Python笔记三之闭包与装饰器

Hunter熊

Python 装饰器 闭包 装饰器类 装饰器参数

重磅发布|博睿数据2023年度精选案例集—— IT运维之光

博睿数据

可观测性

【并发编程】CountDownLatch详解与原理

小明Java问道之路

并发编程 AQS 后端 多线程 CountDownLatch

深入理解技术内容运营

小万哥

程序人生 软件工程 后端开发 技术写作 内容运营

喜讯!MIAOYUN正式获封“专精特新”中小企业称号!

MIAOYUN

四川省创新型中小企业 专精特新 MIAOYUN 专精特新中小企业 成都高新梯度培育企业

京东方董事长署名文章:新元肇启:敬征程,致未来!

科技热闻

2023:突破迷雾,追寻不惑之旅

BY林子

TDengine 技术培训班开课,来听“地震烈度速报与预警工程”成功案例

TDengine

tdengine 时序数据库

作为铭文跨链赛道龙头,SoBit 有何突出之处?

大瞿科技

联邦云高效的云计算解决方案

如水

联邦云 多云多活

元数据中心的数据有哪些分类?

如水

元数据

AfterShip 举办首届 Hack-day 论坛,用技术助力业务增长,赋能研发提效

科技热闻

2024-拒绝瞎忙,专注一件事

玄兴梦影

总结 质量 专注

OPPO推出自主训练大模型AndesGPT,初衷是智能助手的技术升级_生成式 AI_罗燕珊_InfoQ精选文章