限时领|《AI 百问百答》专栏课+实体书(包邮)! 了解详情
写点什么

大模型赛道再添新玩家,快手自研大模型“快意”亮相

  • 2023-08-21
    北京
  • 本文字数:878 字

    阅读完需:约 3 分钟

大模型赛道再添新玩家,快手自研大模型“快意”亮相

近日,快手自研的大语言模型“快意”(KwaiYii)已开启内测,并为业务团队提供了标准 API 和定制化项目合作方案。

 

GitHub 链接:

https://github.com/kwai/KwaiYii

 

据官方介绍,快意大模型(KwaiYii) 是由快手 AI 团队从零到一独立自主研发的一系列大规模语言模型(Large Language Model,LLM),当前包含了多种参数规模的模型,并覆盖了预训练模型(KwaiYii-Base)、对话模型(KwaiYii-Chat)。

 

其中,13B 规模的系列模型 KwaiYii-13B 主要特点包括:


  • KwaiYii-13B-Base 预训练模型具备强大的通用技术支撑能力,在鳄鱼权威的中/英文基准上取得了同等模型尺寸下的 State-Of-The-Art 效果。例如,KwaiYii-13B-Base 预训练模型在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前达到同等模型规模的领先水平。

  • KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明 KwaiYii-13B-Chat 超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近 ChatGPT(3.5)同等水平。

 

据介绍,快意大模型(KwaiYii)在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前处于同等模型规模的领先水平,在最新的 CMMLU 中文向排名中,快意的 13B 版本 KwaiYii-13B 同时位列 five-shot 和 zero-shot 下的第一名,在人文学科、中国特定主题等方面较强,平均分超 61 分。

 

KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务。


快手方面表示,从人工评估的结果来看,KwaiYii-13B-Chat 超过了同等规模的开源模型,并接近 ChatGPT 同等水平。在内容创作、信息咨询、逻辑推理和数学解题上,基本与 ChatGPT(3.5)效果相当。在多轮对话能力方面,KwaiYii-13B-Chat 超过同等规模的开源模型,但与 ChatGPT(3.5)仍有一定差距。注意:人工评估结果受到评测数据覆盖面、标注主观性等因素的影响,无法全面反映大语言模型的所有能力。



据悉,快手 AI 团队将持续迭代“快意”大模型,一方面将继续优化模型性能并研发多模态能力 ,另一方面也在推进更多 C 端与 B 端业务场景下的落地 。

2023-08-21 11:294906

评论

发布
暂无评论
发现更多内容

架构实战营 模块一作业

netspecial

架构实战营

机器学习(二):理解线性回归与梯度下降并做简单预测

caiyongji

机器学习

脑机接口简史——假如这篇推送是你靠意念打开的

白洞计划

脑机接口简史——假如这篇推送是你靠意念打开的

脑极体

Vite 2 + React 实践

清秋

less vite antd React 4月日更

支持向量机实现光学字符识别

不脱发的程序猿

人工智能 机器学习 4月日更 支持向量机 实现光学字符识别

为什么数据库字段要使用NOT NULL?

艾小仙

Scrum Patterns:每日Scrum(译)

Bruce Talk

敏捷开发 译文 Agile Scrum Patterns

架构实战营-模块一作业

Sun

编程好习惯之理清函数参数

顿晓

编程好习惯 4月日更

Wireshark数据包分析学习笔记Day25

穿过生命散发芬芳

Wireshark 数据包分析 4月日更

VUE2,基于vue-cli搭建创建vue项目

Chalk

Vue 大前端 4月日更

浅聊函数防抖与节流

程序员海军

JavaScript 大前端 防抖 节流

模块1作业

段吉贵

架构实战营

设计模式-六大设计原则

U2647

设计模式 设计原则 4月日更

架构实战营模块1作业

白发青年

架构实战营

每日总结-2021-04-05

cyningchen

基于二叉树实现Map

Silently9527

Java 二叉树 数据结构与算法

说人话

ES_her0

4月日更

作业1--微信的业务架构及学生管理系统

大可

架构实战营--模块一

永佳

架构实战营

「架构实战营」课堂作业-G20210698010384

张亮

学生管理系统方案架构设计

俞嘉彬

你朋友牛逼跟你有什么关系?

小天同学

自我思考 个人感悟 人生修炼 4月日更

Linux grep 命令

一个大红包

4月日更

PCB如何拼版

不脱发的程序猿

嵌入式 电路设计 硬件设计 4月日更 PCB打样

机器学习和大数据的区别和联系

大数据技术指南

机器学习 大数据 4月日更

怎么画出专业的架构图?

秋天

架构 架构师

starforce源码解读一:关键字partial

风翱

C# 源码阅读 4月日更 游戏框架

模块一:课后作业

菲尼克斯

架构实战营

关于微信架构

俞嘉彬

大模型赛道再添新玩家,快手自研大模型“快意”亮相_生成式 AI_凌敏_InfoQ精选文章