写点什么

大模型赛道再添新玩家,快手自研大模型“快意”亮相

  • 2023-08-21
    北京
  • 本文字数:878 字

    阅读完需:约 3 分钟

大模型赛道再添新玩家,快手自研大模型“快意”亮相

近日,快手自研的大语言模型“快意”(KwaiYii)已开启内测,并为业务团队提供了标准 API 和定制化项目合作方案。

 

GitHub 链接:

https://github.com/kwai/KwaiYii

 

据官方介绍,快意大模型(KwaiYii) 是由快手 AI 团队从零到一独立自主研发的一系列大规模语言模型(Large Language Model,LLM),当前包含了多种参数规模的模型,并覆盖了预训练模型(KwaiYii-Base)、对话模型(KwaiYii-Chat)。

 

其中,13B 规模的系列模型 KwaiYii-13B 主要特点包括:


  • KwaiYii-13B-Base 预训练模型具备强大的通用技术支撑能力,在鳄鱼权威的中/英文基准上取得了同等模型尺寸下的 State-Of-The-Art 效果。例如,KwaiYii-13B-Base 预训练模型在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前达到同等模型规模的领先水平。

  • KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明 KwaiYii-13B-Chat 超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近 ChatGPT(3.5)同等水平。

 

据介绍,快意大模型(KwaiYii)在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前处于同等模型规模的领先水平,在最新的 CMMLU 中文向排名中,快意的 13B 版本 KwaiYii-13B 同时位列 five-shot 和 zero-shot 下的第一名,在人文学科、中国特定主题等方面较强,平均分超 61 分。

 

KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务。


快手方面表示,从人工评估的结果来看,KwaiYii-13B-Chat 超过了同等规模的开源模型,并接近 ChatGPT 同等水平。在内容创作、信息咨询、逻辑推理和数学解题上,基本与 ChatGPT(3.5)效果相当。在多轮对话能力方面,KwaiYii-13B-Chat 超过同等规模的开源模型,但与 ChatGPT(3.5)仍有一定差距。注意:人工评估结果受到评测数据覆盖面、标注主观性等因素的影响,无法全面反映大语言模型的所有能力。



据悉,快手 AI 团队将持续迭代“快意”大模型,一方面将继续优化模型性能并研发多模态能力 ,另一方面也在推进更多 C 端与 B 端业务场景下的落地 。

2023-08-21 11:295377

评论

发布
暂无评论
发现更多内容

Numpy可视化绘图

Peter

机器学习 数据分析 Numpy

架构实战营 第 4 期 模块七作业

架构实战营 模块七 王者荣耀 「架构实战营」

基于LSTM模型的共享自行车需求预测

Peter

Python 机器学习 深度学习 算法

MySQL RR级别的实现

JavaEdge

2月月更

哪个低代码平台上手度对小白更友好?专业测评来了!

优秀

低代码 应用开发

实力与颜值并存 —— Apache Pulsar PMC 成员刘昱专访

Apache Pulsar

开源 云原生 Apache Pulsar 社区

聊聊 Pulsar: 在 Linux 环境上搭建 Pulsar

老周聊架构

云原生 Apache Pulsar 2月月更

从冬奥看中国科技(四):“一鱼多吃”的5G

脑极体

裸辞全职开源的监控告警项目

TanCloud探云

开源 云服务 监控系统 监控告警

从线程与进程的区别这一问题出发

宇宙之一粟

操作系统 2月月更

机器学习神器Scikit-Learn入门

Peter

数据挖掘 机器学习 算法

Nacos中服务删除不了,怎么办?

王磊

springcloudAlibaba

WebRTC 服务器架构 | 社区征文

liuzhen007

音视频 新春征文 2月月更

musl堆利用技巧,你知道多少

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 安全漏洞

王者荣耀异地多活架构设计

AUV

「架构实战营」

尚硅谷Kafka新版视频教程发布

@零度

大数据开发 kafka 3.X

模块七

撿破爛ぃ

架构训练营

用命令行做数据科学(上)

Render

《MySQL入门很轻松》第5章:数据完整性及其分类

乌龟哥哥

数据库 2月月更

再见收费的Navicat!操作所有数据库就靠它了!

沉默王二

Java

Web_Components 系列(九)—— Shadow Host 的 CSS 选择器

编程三昧

前端 组件化 2月月更 WebComponent

Linux系统编程-进程间通信(管道)

DS小龙哥

2月月更

AngularJS + Ionic 开发移动端 Hybrid 项目实战总结| 社区征文

No Silver Bullet

angular.js 经验分享 Ionic 新春征文 2月月更

web技术分享| WebRTC记录音视频流

anyRTC开发者

前端 音视频 WebRTC web技术 实时通讯

「重磅消息」OpenMLDB 官方网站 正式上线!

第四范式开发者社区

机器学习 大数据 OpenMLDB

产品经理沟通技巧

史前靓仔

职场 产品经理 沟通技巧

基于随机森林模型的心脏病人预测分类

Peter

Python 机器学习 算法

图解Numpy教程

Peter

Python 机器学习 Numpy

机器学习入门知识

Peter

Python 机器学习 算法 监督学习

剑指offer笔试题 · 常量字符串

安然无虞

C语言

模块七作业

黄秀明

「架构实战营」

大模型赛道再添新玩家,快手自研大模型“快意”亮相_生成式 AI_凌敏_InfoQ精选文章