写点什么

大模型赛道再添新玩家,快手自研大模型“快意”亮相

  • 2023-08-21
    北京
  • 本文字数:878 字

    阅读完需:约 3 分钟

大模型赛道再添新玩家,快手自研大模型“快意”亮相

近日,快手自研的大语言模型“快意”(KwaiYii)已开启内测,并为业务团队提供了标准 API 和定制化项目合作方案。

 

GitHub 链接:

https://github.com/kwai/KwaiYii

 

据官方介绍,快意大模型(KwaiYii) 是由快手 AI 团队从零到一独立自主研发的一系列大规模语言模型(Large Language Model,LLM),当前包含了多种参数规模的模型,并覆盖了预训练模型(KwaiYii-Base)、对话模型(KwaiYii-Chat)。

 

其中,13B 规模的系列模型 KwaiYii-13B 主要特点包括:


  • KwaiYii-13B-Base 预训练模型具备强大的通用技术支撑能力,在鳄鱼权威的中/英文基准上取得了同等模型尺寸下的 State-Of-The-Art 效果。例如,KwaiYii-13B-Base 预训练模型在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前达到同等模型规模的领先水平。

  • KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明 KwaiYii-13B-Chat 超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近 ChatGPT(3.5)同等水平。

 

据介绍,快意大模型(KwaiYii)在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前处于同等模型规模的领先水平,在最新的 CMMLU 中文向排名中,快意的 13B 版本 KwaiYii-13B 同时位列 five-shot 和 zero-shot 下的第一名,在人文学科、中国特定主题等方面较强,平均分超 61 分。

 

KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务。


快手方面表示,从人工评估的结果来看,KwaiYii-13B-Chat 超过了同等规模的开源模型,并接近 ChatGPT 同等水平。在内容创作、信息咨询、逻辑推理和数学解题上,基本与 ChatGPT(3.5)效果相当。在多轮对话能力方面,KwaiYii-13B-Chat 超过同等规模的开源模型,但与 ChatGPT(3.5)仍有一定差距。注意:人工评估结果受到评测数据覆盖面、标注主观性等因素的影响,无法全面反映大语言模型的所有能力。



据悉,快手 AI 团队将持续迭代“快意”大模型,一方面将继续优化模型性能并研发多模态能力 ,另一方面也在推进更多 C 端与 B 端业务场景下的落地 。

2023-08-21 11:294817

评论

发布
暂无评论
发现更多内容

SpringBoot 实战:一招实现结果的优雅响应

看山

springboot 实战

一网打尽 Java 并发模型

苹果看辽宁体育

Java 后端 并发

计算机网络基础(十八)---传输层-TCP的流量控制

书旅

TCP 计算机网络 协议栈 网络层 流量控制

B 站收藏 10W+,GitHub 标星 6K+,肝了这门计算机速成课!

JackTian

GitHub 编程 程序员 B站 计算机基础

哈希算法的设计要点、应用场景

多选参数

哈希 hash 哈希算法

mini-vue之proxy代理

晓枫

vue.js

悄咪咪提高团队幸福感 & Surprise!

Kerwin

Java 开源

前端科普系列(1):前端简史

vivo互联网技术

html 大前端 Web

[高冷面试]好不容易走到HR,结果被HR盘了,14题带走

我是程序员小贱

centos中Anaconda的安装以及keras安装

我是程序员小贱

翻译: Effective Go (4)

申屠鹏会

翻译 Go 语言

192.168.52.165/25是啥意思?

书旅

IP 网络 CIDR

OpenTSDB 数据存储详解

vivo互联网技术

数据库 时序数据库

架构师训练营 W10 作业

telliex

第十周学习总结

刘卓

第十周学习总结

菲尼克斯

易观方舟70秒可视化埋点SDK全部开源!

易观大数据

埋点

如何让“哑”终端进化,你知道吗?

华为云开发者联盟

操作系统 物联网 IoT 华为云 LiteOS

拼多多员工曝离职黑幕:要走可以,要离职证明,没有!

程序员生活志

职场 互联网公司

LeetCode题解:88. 合并两个有序数组,双指针+从前往后+使用新数组Copy,JavaScript,详细注释

Lee Chen

大前端

全民加速节:全站加速在游戏行业的最佳实践

阿里云Edge Plus

CDN 动态加速

为什么需要企业架构师?

周金根

React TypeScript项目基本构建

JackWangGeek

FastDFS不同步怎么破

心平气和

Binlog 同步 fastdfs

计算机网络怎么学?学会这几个工具有助你理解网络协议!

我是程序员小贱

linux终端的快捷命令汇总

良知犹存

Linux

第十周命题作业

菲尼克斯

HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第6章表格与表单

Geek_8dbdc1

第十周作业

刘卓

第10周作业

小胖子

HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第7章定位

Geek_8dbdc1

大模型赛道再添新玩家,快手自研大模型“快意”亮相_生成式 AI_凌敏_InfoQ精选文章