写点什么

大模型赛道再添新玩家,快手自研大模型“快意”亮相

  • 2023-08-21
    北京
  • 本文字数:878 字

    阅读完需:约 3 分钟

大模型赛道再添新玩家,快手自研大模型“快意”亮相

近日,快手自研的大语言模型“快意”(KwaiYii)已开启内测,并为业务团队提供了标准 API 和定制化项目合作方案。

 

GitHub 链接:

https://github.com/kwai/KwaiYii

 

据官方介绍,快意大模型(KwaiYii) 是由快手 AI 团队从零到一独立自主研发的一系列大规模语言模型(Large Language Model,LLM),当前包含了多种参数规模的模型,并覆盖了预训练模型(KwaiYii-Base)、对话模型(KwaiYii-Chat)。

 

其中,13B 规模的系列模型 KwaiYii-13B 主要特点包括:


  • KwaiYii-13B-Base 预训练模型具备强大的通用技术支撑能力,在鳄鱼权威的中/英文基准上取得了同等模型尺寸下的 State-Of-The-Art 效果。例如,KwaiYii-13B-Base 预训练模型在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前达到同等模型规模的领先水平。

  • KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明 KwaiYii-13B-Chat 超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近 ChatGPT(3.5)同等水平。

 

据介绍,快意大模型(KwaiYii)在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前处于同等模型规模的领先水平,在最新的 CMMLU 中文向排名中,快意的 13B 版本 KwaiYii-13B 同时位列 five-shot 和 zero-shot 下的第一名,在人文学科、中国特定主题等方面较强,平均分超 61 分。

 

KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务。


快手方面表示,从人工评估的结果来看,KwaiYii-13B-Chat 超过了同等规模的开源模型,并接近 ChatGPT 同等水平。在内容创作、信息咨询、逻辑推理和数学解题上,基本与 ChatGPT(3.5)效果相当。在多轮对话能力方面,KwaiYii-13B-Chat 超过同等规模的开源模型,但与 ChatGPT(3.5)仍有一定差距。注意:人工评估结果受到评测数据覆盖面、标注主观性等因素的影响,无法全面反映大语言模型的所有能力。



据悉,快手 AI 团队将持续迭代“快意”大模型,一方面将继续优化模型性能并研发多模态能力 ,另一方面也在推进更多 C 端与 B 端业务场景下的落地 。

2023-08-21 11:294164

评论

发布
暂无评论
发现更多内容

同事每天早下班,原来是用了这8个开发工具

慕枫技术笔记

后端 开发 11月月更

Element UI 省市区数据联动

源字节1号

微信小程序 软件开发 前端开发 后端开发

【鲲鹏BoostKit】OminiRuntime ——高效统一的大数据分析Runtime底座

Geek_2d6073

Vue虚拟dom是如何被创建的

yyds2026

Vue

深度理解Redux原理并实现一个redux

夏天的味道123

React

网易数帆加入星策社区,携手推进企业智能化转型进程

星策开源社区

开源 AI 开源社区 企业转型 数智化转型

人工智能自然语言处理之数据增强去噪类别不平衡模型轻量化

XiaoChao_AI

人工智能 nlp 数据预处理 11月月更

人工智能机器学习之Bagging算法

XiaoChao_AI

人工智能 机器学习 11月月更

几个你必须知道的React错误实践

xiaofeng

React

vue中的几个高级概念

yyds2026

Vue

vue3实战-完全掌握ref、reactive

yyds2026

Vue

webpack配置优化,让你的构建速度飞起

Geek_02d948

webpack

Nodejs相关ORM框架分析

coder2028

node.js

Spring框架中都用到了哪些设计模式 ?

千锋IT教育

深度讲解React Props

夏天的味道123

React

深入分析React-Scheduler原理

xiaofeng

React

火山引擎DataTester :让字节“跳动”起来的A/B实验平台

字节跳动数据平台

大数据 火山引擎 A/B 测试

蜂巢再获权威认可 | 一个被甲方、乙方都认可的测评

青藤云安全

网络安全

个保法一周年:APP监听?算法为洪水猛兽?看看专家如何解读

科技热闻

webpack模块化的原理

Geek_02d948

webpack

Nodejs+Redis实现简易消息队列

coder2028

node.js

彻底搞懂React-hook链表构建原理

夏天的味道123

React

简单两步,使用 cache 加快极狐GitLab CI/CD 构建速度

极狐GitLab

DevOps CI/CD cache runner 极狐GitLab

webpack热更新原理(面试大概率会问)

Geek_02d948

webpack

人工智能机器学习之Boosting算法

XiaoChao_AI

人工智能 机器学习 11月月更

人工智能自然语言处理之Transformer阐述

XiaoChao_AI

人工智能 自然语言处理 Transformer 11月月更

Nodejs:ESModule和commonjs,傻傻分不清

coder2028

node.js

js作用域、作用域链和它的一些优化

hellocoder2029

JavaScript

javascript尾递归优化

hellocoder2029

JavaScript

为啥不适合,依然有很多人大张旗鼓搞企业内部开源?(下)

laofo

研发效能

升级到React-Router-v6

xiaofeng

React

大模型赛道再添新玩家,快手自研大模型“快意”亮相_生成式 AI_凌敏_InfoQ精选文章