写点什么

大模型赛道再添新玩家,快手自研大模型“快意”亮相

  • 2023-08-21
    北京
  • 本文字数:878 字

    阅读完需:约 3 分钟

大模型赛道再添新玩家,快手自研大模型“快意”亮相

近日,快手自研的大语言模型“快意”(KwaiYii)已开启内测,并为业务团队提供了标准 API 和定制化项目合作方案。

 

GitHub 链接:

https://github.com/kwai/KwaiYii

 

据官方介绍,快意大模型(KwaiYii) 是由快手 AI 团队从零到一独立自主研发的一系列大规模语言模型(Large Language Model,LLM),当前包含了多种参数规模的模型,并覆盖了预训练模型(KwaiYii-Base)、对话模型(KwaiYii-Chat)。

 

其中,13B 规模的系列模型 KwaiYii-13B 主要特点包括:


  • KwaiYii-13B-Base 预训练模型具备强大的通用技术支撑能力,在鳄鱼权威的中/英文基准上取得了同等模型尺寸下的 State-Of-The-Art 效果。例如,KwaiYii-13B-Base 预训练模型在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前达到同等模型规模的领先水平。

  • KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明 KwaiYii-13B-Chat 超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近 ChatGPT(3.5)同等水平。

 

据介绍,快意大模型(KwaiYii)在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前处于同等模型规模的领先水平,在最新的 CMMLU 中文向排名中,快意的 13B 版本 KwaiYii-13B 同时位列 five-shot 和 zero-shot 下的第一名,在人文学科、中国特定主题等方面较强,平均分超 61 分。

 

KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务。


快手方面表示,从人工评估的结果来看,KwaiYii-13B-Chat 超过了同等规模的开源模型,并接近 ChatGPT 同等水平。在内容创作、信息咨询、逻辑推理和数学解题上,基本与 ChatGPT(3.5)效果相当。在多轮对话能力方面,KwaiYii-13B-Chat 超过同等规模的开源模型,但与 ChatGPT(3.5)仍有一定差距。注意:人工评估结果受到评测数据覆盖面、标注主观性等因素的影响,无法全面反映大语言模型的所有能力。



据悉,快手 AI 团队将持续迭代“快意”大模型,一方面将继续优化模型性能并研发多模态能力 ,另一方面也在推进更多 C 端与 B 端业务场景下的落地 。

2023-08-21 11:295053

评论

发布
暂无评论
发现更多内容

千万级考试试卷存储方案

张靖

#架构实战营

极客时间算法训练营Week01

jjn0703

算法训练营

css布局之全屏布局

Augus

CSS 11月日更

Go语言学习查缺补漏ing Day3

Regan Yue

Go 语言 11月日更

21 K8S之容器存储接口CSI

穿过生命散发芬芳

k8s 11月日更

在线等比数列求和计算器

入门小站

工具

用AI走出“沙丘”

白洞计划

[Pulsar] 一个消息的生命历程(一)

Zike Yang

Apache Pulsar 11月日更

考试试卷存储架构

AHUI

「架构实战营」

模块四:如何设计业务高性能高可用存储架构?-- 学习总结

小鹿

Golang Gin 框架上传介绍(四)

liuzhen007

11月日更

Python Qt GUI设计:QPushButton、QRadioButton和QCheckBox按钮类(基础篇—12)

不脱发的程序猿

GUI设计 Python Qt QPushButton QRadioButton QCheckBox

第四模块总结

张靖

架构训练营

区块链技术革命才刚刚开始

CECBC

flutter中的列表的性能优化前奏

坚果

flutter 11月日更

主客体建模法

少个分号

spring的事务隔离级别是何许人也

卢卡多多

Spring Framework 隔离级别 11月日更

Lua-Table

Changing Lin

11月日更

模块四作业

心怀架构

Apache Pulsar 与 Apache Kafka 在金融场景下的性能对比分析

Apache Pulsar

大数据 kafka 架构 云原生 Apache Pulsar

堪称数据库的天花板,极致经典的字节内部MySQL宝典意外流出!

热爱java的分享家

Java 面试 程序人生 编程语言 经验分享

模块四

侠客行

架构实战营 「架构实战营」

个人博客网站升级

北漂码农有话说

网站

元宇宙:区块链时代的新名字

CECBC

区块链和人工智能是否可以保护森林不再被砍伐?

CECBC

模块四作业 千万级学生管理系统的考试试卷存储方案

小朱

架构实战营

linux之拖拽上传文件

入门小站

Linux

微服务治理之自适应降载

万俊峰Kevin

微服务 微服务架构 服务治理 go-zero Go 语言

hw4-千万级存储方案

WWH

架构实战营

模块4作业

忘记喝水的猫

架构训练营

公司给我股份,有什么需要注意的吗?

石云升

创业公司 11月日更

大模型赛道再添新玩家,快手自研大模型“快意”亮相_生成式 AI_凌敏_InfoQ精选文章