亮网络解锁器,解锁网络数据的无限可能 了解详情
写点什么

适配更多国产芯片,智谱 AI 推出第三代基座大模型 ChatGLM3

  • 2023-10-28
    北京
  • 本文字数:1105 字

    阅读完需:约 4 分钟

大小:593.52K时长:03:22
适配更多国产芯片,智谱AI推出第三代基座大模型ChatGLM3

2023 年 10 月 27 日,智谱AI于 2023 中国计算机大会(CNCC)上,推出了全自研的第三代基座大模型 ChatGLM3 及相关系列产品,这也是智谱 AI 继推出千亿基座的对话模型 ChatGLM 和 ChatGLM2 之后的又一次重大突破。

 

据悉,此次推出的 ChatGLM3 采用了独创的多阶段增强预训练方法,使训练更为充分。评测显示,在 44 个中英文公开数据集测试中,ChatGLM3 在国内同尺寸模型中排名首位。智谱 AI CEO 张鹏在现场做了新品发布,并实时演示了最新上线的产品功能。

 

通过更丰富的训练数据和更优的训练方案,智谱 AI 推出的 ChatGLM3 性能更加强大。与 ChatGLM2 相比,MMLU 提升 36%、CEval 提升 33%、GSM8K 提升 179% 、BBH 提升 126%。

 

同时,ChatGLM3 瞄向 GPT-4V 本次实现了若干全新功能的迭代升级,包括多模态理解能力的 CogVLM-看图识语义,在 10 余个国际标准图文评测数据集上取得 SOTA;代码增强模块 Code Interpreter 根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务;网络搜索增强 WebGLM-接入搜索增强,能自动根据问题在互联网上查找相关资料并在回答时提供参考相关文献或文章链接。ChatGLM3 的语义能力与逻辑能力得到了极大的增强。

 

ChatGLM3 还集成了自研的 AgentTuning 技术,激活了模型智能体能力,尤其在智能规划和执行方面,相比于 ChatGLM2 提升了 1000% ;开启了国产大模型原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。

 

此外,ChatGLM3 本次推出可手机部署的端测模型 ChatGLM3-1.5B 和 ChatGLM3-3B,支持包括 vivo、小米、三星在内的多款手机以及车载平台,甚至支持移动平台上 CPU 芯片的推理,速度可达 20 tokens/s。精度方面 1.5B 和 3B 模型在公开 benchmark 上与 ChatGLM2-6B 模型性能接近。

 

自 2022 年初,智谱 AI 推出的 GLM 系列模型已支持在昇腾、神威超算、海光 DCU 架构上进行大规模预训练和推理。截至目前,智谱 AI 的产品已支持 10 余种国产硬件生态,包括昇腾、神威超算、海光 DCU、海飞科、沐曦曦云、算能科技、天数智芯、寒武纪、摩尔线程、百度昆仑芯、灵汐科技、长城超云等。

 

基于最新的高效动态推理和显存优化技术,ChatGLM3 当前的推理框架在相同硬件、模型条件下,相较于目前最佳的开源实现,包括伯克利大学推出的 vLLM 以及 Hugging Face TGI 的最新版本,推理速度提升了 2-3 倍,推理成本降低一倍,每千 tokens 仅 0.5 分,成本最低。

 

另外,随着 WebGLM 大模型能力的加入,智谱清言也具有了搜索增强能力,可以帮助用户整理出相关问题的网上文献或文章链接,并直接给出答案。此前已发布的 CogVLM 模型则提高了智谱清言的中文图文理解能力,取得了接近 GPT-4V 的图片理解能力,它可以回答各种类型的视觉问题,并且可以完成复杂的目标检测,并打上标签,完成自动数据标注。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-10-28 08:115199

评论

发布
暂无评论
发现更多内容

灵伴科技(Rokid)借助 Knative 实现 AI 应用云原生 Serverless 化

阿里巴巴云原生

阿里云 云原生 云原生容器

MacBooster 8 mac版:一站式系统清理维护工具

Rose

Endurance for Mac 专业苹果mac电脑 电池续航提升工具

Rose

SwitchResX for Mac v4.13.3 正式版 自定义苹果电脑分辨率

Rose

数据科学家的IDE:JetBrains DataSpell for mac v2023.3.3中文激活版

影影绰绰一往直前

My PaintBrush Pro专业版for Mac(mac绘图软件) v2.4.2激活版

影影绰绰一往直前

MediaInfo for mac(媒体信息检测软件) v24.01中文免激活版

影影绰绰一往直前

5G-A华彩开局,风流还看北京城

脑极体

通信

AI for Science,开启智能科学时代!

脑极体

AI

reallusion卡通动画师最新下载 Cartoon Animator mac破解中文版

Rose

文心一言 VS 讯飞星火 VS chatgpt (192)-- 算法导论14.2 2题

福大大架构师每日一题

福大大架构师每日一题

Splunk Enterprise for Mac(数据分析管理工具) v9.2.0激活版

影影绰绰一往直前

照片放大工具 Topaz Gigapixel AI for Mac v7.0.1激活版

影影绰绰一往直前

Algoriddim djay Pro Ai for Mac(DJ混音软件)v5.1.0激活版

影影绰绰一往直前

GreatSQL荣获2023 InfoQ“技术生态构建奖” 助力行业变革之路

GreatSQL

Minitab Express数据分析适合什么人群?minitab express mac破解资源

Rose

Texifier(原Texpad) for mac(专业的LaTeX编辑工具)v1.9.25激活版

影影绰绰一往直前

【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的HA高可用解决方案

洛神灬殇

分布式 高可用 ha 优化技术 2024年第二十九篇文章

《计算机程序的构造和解释(原书第2版)》PDF

程序员李木子

FX影视特效3D动画渲染工具SideFX Houdini安装破解教程

Rose

幻兽帕鲁服务器搭建攻略:阿里云平台快速上手指南

全栈若城

DJ必备:djay - DJ 应用&混音器 (djay pro Ai 激活版mac下载)

Rose

关于「日志采样」的一些思考及实践

京东科技开发者

PHP 增量代码规范 PHPCS 通过极狐 GitLab CI 平滑落地

极狐GitLab

Total Video Converter Pro超级转霸 mac破解版 视频格式转换

Rose

mac/win Animate 2021新功能 (An 2021中文直装版安装)

Rose

Nodejs - 9步开启JWT身份验证

南城FE

JavaScript 前端 nodejs JWT

Databend Stream 的设计与实现 | Data Infra 第 18 期

Databend

适配更多国产芯片,智谱AI推出第三代基座大模型ChatGLM3_企业动态_褚杏娟_InfoQ精选文章