写点什么

适配更多国产芯片,智谱 AI 推出第三代基座大模型 ChatGLM3

  • 2023-10-28
    北京
  • 本文字数:1105 字

    阅读完需:约 4 分钟

大小:593.52K时长:03:22
适配更多国产芯片,智谱AI推出第三代基座大模型ChatGLM3

2023 年 10 月 27 日,智谱AI于 2023 中国计算机大会(CNCC)上,推出了全自研的第三代基座大模型 ChatGLM3 及相关系列产品,这也是智谱 AI 继推出千亿基座的对话模型 ChatGLM 和 ChatGLM2 之后的又一次重大突破。

 

据悉,此次推出的 ChatGLM3 采用了独创的多阶段增强预训练方法,使训练更为充分。评测显示,在 44 个中英文公开数据集测试中,ChatGLM3 在国内同尺寸模型中排名首位。智谱 AI CEO 张鹏在现场做了新品发布,并实时演示了最新上线的产品功能。

 

通过更丰富的训练数据和更优的训练方案,智谱 AI 推出的 ChatGLM3 性能更加强大。与 ChatGLM2 相比,MMLU 提升 36%、CEval 提升 33%、GSM8K 提升 179% 、BBH 提升 126%。

 

同时,ChatGLM3 瞄向 GPT-4V 本次实现了若干全新功能的迭代升级,包括多模态理解能力的 CogVLM-看图识语义,在 10 余个国际标准图文评测数据集上取得 SOTA;代码增强模块 Code Interpreter 根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务;网络搜索增强 WebGLM-接入搜索增强,能自动根据问题在互联网上查找相关资料并在回答时提供参考相关文献或文章链接。ChatGLM3 的语义能力与逻辑能力得到了极大的增强。

 

ChatGLM3 还集成了自研的 AgentTuning 技术,激活了模型智能体能力,尤其在智能规划和执行方面,相比于 ChatGLM2 提升了 1000% ;开启了国产大模型原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。

 

此外,ChatGLM3 本次推出可手机部署的端测模型 ChatGLM3-1.5B 和 ChatGLM3-3B,支持包括 vivo、小米、三星在内的多款手机以及车载平台,甚至支持移动平台上 CPU 芯片的推理,速度可达 20 tokens/s。精度方面 1.5B 和 3B 模型在公开 benchmark 上与 ChatGLM2-6B 模型性能接近。

 

自 2022 年初,智谱 AI 推出的 GLM 系列模型已支持在昇腾、神威超算、海光 DCU 架构上进行大规模预训练和推理。截至目前,智谱 AI 的产品已支持 10 余种国产硬件生态,包括昇腾、神威超算、海光 DCU、海飞科、沐曦曦云、算能科技、天数智芯、寒武纪、摩尔线程、百度昆仑芯、灵汐科技、长城超云等。

 

基于最新的高效动态推理和显存优化技术,ChatGLM3 当前的推理框架在相同硬件、模型条件下,相较于目前最佳的开源实现,包括伯克利大学推出的 vLLM 以及 Hugging Face TGI 的最新版本,推理速度提升了 2-3 倍,推理成本降低一倍,每千 tokens 仅 0.5 分,成本最低。

 

另外,随着 WebGLM 大模型能力的加入,智谱清言也具有了搜索增强能力,可以帮助用户整理出相关问题的网上文献或文章链接,并直接给出答案。此前已发布的 CogVLM 模型则提高了智谱清言的中文图文理解能力,取得了接近 GPT-4V 的图片理解能力,它可以回答各种类型的视觉问题,并且可以完成复杂的目标检测,并打上标签,完成自动数据标注。

2023-10-28 08:115781

评论

发布
暂无评论
发现更多内容

python 爬虫如何爬取动态生成的网页内容

快乐非自愿限量之名

Python 爬虫

Js内建对象

EquatorCoco

JavaScript vue.js 前端

Databend 产品月报(2024年10月)

Databend

RUM最佳实践:内网IP地址映射地图地理位置场景

观测云

RUM

一文彻底弄懂Java的IO操作

不在线第一只蜗牛

Java Python io

阿里云上的Salesforce这一年:深耕本地化,释放新价值

Alter

阿里云 CRM Salesforce

ElevenLabs X-to-Voice:社交账号自动生成能说话的个人页面;OpenAI 正式推出 ChatGPT 搜索

声网

VMware ESXi 8.0U3 xFusion (超聚变) 定制版更新 OEM BIOS 2.7 支持 Windows Server 2025

sysin

macos esxi OEM Xfusion

青椒云云桌面针对中小企业上云的服务怎么样?

青椒云云电脑

云桌面 云电脑 云桌面厂商

ETLCloud怎么样?深度解析其在数据管理中的表现

RestCloud

数据库 ETL 数据管理 数据集成

HarmonyOS 5.0应用开发——音频播放组件的封装

高心星

鸿蒙 HarmonyOS 鸿蒙5.0 HarmonyOS NEXT

企业选择云桌面系统的主要原因是什么?

青椒云云电脑

云桌面 云桌面系统

ClkLog企业版(CDP)预售开启,更有鸿蒙SDK前来助力

ClkLog

开源 sdk HarmonyOS 用户画像

Zypher Research:服务器抽象叙事,GameFi 赛道的下一个热点?

石头财经

VMware Aria Automation 8.18 发布,新增功能概览

sysin

vmware automation aria

低成本打造内容丰富的体育直播平台?看看这两个策略

软件开发-梦幻运营部

确保数据安全!使用Spring Boot 实现强大的API输入验证

江南一点雨

加强科技平台企业赋能 加快发展新质生产力

不在线第一只蜗牛

低代码 数字化

Zypher Network的服务器抽象叙事,引领GameFi 赛道下个热点

大瞿科技

VMware ESXi 8.0U3 Dell (戴尔) 定制版更新 OEM BIOS 2.7 支持 Windows Server 2025

sysin

macos esxi OEM unlocker dell

有Redis为什么还要本地缓存?谈谈你对本地缓存的理解?

王磊

运营TikTok需要什么网络环境

Ogcloud

云手机 海外云手机 tiktok云手机 tiktok运营 tiktok运营干货

高并发编程/一张图精通CompletableFuture整体执行流程与设计(高手篇)

肖哥弹架构

Java 并发编程 高并发

遇到慢查询怎么办?一文解读MySQL 8.0查询分析工具

快乐非自愿限量之名

MySQL 数据库

云桌面解决方案-青椒云

青椒云云电脑

云桌面 云桌面厂家 云桌面解决方案

Zypher Network的服务器抽象叙事,引领GameFi 赛道下个热点

加密眼界

游戏显卡VS专业显卡:两者有什么区别?

Finovy Cloud

显卡

云电脑与远程控制软件的区别

青椒云云电脑

云桌面 云电脑 云桌面厂家

为开源 AI 模型引入激励机制?解读加密 AI 协议 Sentient 的大模型代币化解决方案

TechubNews

2024年10月文章一览

codists

编程人

主流电商平台售后API接口代码【详细】

快递鸟

API 接口

适配更多国产芯片,智谱AI推出第三代基座大模型ChatGLM3_企业动态_褚杏娟_InfoQ精选文章