适配更多国产芯片，智谱AI推出第三代基座大模型ChatGLM3_企业动态_褚杏娟

AI实践哪家强？来 AICon，解锁技术前沿，探寻产业新机！了解详情 



 写点什么



大小：593.52K时长：03:22

2023 年 10 月 27 日，智谱AI于 2023 中国计算机大会（CNCC）上，推出了全自研的第三代基座大模型 ChatGLM3 及相关系列产品，这也是智谱 AI 继推出千亿基座的对话模型 ChatGLM 和 ChatGLM2 之后的又一次重大突破。

据悉，此次推出的 ChatGLM3 采用了独创的多阶段增强预训练方法，使训练更为充分。评测显示，在 44 个中英文公开数据集测试中，ChatGLM3 在国内同尺寸模型中排名首位。智谱 AI CEO 张鹏在现场做了新品发布，并实时演示了最新上线的产品功能。

通过更丰富的训练数据和更优的训练方案，智谱 AI 推出的 ChatGLM3 性能更加强大。与 ChatGLM2 相比，MMLU 提升 36%、CEval 提升 33%、GSM8K 提升 179% 、BBH 提升 126%。

同时，ChatGLM3 瞄向 GPT-4V 本次实现了若干全新功能的迭代升级，包括多模态理解能力的 CogVLM-看图识语义，在 10 余个国际标准图文评测数据集上取得 SOTA；代码增强模块 Code Interpreter 根据用户需求生成代码并执行，自动完成数据分析、文件处理等复杂任务；网络搜索增强 WebGLM-接入搜索增强，能自动根据问题在互联网上查找相关资料并在回答时提供参考相关文献或文章链接。ChatGLM3 的语义能力与逻辑能力得到了极大的增强。

ChatGLM3 还集成了自研的 AgentTuning 技术，激活了模型智能体能力，尤其在智能规划和执行方面，相比于 ChatGLM2 提升了 1000% ；开启了国产大模型原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。

此外，ChatGLM3 本次推出可手机部署的端测模型 ChatGLM3-1.5B 和 ChatGLM3-3B，支持包括 vivo、小米、三星在内的多款手机以及车载平台，甚至支持移动平台上 CPU 芯片的推理，速度可达 20 tokens/s。精度方面 1.5B 和 3B 模型在公开 benchmark 上与 ChatGLM2-6B 模型性能接近。

自 2022 年初，智谱 AI 推出的 GLM 系列模型已支持在昇腾、神威超算、海光 DCU 架构上进行大规模预训练和推理。截至目前，智谱 AI 的产品已支持 10 余种国产硬件生态，包括昇腾、神威超算、海光 DCU、海飞科、沐曦曦云、算能科技、天数智芯、寒武纪、摩尔线程、百度昆仑芯、灵汐科技、长城超云等。

基于最新的高效动态推理和显存优化技术，ChatGLM3 当前的推理框架在相同硬件、模型条件下，相较于目前最佳的开源实现，包括伯克利大学推出的 vLLM 以及 Hugging Face TGI 的最新版本，推理速度提升了 2-3 倍，推理成本降低一倍，每千 tokens 仅 0.5 分，成本最低。

另外，随着 WebGLM 大模型能力的加入，智谱清言也具有了搜索增强能力，可以帮助用户整理出相关问题的网上文献或文章链接，并直接给出答案。此前已发布的 CogVLM 模型则提高了智谱清言的中文图文理解能力，取得了接近 GPT-4V 的图片理解能力，它可以回答各种类型的视觉问题，并且可以完成复杂的目标检测，并打上标签，完成自动数据标注。

发布

暂无评论

创作场景

适配更多国产芯片，智谱 AI 推出第三代基座大模型 ChatGLM3

评论

纯C语言框架助力降低大模型运行成本

区块链DAPP质押合约代币系统开发

深度解析：Allure报告如何提升你的测试效率？

AI技术在医疗领域中有哪些改变？

AI大模型助力：离线生成中英双语字幕

大模型微调实战：利用INT8/FP4/NF4量化技术提升性能与效率

第43期 | GPTSecurity周报

中国滑雪运动趋势洞察2024

科普：嵌入式多核并行仿真

基于SkyEye仿真6678处理器：实现国产操作系统ReWorks仿真运行

开源推荐 | 简洁且强大的开源堡垒机OneTerm

Databend 开源周报第 136 期

低代码助力企业数据资产价值升级

基于SkyEye仿真飞腾处理器：运行U-Boot并加载Phytium-FreeRTOS

ByteHouse白皮书即将发布，揭秘如何让万台节点的OLAP性能大涨

[自研开源] MyData v0.7.3 更新日志

精选！常用的10款会议软件推荐+4款会议必备模板！

Manz亚智科技 RDL先进制程加速全球板级封装部署和生产

数据平台“国产替代”掣肘在迁移？奇点云的工业制造实践解读

华为云数据库创新发展论坛，打造行业更优数据库底座！

百度交易中台之系统对账篇

Transformer大模型学习导引：光速掌握大模型

何为代码检查服务的门禁级检查

北京大学讲座：大模型时代的软件研发：技术、范式与工具

官宣｜Apache Flink 1.19 发布公告

报名最后一天！Farris-Vue前端组件创新挑战赛火热报名中！

【AAAI 2024】M2SD：通过特征空间预构建策略重塑小样本类增量学习

创作场景

适配更多国产芯片，智谱 AI 推出第三代基座大模型 ChatGLM3

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载