写点什么

智谱新发开源大模型:9B 参数,覆盖编程场景

  • 2024-07-06
    北京
  • 本文字数:1314 字

    阅读完需:约 4 分钟

大小:726.83K时长:04:08
智谱新发开源大模型:9B参数,覆盖编程场景

“大模型能够在一个模型上提供泛化能力,解决一系列场景和应用的多样需求,从而解决成本和收益的平衡的问题,这是它的本质特点。”


7 月 4 日,在世界人工智能大会的产业发展主论坛上,智谱 AI CEO 张鹏表示,当下因大模型而掀起的 AI 热潮和之前有所不同,在过去,AI 技术解决了一些实际问题,但如今的大模型发展带来了更重要的类人认知能力。张鹏表示,在过去 AI 泛用性不够且成本太高。但大模型带来了一个新的机遇,它能够在一个模型上提供泛用化能力,这也是用新一代大模型技术赋能实体经济的主要方向——把原来一个底座投入很大但是收益很小的结构,变成一个倒金字塔结构,真正放大它的价值。



GLM-新一代基座大模型技术前沿与产业应用论坛举办

 

7 月 5 日,在由清华大学计算机系知识工程实验室主办,AI TIME 承办,东浩兰生(集团)有限公司和智谱 AI 协办的 GLM-新一代基座大模型技术前沿与产业应用论坛上,嘉宾们聚焦 GLM-4 大模型,共同分享了 GLM-4 大模型的最新研究成果和理论突破,探索 GLM-4 的技术前沿、产业生态和落地应用。

第 4 代 CodeGeeX 发布免费智能 AI 编程助手



论坛上,智谱 AI CodeGeeX 技术负责人郑勤锴发布了第 4 代 CodeGeeX 代码大模型 CodeGeeX4-ALL-9B。CodeGeeX4-ALL-9B 作为最新一代 CodeGeeX4 系列模型的开源版本,在 GLM-4 强大语言能力的基础上继续迭代,大幅增强代码生成能力。使用 CodeGeeX4-ALL-9B 单一模型,即可支持代码补全和生成、代码解释器、联网搜索、工具调用、仓库级长代码问答及生成等全面功能,覆盖了编程开发的各种场景。在多个权威代码能力评测集的表现,是百亿参数量级以下性能最强的模型,甚至超过数倍规模的通用模型,在推理性能和模型效果上得到最佳平衡。



目前 CodeGeeX 的个人用户数量已经超过 100 万,目前 CodeGeeX 对个⼈用户完全免费,在各种主流 IDE 均可免费下载使⽤。


除了第 4 代 CodeGeeX 发布,论坛现场,清华大学计算机科学与技术系长聘教授黄民烈、中国人民大学信息学院计算机系副教授张静、浙江大学计算机科学与技术学院副教授杨洋、上海交通大学电子信息与电气工程学院长聘教轨副教授戴国浩、幂律智能创始人兼 CEO 涂存超等顶尖学者,深入探讨了 GLM 大模型对行业及产业发展的影响。


张鹏分享了 GLM-4 在应用中的多个创新案例,特别是在智能内容生成、行业自动化以及用户个性化定制服务等方面的突破。展示了 GLM-4 在复杂商业环境中的价值。


“过去几年智谱的商业实践为我们积累了非常多的经验,不敢说是 best practice,但是 better practice。”张鹏在演讲中表示。GLM-4 在智能体和工具调用等方面能力的突飞猛进,让企业内部原生 AI 架构的实现变为可能。


GLM 基座大模型携应用成果亮相 WAIC 2024

 

WAIC 2024 智谱 AI 展位展示了以智谱大模型开放平台 bigmodel.cn 和智谱大模型产品矩阵为核心的系列创新成果。


作为本届 WAIC 镇馆之宝,智谱大模型开放平台 bigmodel.cn 是体验智谱 GLM 系列大模型的最佳方式。全新升级的 bigmodel.cn 已经接入最新 GLM 大模型全家桶,一键微调、All Tools API 调用等新功能也已上线。

 

不管是技术极客、专业工程师,又或者是寻求大模型能力的企业,都可以在平台上找到适合自己的产品和服务。目前 bigmodel.cn 已有超过 40 万企业客户和开发者,日均调用量为 600 亿 Tokens,过去 4 个月 API 每日消费量增长了 90 倍以上。

2024-07-06 17:056086
用户头像
李冬梅 加V:busulishang4668

发布了 1209 篇内容, 共 834.0 次阅读, 收获喜欢 1314 次。

关注

评论

发布
暂无评论
发现更多内容

35万一枚的比特币,家里电脑想挖一枚要多长时间?答案只有3个字

CECBC

比特币

能源区块链研究|中国内蒙古自治区为减少能源消耗 禁止比特币采矿

CECBC

比特币

SpringBoot启用HTTPS

黄敏

jdk https openssh springboot

Elasticsearch Mapping Root Object

escray

elastic 七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 3月日更

旧区块链思维面临淘汰

CECBC

区块链

文字君和ta的朋友们

InfoQ写作社区官方

《精通比特币》学习笔记(第三章)

棉花糖

区块链 学习 3月日更

springboot 2.4.0 knife4j 3.0.1接口文档框架

黄敏

springboot SpringBoot 2 Knife4j

翻译:《实用的Python编程》04_01_Class

codists

Python

常用工具幕布高级会员获取

白贺BaiHe

要拥有必先懂失去怎接受——浅谈前景理论

Justin

心理学 28天写作 游戏设计

IDEA 敏捷开发技巧——实时模版

程序员小航

IDEA IntelliJ IDEA

如何让别人访问到你的本地项目? Ngrok免费实现内网穿透

xiezhr

ngrok 内网穿透 3月日更

工作中迷迷糊糊,不知道自己想要什么?

一笑

28天写作

工具软件与开源

行人23

开源 SaaS

Linux时间同步-NTP服务器

黄敏

Linux ntp

在有限的时间里,拿到通才的帐号,登入无限的游戏。

叶小鍵

加快推进数据确权与资产化 发挥区块链技术信用机制优势

CECBC

区块链

JVM笔记 -- JVM的发展以及基于栈的指令集架构

秦怀杂货店

JVM JVM笔记

(28DW-S8-Day15) 在线教育的MOT

mtfelix

在线教育 28天写作 峰值体验 关键时刻 MOT

程序员之禅(五)十条准则

每天读本书

读书笔记 每天读本书

超干货 (实战经验)结合公司业务分析离线数仓建设实践

五分钟学大数据

大数据 数据仓库 28天写作 3月日更

正则表达式.02 - 量词与贪婪

insight

正则表达式 3月日更

关于 Python 中的字符串,我在补充两点,滚雪球学 Python

梦想橡皮擦

Python 28天写作 3月日更

面试官就是这么欺负人:new Object()到底占用几个字节?

xcbeyond

Java java对象分析 3月日更

【LeetCode】分割回文串Java题解

Albert

算法 LeetCode 28天写作

面向业务的高可用架构设计

架构精进之路

架构设计 七日更 3月日更

Java安装教程

Sakura

28天写作 3月日更

使用Android版VMware Horizon Client连接到云桌面

梅花鹿鹿

专访 | 我与毕玄的对话

九叔(高翔龙)

Java 阿里巴巴 中间件 架构师 访谈录

电商管理系统之发票子系统设计(二)

长沙造纸农

架构设计 高并发系统设计 电商 电子发票 发票

智谱新发开源大模型:9B参数,覆盖编程场景_生成式 AI_李冬梅_InfoQ精选文章