写点什么

智谱新发开源大模型:9B 参数,覆盖编程场景

  • 2024-07-06
    北京
  • 本文字数:1314 字

    阅读完需:约 4 分钟

大小:726.83K时长:04:08
智谱新发开源大模型:9B参数,覆盖编程场景

“大模型能够在一个模型上提供泛化能力,解决一系列场景和应用的多样需求,从而解决成本和收益的平衡的问题,这是它的本质特点。”


7 月 4 日,在世界人工智能大会的产业发展主论坛上,智谱 AI CEO 张鹏表示,当下因大模型而掀起的 AI 热潮和之前有所不同,在过去,AI 技术解决了一些实际问题,但如今的大模型发展带来了更重要的类人认知能力。张鹏表示,在过去 AI 泛用性不够且成本太高。但大模型带来了一个新的机遇,它能够在一个模型上提供泛用化能力,这也是用新一代大模型技术赋能实体经济的主要方向——把原来一个底座投入很大但是收益很小的结构,变成一个倒金字塔结构,真正放大它的价值。



GLM-新一代基座大模型技术前沿与产业应用论坛举办

 

7 月 5 日,在由清华大学计算机系知识工程实验室主办,AI TIME 承办,东浩兰生(集团)有限公司和智谱 AI 协办的 GLM-新一代基座大模型技术前沿与产业应用论坛上,嘉宾们聚焦 GLM-4 大模型,共同分享了 GLM-4 大模型的最新研究成果和理论突破,探索 GLM-4 的技术前沿、产业生态和落地应用。

第 4 代 CodeGeeX 发布免费智能 AI 编程助手



论坛上,智谱 AI CodeGeeX 技术负责人郑勤锴发布了第 4 代 CodeGeeX 代码大模型 CodeGeeX4-ALL-9B。CodeGeeX4-ALL-9B 作为最新一代 CodeGeeX4 系列模型的开源版本,在 GLM-4 强大语言能力的基础上继续迭代,大幅增强代码生成能力。使用 CodeGeeX4-ALL-9B 单一模型,即可支持代码补全和生成、代码解释器、联网搜索、工具调用、仓库级长代码问答及生成等全面功能,覆盖了编程开发的各种场景。在多个权威代码能力评测集的表现,是百亿参数量级以下性能最强的模型,甚至超过数倍规模的通用模型,在推理性能和模型效果上得到最佳平衡。



目前 CodeGeeX 的个人用户数量已经超过 100 万,目前 CodeGeeX 对个⼈用户完全免费,在各种主流 IDE 均可免费下载使⽤。


除了第 4 代 CodeGeeX 发布,论坛现场,清华大学计算机科学与技术系长聘教授黄民烈、中国人民大学信息学院计算机系副教授张静、浙江大学计算机科学与技术学院副教授杨洋、上海交通大学电子信息与电气工程学院长聘教轨副教授戴国浩、幂律智能创始人兼 CEO 涂存超等顶尖学者,深入探讨了 GLM 大模型对行业及产业发展的影响。


张鹏分享了 GLM-4 在应用中的多个创新案例,特别是在智能内容生成、行业自动化以及用户个性化定制服务等方面的突破。展示了 GLM-4 在复杂商业环境中的价值。


“过去几年智谱的商业实践为我们积累了非常多的经验,不敢说是 best practice,但是 better practice。”张鹏在演讲中表示。GLM-4 在智能体和工具调用等方面能力的突飞猛进,让企业内部原生 AI 架构的实现变为可能。


GLM 基座大模型携应用成果亮相 WAIC 2024

 

WAIC 2024 智谱 AI 展位展示了以智谱大模型开放平台 bigmodel.cn 和智谱大模型产品矩阵为核心的系列创新成果。


作为本届 WAIC 镇馆之宝,智谱大模型开放平台 bigmodel.cn 是体验智谱 GLM 系列大模型的最佳方式。全新升级的 bigmodel.cn 已经接入最新 GLM 大模型全家桶,一键微调、All Tools API 调用等新功能也已上线。

 

不管是技术极客、专业工程师,又或者是寻求大模型能力的企业,都可以在平台上找到适合自己的产品和服务。目前 bigmodel.cn 已有超过 40 万企业客户和开发者,日均调用量为 600 亿 Tokens,过去 4 个月 API 每日消费量增长了 90 倍以上。

2024-07-06 17:055833
用户头像
李冬梅 加V:busulishang4668

发布了 1111 篇内容, 共 721.1 次阅读, 收获喜欢 1253 次。

关注

评论

发布
暂无评论
发现更多内容

软件测试很简单么?

chenkl

测试

synchronized有几种用法?

王磊

Java java面试

Scrum基础框架,快速配置Scrum自动化场景

阿里云云效

云计算 阿里云 Scrum 敏捷开发 研发敏捷

星环科技春季新品发布周,4月19日-23日重磅内容等你来解锁!

星环科技

百度程序员开发避坑指南(Go语言篇)

百度Geek说

后端

新一代态势感知系统发布——北望

H3C-Navigator

网络安全 网络 态势感知关联分析、SOC 态势感知 安全运营

关于 MySQL 数据库学习的书籍有哪些值得推荐?

程序员万金游

MySQL 数据库 java 日志 MySQL 数据库 java

为什么你应该了解 Loggie

网易数帆

Go Kubernetes 云原生 日志 Loggie

阿里云服务网格 ASM 正式发布商业化版本

阿里巴巴云原生

Linux 信号(Signal)

mazhen

Linux JVM signal Linux Kenel

架构实战营 - 第 6 期 模块三课后作业

乐邦

「架构实战营」

阿里云强力贡献:如何让 StarRocks 做到极速数据湖分析

StarRocks

数据库 大数据 StarRocks

持续进击,STI上演极致通缩模型

BlockChain先知

DPDK技术系统学习一(接收,发送,arp,icmp功能测试)

Linux服务器开发

虚拟化 网络协议栈 Linux服务器开发 DPDK C++后台开发

《数字经济全景白皮书》金融科技篇 重磅发布!

易观分析

金融科技 互联网金融

使用 Serverless Devs 插件快速部署前端应用

阿里巴巴云原生

Excel是世界上最危险的软件?

图灵教育

Python 数据分析 Excel

IstioCon 2022,网易数帆六年优化经验即将揭秘

网易数帆

微服务 云原生 istio 服务网格 Service Mesh (ASM)

记一次Kafka写入超时问题详细分析

移动云大数据

kafka

黑客是怎么cookie获取?钓鱼?键盘记录?

喀拉峻

网络安全 XSS

融云 Unity SDK 升级,专注游戏场景,更好社交体验

融云 RongCloud

千万张医疗影像,都去了哪里?

天翼云开发者社区

云主机 云存储

资产跟踪管理系统解决方案

低代码小观

资产管理 企业管理系统 #资产追踪 CRM系统 客户关系管理系统

互联网通信安全之 WebRTC 传输安全机制

融云 RongCloud

百度ToB垂类账号权限平台的设计与实践

百度Geek说

架构 后端

一键智能Mock,你值得拥有

Liam

前端 前端开发 Postman swagger web前端开发

Tech Talk 活动预告丨使用 Amazon IoT Core 构建安全合规的智能产品

亚马逊云科技 (Amazon Web Services)

Amazon IoT Core

网络协议之:Domain name service DNS详解

程序那些事

Java Netty 程序那些事 4月月更

「连接」与CRM的「中国式」关系

ToB行业头条

新华三首发400G园区核心交换机,开启园区超宽时代

H3C-Navigator

网络 交换机 智慧园区 网络交换机

融云猿桌派:听说女生不适合搞 IT,哈?

融云 RongCloud

智谱新发开源大模型:9B参数,覆盖编程场景_生成式 AI_李冬梅_InfoQ精选文章