写点什么

智谱新发开源大模型:9B 参数,覆盖编程场景

  • 2024-07-06
    北京
  • 本文字数:1314 字

    阅读完需:约 4 分钟

大小:726.83K时长:04:08
智谱新发开源大模型:9B参数,覆盖编程场景

“大模型能够在一个模型上提供泛化能力,解决一系列场景和应用的多样需求,从而解决成本和收益的平衡的问题,这是它的本质特点。”


7 月 4 日,在世界人工智能大会的产业发展主论坛上,智谱 AI CEO 张鹏表示,当下因大模型而掀起的 AI 热潮和之前有所不同,在过去,AI 技术解决了一些实际问题,但如今的大模型发展带来了更重要的类人认知能力。张鹏表示,在过去 AI 泛用性不够且成本太高。但大模型带来了一个新的机遇,它能够在一个模型上提供泛用化能力,这也是用新一代大模型技术赋能实体经济的主要方向——把原来一个底座投入很大但是收益很小的结构,变成一个倒金字塔结构,真正放大它的价值。



GLM-新一代基座大模型技术前沿与产业应用论坛举办

 

7 月 5 日,在由清华大学计算机系知识工程实验室主办,AI TIME 承办,东浩兰生(集团)有限公司和智谱 AI 协办的 GLM-新一代基座大模型技术前沿与产业应用论坛上,嘉宾们聚焦 GLM-4 大模型,共同分享了 GLM-4 大模型的最新研究成果和理论突破,探索 GLM-4 的技术前沿、产业生态和落地应用。

第 4 代 CodeGeeX 发布免费智能 AI 编程助手



论坛上,智谱 AI CodeGeeX 技术负责人郑勤锴发布了第 4 代 CodeGeeX 代码大模型 CodeGeeX4-ALL-9B。CodeGeeX4-ALL-9B 作为最新一代 CodeGeeX4 系列模型的开源版本,在 GLM-4 强大语言能力的基础上继续迭代,大幅增强代码生成能力。使用 CodeGeeX4-ALL-9B 单一模型,即可支持代码补全和生成、代码解释器、联网搜索、工具调用、仓库级长代码问答及生成等全面功能,覆盖了编程开发的各种场景。在多个权威代码能力评测集的表现,是百亿参数量级以下性能最强的模型,甚至超过数倍规模的通用模型,在推理性能和模型效果上得到最佳平衡。



目前 CodeGeeX 的个人用户数量已经超过 100 万,目前 CodeGeeX 对个⼈用户完全免费,在各种主流 IDE 均可免费下载使⽤。


除了第 4 代 CodeGeeX 发布,论坛现场,清华大学计算机科学与技术系长聘教授黄民烈、中国人民大学信息学院计算机系副教授张静、浙江大学计算机科学与技术学院副教授杨洋、上海交通大学电子信息与电气工程学院长聘教轨副教授戴国浩、幂律智能创始人兼 CEO 涂存超等顶尖学者,深入探讨了 GLM 大模型对行业及产业发展的影响。


张鹏分享了 GLM-4 在应用中的多个创新案例,特别是在智能内容生成、行业自动化以及用户个性化定制服务等方面的突破。展示了 GLM-4 在复杂商业环境中的价值。


“过去几年智谱的商业实践为我们积累了非常多的经验,不敢说是 best practice,但是 better practice。”张鹏在演讲中表示。GLM-4 在智能体和工具调用等方面能力的突飞猛进,让企业内部原生 AI 架构的实现变为可能。


GLM 基座大模型携应用成果亮相 WAIC 2024

 

WAIC 2024 智谱 AI 展位展示了以智谱大模型开放平台 bigmodel.cn 和智谱大模型产品矩阵为核心的系列创新成果。


作为本届 WAIC 镇馆之宝,智谱大模型开放平台 bigmodel.cn 是体验智谱 GLM 系列大模型的最佳方式。全新升级的 bigmodel.cn 已经接入最新 GLM 大模型全家桶,一键微调、All Tools API 调用等新功能也已上线。

 

不管是技术极客、专业工程师,又或者是寻求大模型能力的企业,都可以在平台上找到适合自己的产品和服务。目前 bigmodel.cn 已有超过 40 万企业客户和开发者,日均调用量为 600 亿 Tokens,过去 4 个月 API 每日消费量增长了 90 倍以上。

2024-07-06 17:055846
用户头像
李冬梅 加V:busulishang4668

发布了 1114 篇内容, 共 727.6 次阅读, 收获喜欢 1256 次。

关注

评论

发布
暂无评论
发现更多内容

论文解读:基于 OpenMLDB 的流式特征计算优化

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

架构师才需要学习的知识:亿级流量调优方法+实战

Java 性能优化 性能调优

镭速Raysync v6.6.8.0版本发布

镭速

eBPF动手实践系列一:解构内核源码eBPF样例编译过程

阿里云大数据AI技术

运维 代码 企业号 4 月 PK 榜

阿里耗时1年:用283张图+24问完美诠释“Java并发编程”所有难点

Java 并发编程

OpenHarmony3.2release抢先体验

坚果

OpenHarmony 三周年连更

从此告别写SQL!DataLeap帮你零门槛完成“数据探查”

字节跳动数据平台

MySQL 数据分析 数据治理 数据探查 企业号 4 月 PK 榜

ChatGPT的狂欢背后:短板犹在,启发甚多,2023有这些事可以做……

小红书技术REDtech

人工智能 ChatGPT 活动回顾

对话大咖 | 人工智能+视频编解码能带来新的变革吗

小红书技术REDtech

人工智能 深度学习 活动回顾

Github上标星68.5K,阿里巴巴《MySQL成长手册》火了

Java MySQL 数据库

Seata:连接数据与应用

阿里巴巴云原生

阿里云 云原生 seata

小红书广告投放机制详解,如何用算法实现全站自动化投放

小红书技术REDtech

大数据 搜索

云原生助力数字原生企业业务快速迭代|阿里云峰会精彩回顾

阿里巴巴云原生

阿里云 云原生

带你用三种不同的工具体验AI作诗

华为云开发者联盟

云计算 华为云 华为云开发者联盟 企业号 4 月 PK 榜

从零开始学习 GraphQL:入门指南和教程

Apifox

程序员 gRPC 后端 协议 graphql

原来XXL-JOB可以这么造

六月的雨在InfoQ

Serverless XXL-JOB SAE 三周年连更

零拷贝浅析

数新网络官方账号

大数据 零拷贝

高性能存储SIG月度动态:ANCK ublk完成POC测试,EROFS优化xattr元数据开销

OpenAnolis小助手

操作系统 内核 高性能存储 龙蜥社区 sig

成长计划知识赋能 | 第十期:DAYU200开发入门秒Get

OpenHarmony开发者

OpenHarmony

C语言_sprintf固定字符串输出位数

DS小龙哥

三周年连更

详解,LED显示屏灰度等级

Dylan

灰度 LED显示屏 色彩

MySQL8.0 优化器介绍(二)

GreatSQL

MySQL greatsql greatsql社区

阿里P8:Java性能调优(独孤版),带你打造淘宝秒杀架构

Java 架构 性能调优

数说热点|春暖花开日,露营正当时——当精致露营遇上新能源车

MobTech袤博科技

记一次 MySQL 主从同步异常的排查记录,百转千回

Java MySQL 主从同步

面试官:如何动态的给一个类增加功能?

SpringBoot设计了哪些可拓展的机制?

Spring Cloud微服务网关Zuul过滤链实现的源码解读

面试了个阿里P7大佬,他让我见识到什么才是“精通高并发与调优”

Java 高并发 性能调优

企业应用可观测性利器!华为云CodeArts APM发布

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

深入理解 Redis 新特性:Stream

Java你猿哥

redis SSM框架 Redis 核心技术与实战 redis 底层原理

智谱新发开源大模型:9B参数,覆盖编程场景_生成式 AI_李冬梅_InfoQ精选文章