写点什么

智谱新发开源大模型:9B 参数,覆盖编程场景

  • 2024-07-06
    北京
  • 本文字数:1314 字

    阅读完需:约 4 分钟

大小:726.83K时长:04:08
智谱新发开源大模型:9B参数,覆盖编程场景

“大模型能够在一个模型上提供泛化能力,解决一系列场景和应用的多样需求,从而解决成本和收益的平衡的问题,这是它的本质特点。”


7 月 4 日,在世界人工智能大会的产业发展主论坛上,智谱 AI CEO 张鹏表示,当下因大模型而掀起的 AI 热潮和之前有所不同,在过去,AI 技术解决了一些实际问题,但如今的大模型发展带来了更重要的类人认知能力。张鹏表示,在过去 AI 泛用性不够且成本太高。但大模型带来了一个新的机遇,它能够在一个模型上提供泛用化能力,这也是用新一代大模型技术赋能实体经济的主要方向——把原来一个底座投入很大但是收益很小的结构,变成一个倒金字塔结构,真正放大它的价值。



GLM-新一代基座大模型技术前沿与产业应用论坛举办

 

7 月 5 日,在由清华大学计算机系知识工程实验室主办,AI TIME 承办,东浩兰生(集团)有限公司和智谱 AI 协办的 GLM-新一代基座大模型技术前沿与产业应用论坛上,嘉宾们聚焦 GLM-4 大模型,共同分享了 GLM-4 大模型的最新研究成果和理论突破,探索 GLM-4 的技术前沿、产业生态和落地应用。

第 4 代 CodeGeeX 发布免费智能 AI 编程助手



论坛上,智谱 AI CodeGeeX 技术负责人郑勤锴发布了第 4 代 CodeGeeX 代码大模型 CodeGeeX4-ALL-9B。CodeGeeX4-ALL-9B 作为最新一代 CodeGeeX4 系列模型的开源版本,在 GLM-4 强大语言能力的基础上继续迭代,大幅增强代码生成能力。使用 CodeGeeX4-ALL-9B 单一模型,即可支持代码补全和生成、代码解释器、联网搜索、工具调用、仓库级长代码问答及生成等全面功能,覆盖了编程开发的各种场景。在多个权威代码能力评测集的表现,是百亿参数量级以下性能最强的模型,甚至超过数倍规模的通用模型,在推理性能和模型效果上得到最佳平衡。



目前 CodeGeeX 的个人用户数量已经超过 100 万,目前 CodeGeeX 对个⼈用户完全免费,在各种主流 IDE 均可免费下载使⽤。


除了第 4 代 CodeGeeX 发布,论坛现场,清华大学计算机科学与技术系长聘教授黄民烈、中国人民大学信息学院计算机系副教授张静、浙江大学计算机科学与技术学院副教授杨洋、上海交通大学电子信息与电气工程学院长聘教轨副教授戴国浩、幂律智能创始人兼 CEO 涂存超等顶尖学者,深入探讨了 GLM 大模型对行业及产业发展的影响。


张鹏分享了 GLM-4 在应用中的多个创新案例,特别是在智能内容生成、行业自动化以及用户个性化定制服务等方面的突破。展示了 GLM-4 在复杂商业环境中的价值。


“过去几年智谱的商业实践为我们积累了非常多的经验,不敢说是 best practice,但是 better practice。”张鹏在演讲中表示。GLM-4 在智能体和工具调用等方面能力的突飞猛进,让企业内部原生 AI 架构的实现变为可能。


GLM 基座大模型携应用成果亮相 WAIC 2024

 

WAIC 2024 智谱 AI 展位展示了以智谱大模型开放平台 bigmodel.cn 和智谱大模型产品矩阵为核心的系列创新成果。


作为本届 WAIC 镇馆之宝,智谱大模型开放平台 bigmodel.cn 是体验智谱 GLM 系列大模型的最佳方式。全新升级的 bigmodel.cn 已经接入最新 GLM 大模型全家桶,一键微调、All Tools API 调用等新功能也已上线。

 

不管是技术极客、专业工程师,又或者是寻求大模型能力的企业,都可以在平台上找到适合自己的产品和服务。目前 bigmodel.cn 已有超过 40 万企业客户和开发者,日均调用量为 600 亿 Tokens,过去 4 个月 API 每日消费量增长了 90 倍以上。

2024-07-06 17:056005
用户头像
李冬梅 加V:busulishang4668

发布了 1178 篇内容, 共 799.6 次阅读, 收获喜欢 1298 次。

关注

评论

发布
暂无评论
发现更多内容

GPUStack v0.7重磅更新:macOS与Windows安装包、昇腾MindIE多机推理、模型使用计量与寒武纪MLU支持

GPUStack

人工智能 AI 大模型 LLM

Lakehouse: Unifying DW & Advanced Analytics in Open Platforms

数新网络官方账号

北大张牧涵团队依托昇腾突破推理效率瓶颈 大模型推理百万tokens 成本仅 1 元

极客天地

mdraid、mdadm 与 Linux 软件 RAID 终极指南

Sergey Platonov

raid storage xiRAID MDraid

PandasAI连接LLM进行智能数据分析

不在线第一只蜗牛

数据分析

MySQL有哪些“饮鸩止渴”提高性能的方法?

量贩潮汐·WholesaleTide

MySQL 数据库

寻医问药小程序系统

微擎应用市场

Go 原理之 GMP 并发调度模型

秃头小帅oi

从一起知名线上故障,谈配置灰度发布的重要性

阿里巴巴云原生

阿里云 云原生 nacos

基于vLLM与AWS Trainium的冷启动推荐优化

qife122

推荐系统 vLLM

基于Amazon Translate的深度学习教材自动翻译系统

qife122

机器翻译 Amazon Translate

阿里云正式开源 LoongSuite:打造 AI 时代的高性能低成本可观测采集套件

阿里巴巴云原生

阿里云 开源 云原生 可观测

华为开发者空间部署FastGPT,构建知识库智能体

华为云开发者联盟

华为云ModelArts AI+ FastGPT DeepSeek v3 华为开发者空间

Java注解底层竟然是个Map?

量贩潮汐·WholesaleTide

Java

YashanDB ROWIDTOCHAR函数

YashanDB

数据库

YashanDB RIGHT函数

YashanDB

数据库

什么是低代码(Low-Code)?2025低代码核心架构技术解析与应用展望

优秀

低代码 低代码开发

YashanDB RLIKE_FILTER函数

YashanDB

数据库

YashanDB ROUND函数

YashanDB

数据库

铭芯科技共享轮椅租赁系统

微擎应用市场

荣耀应用市场《2025上半年应用合规治理报告》丨开发加油站

荣耀开发者服务平台

应用中心 治理规范 荣耀开发者服务平台 荣耀应用市场

YashanDB ROW_NUMBER函数

YashanDB

数据库

新鲜出炉|指标平台「实践案例研究报告」等你来领~

Aloudata

数据分析 ETL 指标平台

寻疗智慧 IOT 数字健康服务平台

微擎应用市场

“子弹弹夹”装弹和出弹的抽象原理实战:掌握栈的原理与实战

电子尖叫食人鱼

JavaScript 数据结构 算法

告别堡垒机时代!某电力公司如何用CloudQuery解决2000+数据库的安全困局?

BinTools图尔兹

7 月 29 日晚,一场发布会,重新定义什么叫“数据在说话”

TDengine

tdengine 时序数据库

Playwright 自动化测试 | 测试框架集成​​Page Object 模式

测试人

软件测试

解析vLLM架构及源码系列-整体架构

Jason黄

vLLM vLLM优化 vLLM源码

Aloudata 入选 IDC “Data Flow Agent 代表厂商”和 DAC “数据资产运营商 TOP10”

Aloudata

agent 指标平台 noetl ChatBI

AWS MemoryDB 可观测最佳实践

观测云

AWS

智谱新发开源大模型:9B参数,覆盖编程场景_生成式 AI_李冬梅_InfoQ精选文章