【FCon上海】与行业领袖共话AI大模型、数字化风控等前沿技术。 了解详情
写点什么

“我们坚持开源!”阿里云发布“地表最强”中文大模型:半年一迭代、性能翻倍?

  • 2024-05-09
    北京
  • 本文字数:2582 字

    阅读完需:约 8 分钟

大小:1.33M时长:07:45
“我们坚持开源!”阿里云发布“地表最强”中文大模型:半年一迭代、性能翻倍?

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

5 月 9 日,在通义大模型发布一周年之际,阿里云大模型生态迎来一次重大升级,主要有“四个最”:

 

  • 通义千问 2.5 正式发布,“模型性能全面赶超 GPT-4 Turbo,成为地表最强中文大模型”;

  • Qwen1.5-110B 参数开源模型在多个基准测评收获最佳成绩,超越 Llama-3-70B,成为开源领域最强中文大模型;

  • ModelScope 魔搭成为中国最大的开源社区;

  • 通义大模型通过阿里云服务企业超 9 万,成最受中国企业欢迎大模型。

 

同时,阿里云对通义大模型的品牌也进行了升级,正式将“通义千问 APP”更名为“通义 APP”,集成通义大模型全栈能力,免费为所有用户提供服务。阿里表示,通义 APP 将把通义实验室前沿的文生图、智能编码、文档解析、音视频理解、视觉生成等能力“All in one”,成为每个人的全能 AI 助手。


大模型系列更新

 

从初代模型升级至 2.5 版本的路,阿里云仅仅走了一年。

 

去年 10 月底,阿里云 CTO 周靖人在 2023 年云栖大会上,发布了参数量提升到千亿级别的通义千问 2.0。当时,阿里表示,目前通义千问的综合性能已经超过 GPT-3.5,相比 4 月发布的 1.0 版本,通义千问 2.0 在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。

 

如今,相比通义千问 2.1 版本,通义千问 2.5 的理解能力、逻辑推理、指令遵循、代码能力分别提升了 9%、16%、19%、10%。在权威基准 OpenCompass 上,通义千问 2.5 得分追平 GPT-4 Turbo,这也是该基准首次录得国产大模型取得如此出色的成绩。

 


在多模态模型和专有能力模型方面,通义千问视觉理解模型 Qwen-VL-Max 在多个多模态标准测试中超越 Gemini Ultra 和 GPT-4V,目前已在多家企业落地应用。

 

通义还发布了最新款开源模型:1100 亿参数的 Qwen1.5-110B,该模型在 MMLU、TheoremQA、GPQA 等基准测评中超越了 Meta 的 Llama-3-70B 模型。在 HuggingFace 推出的开源大模型排行榜 Open LLM Leaderboard 上,Qwen1.5-110B 冲上榜首。

 


“生态非常重要,我们会坚持开源体系、坚持我们的开源模式。”周靖人透露。

 

“现在已经是 2024 年了,我相信开源对整个全球技术领域的贡献是毋庸置疑的。”周靖人说道,“阿里云不是简简单单的开源,我们是要开源最强的模型。”

 

去年 8 月,通义宣布加入开源行列,随之启动马不停蹄的开源狂飙,沿着“全模态、全尺寸”开源路线陆续推出十多款模型。小尺寸模型如 0.5B、1.8B、4B、7B、14B,可便捷地在手机、PC 等端侧设备部署;大尺寸模型如 72B、110B 能支持企业级和科研级的应用,都曾登顶 Open LLM Leaderboard 榜首。

 

“阿里云是全球唯一一家既持续做模型开发,又做大量模型开局模式的企业。”周靖人表示,Llama 3 等在一定程度上把竞争拉得很高。坦诚地讲,不是所有闭源的公司都能做过开源模型。做闭源的,至少要能够超过开源模型水准,才能今天有机会参与。另一方面,实践中,大模型能力并不是越强越好,还要考虑成本等方面因素,所以阿里云希望把选择权给到企业和开发者。

 

通义千问代码大模型 CodeQwen1.5-7B 则是 HuggingFace 代码模型榜单 Big Code 的头名选手,具备优秀的代码生成能力、长序列建模能力、代码修改能力和 SQL 能力,还是国内用户规模第一的智能编码助手通义灵码的底层模型。

 

现场,阿里还宣布推出通义灵码的企业版,满足企业用户的定制化需求,帮助企业提升研发效率。

 

据介绍,通义灵码熟练掌握 Java、Python、Go、JavaScript、TypeScript、C/C++、C#等 200 多种编程语言,可以辅助写代码、读代码、查 Bug、优化代码等。根据官方数据,2023 年 10 月发布至今,通义灵码的插件下载量已超 350 万,每日推荐代码超 3000 万次,被开发者采纳的代码超亿行。

“最受中国企业欢迎的大模型”



根据阿里云公布的最新数据,通义大模型通过阿里云服务企业超 9 万,通义开源模型累计下载量突破 700 万。通义落地应用进程加速,现已进入 PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域,成为最受中国企业欢迎的大模型。

 

周靖人表示,各行各业、各个企业都是特殊的,非常明确的就是让基础模型直接对接业务需求是很难的,因此现在的大模型落地一定要结合业务的场景。

 

小米旗下的人工智能助手“小爱同学”已与阿里云通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态 AI 生成能力,并在小米汽车、手机等多类设备落地。此外,微博、众安保险、完美世界游戏等企业也宣布接入通义大模型,将大模型应用于社交媒体、保险、游戏等领域。

 

更早之前,新东方、同程旅行、长安汽车、西部机场集团、亲宝宝等企业也都与通义大模型达成合作。中国科学院国家天文台人工智能组基于通义千问开源模型开发了新一代天文大模型“星语 3.0”,这是大模型首次应用于天文观测领域;陕煤建新煤矿等十余座矿山推出由通义大模型支持的新型矿山重大风险识别处置系统,成为大模型在矿山场景的首次规模化落地。

 

截至目前,通义大模型通过阿里云服务企业超过 9 万、通过钉钉服务企业超过 220 万。与此同时,海内外大量中小企业和开发者以下载开源模型的方式使用通义,在 HuggingFace、魔搭 ModelScope 等开源社区,通义开源大模型的累计下载量超过了 700 万。

 

在阿里云体系里,把模型能力和业务场景结合起来的纽带就是百炼平台。本次大会上,百炼升级成为阿里云承载云+AI 能力的重要平台,提供一站式、全托管的大模型定制与应用服务。开发者可通过“拖拉拽”5 分钟开发一款大模型应用,几小时“炼”出一个专属模型,把精力专注于应用创新。

 


周靖人介绍,当下企业应用大模型存在三种范式:一是对大模型开箱即用,二是对大模型进行微调和持续训练,三是基于模型开发应用,其中最典型的需求是 RAG,以企业数据对大模型进行知识增强。围绕这些需求,百炼打造了模型中心和应用中心,提供最丰富的模型和最易用的工具箱。

 

百炼提供了提示词模版、拥抱开源框架,包括提供开放灵活可配置的检索增强应用服务、提供实时 API 等,此外还提供可视化流程,提供微调和评测。

 

此外,百炼集成了上百款大模型,除了通义、Llama、ChatGLM 等系列,还托管百川等系列三方模型,覆盖国内外主流厂商,联动魔搭开源社区,同时支持企业上架通用或行业模型,给开发者提供足够多的模型选择。

结束语

 

问世一年多来,通义大模型发展出了文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过 API 调用、模型下载等方式接入通义,个人用户可从通义 APP、官网和小程序免费使用通义家族全栈服务。

 

未来,阿里云的 AI 之路会走得如何,我们也拭目以待。

公众号推荐:

AIGC 技术正以惊人的速度重塑着创新的边界,InfoQ 首期《大模型领航者AIGC实践案例集锦》电子书,深度对话 30 位国内顶尖大模型专家,洞悉大模型技术前沿与未来趋势,精选 10 余个行业一线实践案例,全面展示大模型在多个垂直行业的应用成果,同时,揭秘全球热门大模型效果,为创业者、开发者提供决策支持和选型参考。关注「AI前线」,回复「领航者」免费获取电子书。

2024-05-09 14:487994

评论 1 条评论

发布
用户头像
here we go
2024-06-04 13:16 · 广东
回复
没有更多了
发现更多内容

第43期 | GPTSecurity周报

云起无垠

北京大学讲座:大模型时代的软件研发:技术、范式与工具

华为云PaaS服务小智

人工智能 华为云

报名最后一天!Farris-Vue前端组件创新挑战赛火热报名中!

inBuilder低代码平台

Databend 开源周报第 136 期

Databend

ByteHouse白皮书即将发布,揭秘如何让万台节点的OLAP性能大涨

字节跳动数据平台

大数据

精选!常用的10款会议软件推荐+4款会议必备模板!

彭宏豪95

会议 在线白板 办公软件 在线协作 效率软件

招个Java工程师,却发现了一个宝藏平台

王磊

Java 面试

低代码助力企业数据资产价值升级

Crabc低代码平台

低代码 数字化 数据服务

基于SkyEye仿真6678处理器:实现国产操作系统ReWorks仿真运行

DevOps和数字孪生

国产操作系统ReWorks SkyEye

开源推荐 | 简洁且强大的开源堡垒机OneTerm

37丫37

DevOps 运维 运维自动化 堡垒机 安全审计

git rebase和merge区别

百度搜索:蓝易云

git Linux 运维 Rebase merge

中国滑雪运动趋势洞察2024

易观分析

报告 滑雪

[自研开源] MyData v0.7.3 更新日志

LIEN

开源 数据集成 业务融合 API对接 mydata

crawlab通过docker单节点部署简单爬虫

百度搜索:蓝易云

Java php Go golang Linux

Java+Github+Jenkins部署

百度搜索:蓝易云

golang GitHub Linux 运维 jenkins

Transformer大模型学习导引:光速掌握大模型

鲸品堂

大模型 企业号 3 月 PK 榜

2023 re:Invent 使用 PartyRock 和 Amazon Bedrock 安全高效构建 AI 应用程序

亚马逊云科技 (Amazon Web Services)

生成式人工智能

[人脸修复]基于CodeFormer的人脸修复模型配置

alexgaoyh

环境配置 CodeFormer 人脸修复 人脸复原 旧照片修复

基于SkyEye仿真飞腾处理器:运行U-Boot并加载Phytium-FreeRTOS

DevOps和数字孪生

SkyEye 飞腾处理器

数据平台“国产替代”掣肘在迁移?奇点云的工业制造实践解读

先锋IT

华为云数据库创新发展论坛,打造行业更优数据库底座!

华为云开发者联盟

数据库 后端 华为云 云原生数据库 华为云开发者联盟

大模型微调实战:利用INT8/FP4/NF4量化技术提升性能与效率

百度开发者中心

深度学习 大模型

科普:嵌入式多核并行仿真

DevOps和数字孪生

仿真建模 多核并行仿真

AI技术在医疗领域中有哪些改变?

小魏写代码

纯C语言框架助力降低大模型运行成本

百度开发者中心

人工智能 C语言 大模型

CentOS下查看ssd寿命

百度搜索:蓝易云

centos 运维 SSD 云服务器 smartmontools

AI大模型助力:离线生成中英双语字幕

百度开发者中心

人工智能 数字化时代 大模型

何为代码检查服务的门禁级检查

华为云开发者联盟

开发 华为云 华为云开发者联盟 代码检查

“我们坚持开源!”阿里云发布“地表最强”中文大模型:半年一迭代、性能翻倍?_云计算_褚杏娟_InfoQ精选文章