写点什么

大模型应用成本卷到了千元级!云天励飞发布“深目”AI 模盒:搭载自研芯片,单手可托起

  • 2024-03-30
    北京
  • 本文字数:3429 字

    阅读完需:约 11 分钟

大小:1.75M时长:10:12
大模型应用成本卷到了千元级!云天励飞发布“深目”AI模盒:搭载自研芯片,单手可托起

3 月 28 日,云天励飞举办 AI 大模型产品发布会,正式发布“深目”AI 模盒。该产品能够做到“3 个 90%”——覆盖场景超过 90%、算法精度超过 90%,使用成本降低 90%,解决大模型在场景落地最后一公里的问题,帮助更多中小企业客户轻松使用大模型。


会上,云天励飞还与鹏城实验室、之江实验室、中国电子、华为、华润数科等单位成立“深目 2.0”生态联盟,共同探索更多大模型落地应用路径。


值得一提的是,云天励飞还宣布“云天天书-2.0-68B”版本免费向合作伙伴开放;即日起预订“深目”AI 模盒,即有机会获得邀约测试的机会。

解决掉大模型成本问题,才能推动 AI 普世化

从 ChatGPT 到 Sora,从文生文、文生图像到文生视频,大模型发展日新月异,持续给行业带来惊喜,不仅国内掀起“百模大战”,国外科技巨头也在大模型上争相“亮剑”。大模型的能力在不断进化,引发新一轮的 AI 变革。


云天励飞董事长兼 CEO 陈宁博士在发布会上提到:未来 3 年,全球 80%的企业都将使用大模型。但是,要训练专属大模型,不仅需要大算力、大数据,还需要大量顶尖人才。大模型一次训练成本在千万级,主流的训推一体机价格普遍在百万元,绝大多数企业都无法承担这样高昂的成本。


为了能够让大模型“平民化”,成为人人都可用的产品,云天励飞推出了“深目”AI 模盒。


这款产品售价在千元级,用单手就能托起,搭载了云天励飞的自研大模型边缘训推芯片 DeepEdge10 Max 以及自研多模态大模型“云天天书”,具备算法边缘侧在线学习能力,可实现算法场景覆盖超过 90%、算法精度超过 90%,使用成本降低 90%,让人人都能够根据自身场景需求,利用大模型能力,训练出可实战应用的算法,让大模型唾手可得。


那么,云飞励天推出“深目”模盒的初心是什么,要解决什么问题?InfoQ 采访了云天励飞创始团队成员,了解了“深目”背后的故事。


云天励飞董事长兼 CEO 陈宁博士表示:“如今,如人脸识别、智能推荐、车牌识别等这些头部算法客观来讲已经有很多企业给出了比较完善的解决方案,但除了这些头部的算法还有大量长尾的、低频的场景和算法并没很好的解决掉,它们才是真正地制约了人工智能在千行百业、在各场景的落地。这些低频的长尾算法虽然出现频率低,但在大模型爆发之前,很多 AI 创企解决这些长尾算法需要投入的成本和周期是巨大的,而肯为此买单的客户寥寥无几,这也给 AI 在很多场景中的商业闭环带来巨大挑战。”


而大语言模型爆发后,这种情况得到了改善。市场上更多参与者开始认识到,融合了多个自然语言处理和视觉能力的大模型,可以作为一个坚实的底座去高性价比地解决各类长尾算法问题。


所以在去年,云飞励天将多模态大模型与自研芯片进行深度融合,推出了算法芯片化驱动的边缘设备,能够以更低的成本、统一的一套技术平台解决多类细分场景最后精度不够、成本太高、训练周期太长,需要的数据量太大等等一系列痛点问题,去推动 AI 真正能够在更多的场景、更多的行业形成价值闭环,最后能够去落地。


把大模型变“小”,云天励飞是怎么做到的?


虽然应用成本更低,但“深目”AI 模盒在性能上没有打折。“能够实现 3 个 90%,离不开云天励飞的核心能力——算法芯片化。”陈宁博士说。


“深目”AI 模盒的算力基础,来源于去年云天励飞推出的 14nm Chiplet 大模型训推芯片 DeepEdge10 Max。该芯片采用自主可控的国产工艺,内含国产 RISC-V 核,支持大模型训练推理部署。依托自研芯片 DeepEdge10 Max 创新的 D2D chiplet 架构打造的 X5000 推理卡,已适配并可承载 10 亿级 SAM、百亿级 Llama2 等大模型运算,可广泛应用于 AIoT 边缘视频、移动机器人等场景。


“深目”AI 模盒的大模型能力,来源于云天励飞自主研发的多模态大模型“云天天书”。云天天书大模型包含语言大模型、多模态大模型等不同系列,在 C-Eval、CMMLU 等权威测试中多次获得第一,并于去年正式通过中央网信办备案。云天天书 1.0 版本于 2023 年初正式推出,至今已完成 3 个版本的迭代,预计今年 6 月将迭代 4.0 V 版本。


以云天天书为底座,云天励飞能够与生态合作伙伴完成预训练场景算法,再将预训练算法提供给广大中小企业用户,中小企业客户可根据自身场景需求,在边缘端完成算法微调。由于大模型具备泛化和学习的能力,客户部署算法后,大模型还能够不断根据现实应用场景情况,在线学习、优化算法,不断提升算法精度。


“深目”AI 模盒不仅仅是“压缩”了大模型和芯片能力的一款全新产品,更是把云天励飞大模型通过算法芯片化能力平台“硬件化”的一次重要尝试。把复杂的技术通过简单的产品提供给用户,让用户可以零学习成本,快速训练出自己需要的算法。

场景算法,秒速训练


“深目”AI 模盒背后蕴藏了复杂的技术,但对于用户而言,他们只需要关心产品到底怎么用、好不好用。发布现场,云天励飞副总裁罗忆用实际场景演示了“深目”AI 模盒是如何在数据少、无数据等极端情况下,快速完成算法训练。


场景演示一:只需少量样本,算法精度即可提升到 90%以上


在算法使用初期,只有少量数据,用户如何才能快速训练高精度算法?


以店外经营为例,这是城市治理中最常见的问题之一。当用户需要训练识别算法时,可以直接使用平台现成的算法对目标进行识别。用户只需要对识别结果标记“正确”和“误报”,算法精度就能通过自学习快速提升。通过这样的过程,算法精度通过一次训练就能得到显著提升,经过1周迭代后算法精度可超过 90%。


罗忆介绍,云天励飞为客户提供的算法训练平台上,有大量与生态合作伙伴共同打造的算法商城,能够提供覆盖 14 个大类、100+个小类、千余种算法,用户可以直接调用预训练算法,并上传自身场景图片完成算法的微调和升级,快速训练出高精度算法。


场景演示二:零数据样本,用 AIGC 数据训练 AI


天灾人祸等极端场景识别训练的数据几乎空白,面对这样“无数据”的情况,用户该如何训练算法?


以加油站场景的吸烟识别为例,这类行为的数据极难获取,因为这类危险行为往往伴随着成不可挽回的后果。而平台能够利用大模型能力,以加油站为背景,生成在该环境抽烟行为的人物,并将数据用于算法训练中,填补训练数据的空白。


使用 AI 合成数据来训练算法,不仅能够填补数据空白,还能够规避隐私安全等问题,已经逐渐成为大模型时代下训练新算法和提升算法精度的一条重要路径。


场景演示三:识别对象标准不统一,大模型泛化能力解决问题


现场以“购物中心提袋识别”为例,演示了如何利用大模型泛化能力,解决识别对象标准不统一带来的算法训练难题。


大型购物中心一般没有统一的结算中心,购物中心难以掌握逛街顾客是否消费,也难以评估营销活动对实际消费转化的效果。而顾客是否提购物袋,是大型商场判断顾客是否消费的重要标准之一。但是,各品牌购物袋的大小、颜色均不统一;而且难以与顾客的背包区分,算法难以精准识别。


但在云天励飞的算法训练平台上,借助场景自适应能力,能够实现“千店千袋”的识别。首先,用户需要调用“拎手提袋识别”算法,识别所有的手提袋,再基于识别结果进行特定手提袋的识别训练,从而衍生出特定手提袋的识别算法,最后即可实现专用门店手提袋的精准识别。

做物理世界的解码者


从 2014 年成立至今,云天励飞一直坚持将 AI 技术与物理世界相结合,这也是云天励飞从成立之初自研芯片的重要原因。芯片是 AI 与物理世界的连接器,AI 通过芯片为实体赋能,物理世界的数据又通过芯片反哺 AI,推动 AI 进步发展。


“AI 商业化发展有三个阶段:AI 方案化、AI 运营化、AI 产品化。”陈宁博士在发布会现场说道。在 AI 方案化阶段,AI 企业主要通过项目制满足不同垂直领域客户需求。在打磨行业标杆项目的过程中,AI 企业不断积累行业认知和数据,AI 技术实力不断增强,并形成具备越来越强的泛化能力 AI 平台,企业也得以开启 AI 运营业务。而最终,所有的技术都需要通过物理实体赋能,因此 AI 最终必须走向产品化。


云天励飞业务发展路径也沿着这条路径展开。在 AI 方案化方面,云天励飞在警务、城市治理、智慧交通、人居生活等领域打造诸多标杆项目,并且在低空经济、智慧教育等创新领域持续展开探索。基于在大量行业的落地经验,云天励飞已形成数据运营、新能源运营平台,走向 AI 运营化。如今,云天励飞还逐步走向 AI 产品化。去年,云天励飞与华为昇腾联合推出天舟大模型训推一体机;如今又推出面向边缘训推场景的“深目”AI 模盒。此外,云天励飞还通过资本纽带,进军智能穿戴和机器人等硬件领域,形成日益完善的大模型产品体系。


从 AI 方案化、AI 运营化再到 AI 产品化,云天励飞一直在致力于做物理世界的“解码者”,通过算法芯片化的能力,为“无形”的技术和“有形”的世界构建通道,让 AI 不仅仅是一个在虚拟世界的工具,而是转化为物理世界的生产力。

2024-03-30 00:065570
用户头像
李冬梅 加V:busulishang4668

发布了 1193 篇内容, 共 816.1 次阅读, 收获喜欢 1305 次。

关注

评论

发布
暂无评论
发现更多内容

千万级学生管理系统的考试试卷存储方案

Steven

架构实战营

速来!开源中国首届飞算SoFlu组件开发悬赏赛来袭

飞算JavaAI开发助手

Java

手把手教你学Dapr - 1. .Net开发者的大时代

MASA技术团队

C# .net 微软 后端 dapr

LevelDB Java&Go实践

FunTester

Java 自学 Go 语言 leveldb FunTester

短视频个性化Push工程精进之路

百度Geek说

后端 软件架构

Python代码阅读(第58篇):压缩列表

Felix

Python 编程 列表 阅读代码 Python初学者

首次!统一调度系统规模化落地,全面支撑阿里巴巴双 11 全业务

阿里巴巴中间件

阿里云 云原生 中间件 双十一 统一调度

项目管理常见问题系列(1)—资源不足

一叶而不知秋

项目管理

我是一个程序员,总想引导亲朋好友走上编程的伟大航路......

图灵教育

程序员 App Inventor

彻底搞懂Spring状态机原理,实现订单与物流解耦

Tom弹架构

前端的状态管理与时间旅行:San实践篇

百度开发者中心

大前端 san san-store 技术实践

uni-app技术分享| 10分钟实现一个简易uniapp视频通话

anyRTC开发者

uni-app 音视频 WebRTC 实时通信 视频通话

Vue项目优化打包——前端加分项

CRMEB

手把手教你学Dapr - 2. 必须知道的概念

MASA技术团队

C# .net 微软 后端 dapr

拥抱智能,AI 视频编码技术的新探索

阿里云CloudImagine

阿里云 视频编码 机器视觉 视频编解码 视频云

模块三作业——外包学生管理系统架构设计

覃飞

混合云的概念以及优势劣势简单介绍-行云管家

行云管家

云计算 混合云 多云 云管平台

不要再重复造轮子了,Hutool这款开源工具类库贼好使

沉默王二

Java

月薪3万的大厂测试工程师裸辞3个月,送外卖谋生背后的真实感悟

六十七点五

程序员 程序人生 软件测试 软件自动化测试 测试工程师

企业如何选择合适的低代码平台?这6点不得不考虑!

J2PaaS低代码平台

低代码 低代码开发 低代码平台 企业数字化

Nebula Graph 源码解读系列 | Vol.04 基于 RBO 的 Optimizer 实现

NebulaGraph

图数据库 源码解读

就是简单,全球100多万读者,一起跑通前端HTML5与CSS3知识!

图灵教育

大前端 HTML5, CSS3

第一本 Compose 图书上市,联想大咖教你学会 Android 全新 UI 编程

图灵教育

Compose AndroidUI

令人不悦的–requests.exceptions.ProxyError

老表

Python Error 11月日更 ProxyError

河南等保测评公司都有哪几家?都在哪里?

行云管家

网络安全 信息安全 数据安全 等级保护

CSS布局之display:flex(二)

Augus

CSS 11月日更

一招教你通过焱融 SaaS 数据服务平台+ELK 让日志帮你做决策

焱融科技

云计算 分布式 SaaS 公有云 文件存储

极光笔记丨关于数据大屏一比一还原设计稿这件事

极光GPTBots-极光推送

大前端 数据可视化

【高并发】通过ThreadPoolExecutor类的源码深度解析线程池执行任务的核心流程

冰河

Java 并发编程 多线程 高并发 异步编程

我所理解的社群—社群本质

sec01张云龙

社群 11月日更 社群运营

大模型应用成本卷到了千元级!云天励飞发布“深目”AI模盒:搭载自研芯片,单手可托起_生成式 AI_李冬梅_InfoQ精选文章