【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

智源发布 FlagOpen 大模型技术开源体系,要做大模型时代的“新 Linux”

  • 2023-03-06
    北京
  • 本文字数:4587 字

    阅读完需:约 15 分钟

智源发布FlagOpen大模型技术开源体系,要做大模型时代的“新Linux”

最近,现象级应用 ChatGPT 屡屡刷新人们的认知。ChatGPT之所以迅速风靡全球,爆红出圈,与其较低的使用门槛离不开。它的出现也表明,人工智能进入普及应用的新时期。

 

大模型是 ChatGPT 背后的核心技术支撑。近几年,预训练大模型进入了爆发期。


 “大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。

 

智源研究院是中国最早进行大模型研究的机构:2020 年搭建大模型攻关团队,2021 年 6 月推出了多模态大模型“悟道 2.0”。2023 年初,智源研究院联合 30 多家产学研单位共同承担的项目“人工智能基础模型支撑平台与评测技术”全面启动。

 

经 2 个月集中攻关,智源研究院开发出了 FlagOpen(飞智)大模型技术开源体系,旨在打造全面支撑大模型技术发展的开源算法体系和一站式基础软件平台,支持协同创新和开放竞争,共建共享大模型时代的“新 Linux”开源开放生态。

 

FlagOpen 飞智大模型技术开源体系

 

FlagOpen(飞智)大模型技术开源体系是由智源研究院与多家企业、高校和科研机构共建的一站式、高质量的大模型开源开放软件体系,包括大模型算法、模型、数据、工具、评测等重要组成部分,旨在建设大模型领域的“Linux”。

 

基于 FlagOpen,国内外开发者可以快速开启各种大模型的尝试、开发和研究工作,企业可以低门槛进行大模型研发。

 

同时,FlagOpen 大模型基础软件开源体系正逐步实现对多种深度学习框架、多种 AI 芯片的完整支持,支撑 AI 大模型软硬件生态的百花齐放。

 

FlagOpen 将通过 Linux 基金会、启智社区等开源组织,推动国内外开发者协同创新。通过开源开放方式,全球开发者可以自由探索、共同贡献、协同创新。未来,FlagOpen 也将支撑全球 AI 企业、机构基于 FlagOpen 构建 AI 大模型软件发行版本、平台、商业软件等。

 

FlagOpen 开源平台入口:

 

https://flagopen.baai.ac.cn

 

FlagAI :大模型算法、模型及工具一站式开源项目

 

为降低大模型开发和应用的门槛,提高大模型的开发效率,智源研究院打造了大模型算法、模型,及各种优化工具的一站式、高质量开源项目 FlagAI。

 

FlagAI 集成全球各种主流大模型算法技术,以及多种大模型并行处理和训练加速技术,支持高效训练和微调。

 

FlagAI 涵盖多个领域明星模型,如语言大模型 OPT、T5,视觉大模型 ViT、Swin Transformer,多模态大模型 CLIP 等。

 

坚持开源开放路线,智源研究院也持续将“悟道”大模型项目成果开源至 FlagAI,包括“悟道 2.0”通用语言大模型 GLM,“悟道 3.0”视觉预训练大模型 EVA,视觉通用多任务模型 Painter,文生图大模型 AltDiffusion(多语言),文图表征预训练大模型(多语言)、EVA-CLIP(英文),阿拉伯语大模型 ALM,百亿语言基础模型 CPM3 等。

 

目前,FlagAI 已经加入 Linux 基金会,吸引全球科研力量对大模型技术共同创新、共同贡献。

 

项目地址:

https://github.com/FlagAI-Open/FlagAI

 

FlagPerf:面向多种 AI 硬件的一体化评测引擎

 

AI 硬件评测对 AI 生态有重要价值,但由于 AI 软硬件技术栈异构程度高、兼容性差,应用场景复杂多变,给评测本身带来了很多挑战。

 

FlagPerf 希望共同探索开源、开放、灵活、公正、客观的 AI 硬件评测体系,建立支持多种深度学习框架、最新主流模型评测需求、易于 AI 芯片厂商插入底层支撑工具的 AI 系统评测生态。不以排名为核心目标,而以提供行业价值、促进 AI 产业生态发展为愿景。

 

目前该项目已和天数智芯、百度 PaddlePaddle、昆仑芯科技、中国移动等深度合作,共同推进 AI 硬件评测建设。围绕 FlagPerf,也将有更多厂商和团队加入共同贡献的大家庭。

 

项目地址:

https://github.com/FlagOpen/FlagPerf


AI 硬件评测是必然方向

 

智源研究院院长黄铁军表示,AI 硬件评测是一个必然的发展方向,现在行业里很多厂商都在做芯片,需要建立标准和评测方法,以让这些产品将来实现互联互通,更好地构建算力中心、终端芯片等。建立相应的 AI 硬件标准体系以及评测手段、体系是产业走向成熟的一个标志。

 

现阶段,在 AI 硬件测试标准方面,国内诸多厂商都有动作。谈到 FlagPerf 相较于其他基准测试工具的不同点和优势点。智源研究院总工程师林咏华表示,由商业公司发起的 AI 硬件评测标准,在展开评测时,一定程度上带上了企业的商业诉求。由于产品或平台的诉求,商业公司自身就需要这样的评测工具。

 

但不同的是,智源站在一个更中立的位置上。在 AI 硬件系统评测,评测工具的选择和评测方法的设定方面,智源这样的机构具有更好的中立性。

 

FlagPerf 测评引擎的差异点在于,一是不只专注于某一款硬件;二是支持不同深度学习框架,而不是只会把某一种框架集成。“对于用户企业,我们不想限制它,在它想选择评测某一款芯片时,框住它只能用某一款芯片,我们希望让国内的深度学习框架也得以在这样的评测平台上被选择”,林咏华表示,“通常做评测需要持之以恒。作为中立机构,我们把 FlagPerf 开源出来,且第一时间就把多个厂商拉进来,希望大家共同来贡献,希望这个项目能持之以恒地往前推进”。

    

谈到接下来 FlagPerf 的发展,智源研究院副院长兼总工程师林咏华表示,“我们首先希望它先变成一个事实基准,大家都能用它来测评硬件,也爱用它。至于未来 FlagPerf 会不会发展成产业的标准,智源保持顺其自然的态度”。

 

FlagEval:多领域、多维度的基础大模型评测开源项目

 

大模型时代需要科学、公正、开放的评测基准及工具来帮助人们更深刻的理解和认识模型,但在学术界一直缺乏能涵盖多种模态领域、多种评测维度的统一化评测体系和项目。尤其在 AIGC 的发展浪潮下,如何对生成任务进行更高效、更客观的评价,是阻碍大模型落地的重要制约。

 

智源研究院将联合多个高校团队,共同打造覆盖多个模态领域、包含评测维度的评测工具 FlagEval,探索大模型自动评测技术,推动大模型技术创新和产业应用。

 

FlagEval 首先开放近期备受关注的多模态领域-CLIP 系列模型评测工具,支持多语言多任务、开箱即用。之后,更多领域、更多维度的评测工具陆续发布。

 

项目地址:

https://github.com/FlagOpen/FlagEval

 

FlagData:开箱即用、易于扩展的数据工具开源项目

 

数据是人工智能领域发展的基础要素之一。随着大规模预训练模型及相关技术不断取得突破,在相应研究中使用高效数据处理工具提升数据质量变得日益重要。

 

智源研究院长期投入数据建设工作,构建了全球最大 WuDaoCorpora 语料库,同时开发了一批数据处理的高效工具。

 

FlagData 数据工具开源项目集成包含清洗、标注、压缩、统计分析等功能在内的多个数据处理工具与算法,为自然语言处理、计算机视觉等领域的模型训练与部署提供了数据层面的有力支撑,有助于推动大模型的快速发展。

 

项目地址:

https://github.com/FlagOpen/FlagData

 

FlagOpen 大模型技术开源体系正在与 Linux 基金会等全球开源代表组织与机构积极合作,加快建设面向全球的大模型技术开源生态。

 

全球最大的 AI 领域开源基金会- Linux AI & DATA 基金会主席堵俊平认为 FlagOpen 大模型技术开源体系的发布,是人工智能大模型时代开源创新生态建设的重要一步:“未来,大模型领域一定会出现类似 Linux 的开源生态体系,开源开放加速 AI 技术创新。”

 

Stability AI 全球产品副总裁 Christian Cantrell 说:“我们在开源社区中与智源团队合作,基于 FlagAI 开源的多语言文图模型能力,合作打造支持更多语言的扩散生成模型。很高兴看到智源研究院把大模型技术体系开源,这对全球大模型创新的推动和开放合作十分重要”。

 

打好大模型根基,才能产生更多“ChatGPT 级”应用

 

黄铁军在主题演讲中表示,开源开放是智能时代的必然选择。

 

大模型通过同一模型完成多场景任务,成为支撑无数智能应用的基础平台,使得人工智能技术的大规模应用变为可能,加速了智能时代的真正到来。

 

当前深度学习阶段的人工智能系统具有难以透彻理解的技术特性,智能时代不应封闭、必须开放、最好开源,特别是作为基础平台的大模型需要全面开源、接受监督,才能得到信任、采纳和广泛应用。

 

结合当下 ChatGPT 热潮,黄铁军认为,此类 AI 现象只是大模型技术海平面以上的冰山一角,深藏于海平面以下的大模型技术体系才是更值得关注的部分。从长远考虑,打好根基,形成完整的大模型技术体系及强大的资源能力,未来才能产生更多的“ChatGPT 的现场级应用。

 

FlagOpen 正是为了建立大模型技术体系而开展的基础性工作,通过开源开放的形式促进各类机构共创共享,形成良好生态,共同打牢大模型发展根基。未来将面向各类企业提供大模型相关技术服务,支撑各行业智能应用开发,赋能经济社会智能化升级。

 

FlagOpen“大模型的领域的 Linux ”尝试

 

FlagOpen 目标做大模型领域的“Linux”。

 

在操作系统的发展历程中,各个阶段都涌现出了很多操作系统,但 Linux 在整个市场竞争中占据了主要份额,从这个意义上看,Linux 非常成功。Linux 的诞生源于一个叫“Minix”教学操作系统,30 多年来,Linux 发展成为拥有海量全球用户的操作系统,其成功离不开开源。在大部分情况下,以开源形式或以开源形式为基础的产品往往能占据较高的市场份额。

 

为什么大家愿意用开源的操作系统?商业公司也可以直接购买闭源的操作系统,这并不仅仅是因为开源免费带来的成本的降低,而是风险降低了。如果只采购闭源的操作系统,如果背后企业不继续维护了,就要迁移技术栈,而开源则不会遇到这样的问题,多家企业共同维护开源,就不会因为单个企业的问题导致整个开源软件使用出现问题。此外,每天都有很多开发者使用开源软件,并在使用过程中汇报、反馈问题,因此开源软件往往比闭源软件在技术风险上更低,更快地解决技术问题。

    

可以看到,开源开放已经发展成为大趋势,越来越多的产品在不同程度上建立在了开源的基础之上。黄铁军认为,一个开源项目的成功,应该是大多数做产品和服务的企业都使用这样的开源体系,就像 Linux、RISC-V 就是得到广泛采用的体系。智源希望 FlagOpen 在智能时代,也发挥这样的作用。

 

智源希望以大模型为主导的方向来提供更基础的贡献。“智源在大模型方面已做了几年,是全球范围内大模型研究的先行力量。黄铁军说,不可能也不应有任何一家企业来完全封闭地主导这个对人类来说至关重要的方向。智源希望跟大家一起共同建立开源开放技术体系的全球生态。选择做大模型开源”,而非以封闭的产品主导世界,这是众望所归。

 

但黄铁军认为,各家不应该陷入“比模型”的竞赛中,模型的参数、性能、训练等都只是产业生态中的一部分,远远不是全部。“大模型代表了人工智能发展的主流方向,我们更应该关心训练大模型的技术——用大模型怎么更好地提供智能和智力服务?在这背后,一个庞大的技术体系和产业生态正在形成,开发者和企业应当在过程中用产业生态的角度看问题,找到发挥自己潜力的位置,而不仅仅是比模型”。

 

智源会不会做中国的 OpenAI?

 

自 ChatGPT 走红后,全球互联网大厂、创业公司纷纷加码布局。ChatGPT 引爆了一场军备竞赛,大型科技公司间的 AI 竞赛逐渐白热化。王慧文、李志飞、周伯文等科技大佬也纷纷下场创业,加入战局,都称要打造“中国的OpenAI”。

 

那么,在中国最早坚定大模型研究路线的智源要不要做中国的 OpenAI?


对此,黄铁军表示,每个机构都有各自的特点和理念,这很难简单做对比,但可以相互借鉴。智源与 OpenAI、DeepMind 等机构的相同点在于,都在追求 AI 的前沿、开放研究,目标为全球 AI 的未来发展贡献力量。


作为中立的非营利机构,能够更好地汇聚商业、学术与政府资源,集中力量办大事,提升科研创新成功概率。这是得天独厚的优势。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-03-06 18:069803
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 494.6 次阅读, 收获喜欢 1968 次。

关注

评论

发布
暂无评论
发现更多内容

序列化与反序列化一棵树

程序员在修行

英文阅读 The manager's path 1.3

程序员在修行

Mybatis中传递多个参数的4种方法

源字节1号

开源 软件开发 前端开发 后端开发 小程序开发

腾讯云 CODING 入选“数智影响力”数字化转型创新典型案例

CODING DevOps

不知道该选公有云还是私有云?这些客户请选私有云

青椒云云电脑

桌面云 云桌面

高校云桌面的“正确打开方式”是什么?

青椒云云电脑

云桌面 云桌面方案

Ask Milvus Anything!聊聊被社区反复@的那些事儿 Ⅰ

Zilliz

非结构化数据 Milvus 向量数据库 deepdive

代码混淆和加固,保障应用程序的安全性

雪奈椰子

9月24日,线下见个面?

MatrixOrigin

数据库 分布式 MatrixOrigin MatrixOne

【转载】JVM实际内存占用超过Xmx的原因,设置Xmx的技巧

虚实的星空

Java

英特尔产品组合针对多规模AI模型性价比优势明显

E科讯

关于身心灵学习的感悟1

程序员在修行

ARTS 打卡第四周

程序员在修行

如何赋能企业数字化转型?华为云有妙招

YG科技

使用消息队列有什么优点?有什么缺点?

程序员在修行

一文读懂私有云、公有云和本地化部署

青椒云云电脑

公有云 私有云

从实时监控到智能洞察:Grafana 和 CnosDB 的无限潜力

CnosDB

时序数据库 开源社区 CnosDB

百度智能云千帆社区上线有礼,助力开发者开启大模型之路!

科技热闻

Databend 开源周报第 110 期

Databend

Last Week in Milvus

Zilliz

非结构化数据 Milvus Zilliz 向量数据库

数据通信网络之IPv6以太网单臂路由

timerring

数据通信网络

议题征集|Flink Forward Asia 2023 正式启动

Apache Flink

flink

INFINI Easysearch 与兆芯完成产品兼容互认证

极限实验室

easysearch 兆芯 国产适配

828 B2B企业节,华为云如何提升生态合作伙伴的综合竞争力?

YG科技

从构建者到设计者的低代码之路

树上有只程序猿

软件开发 低代码

Footprint Analytics 为 ABGA Web3 Gaming Summit 提供支持,助力 Web3 游戏行业发展

Footprint Analytics

云迁移?是技术问题也是团队问题

在天涯的海角

用AI提高代码质量,同事对我的代码赞不绝口~

SoFlu软件机器人

亚信科技与中国信通院达成全方位、跨领域战略合作

亚信AntDB数据库

AntDB 国产数据库 AntDB数据库

数字化转型与架构-架构设计篇|如何开发一个各部门都满意的系统?

数字随行

数字化转型

基于Vue3前后端分离的低代码开发框架

互联网工科生

Vue 软件开发 低代码 JNPF

智源发布FlagOpen大模型技术开源体系,要做大模型时代的“新Linux”_AI&大模型_刘燕_InfoQ精选文章