写点什么

面壁 WAIC 新发布:新一代高效低能耗架构面壁小钢炮、一键开发大模型 APP 的全栈工具集

  • 2024-07-06
    北京
  • 本文字数:1998 字

    阅读完需:约 7 分钟

面壁WAIC新发布:新一代高效低能耗架构面壁小钢炮、一键开发大模型APP的全栈工具集

7 月 5 日,面壁智能联合创始人、首席科学家刘知远在 WAIC 2024 “模型即服务(Mass)加速大模型应用落地”论坛进行了《大模型时代的摩尔定律,迈入更高效的大模型时代》主题演讲,并首次对外介绍:

 

  • 开源新一代高效、低能耗面壁小钢炮 MiniCPM-S 模型

  • 助力开发者一键打造大模型 SuperAPP 的全栈工具集 MobileCPM

 

演讲开场,刘知远表示:“摩尔定律揭示了集成电路可容纳晶体管数目约每隔 18 个月便会增加一倍的规律,在过去几十年中给半导体和互联网行业的发展带来了科学指导意义;身处大模型时代,我们亟需新的“摩尔定律”。我们根据过去几年在大模型领域的深耕和实践,对大模型的发展趋势进行观察总结,提出了大模型时代的面壁定律:大模型的知识密度不断提升,平均每 8 个月提升一倍。”



其中,知识密度=模型能力 / 推理算力消耗


如下图所示,相比 OpenAI 于 2020 年发布的 1750 亿参数的 GPT-3,2024 年初,面壁发布具备 GPT-3 同等性能但参数仅为 24 亿的 MiniCPM-2.4B ,把知识密度提高了大概 86 倍。



不过这还不是面壁的极限,面壁持续优化 Scaling Law,使模型知识密度不断提升,不断训练出计算更加高效且表现更强(参数规模降低,数值位宽降低,结构更加高效)的基础大模型。面壁新一代高效稀疏架构大模型由此而生。

MiniCPM-S:新一代高效低能耗「面壁小钢炮」


为何人脑中的神经元数量与当代最大的基础模型可比,但能源和时间消耗却远低于大模型?这背后,稀疏激活是大脑得以实现低能耗的一大核心“技术”,通过不同任务调取不同⼤脑分区神经元,能源与时间消耗⼤⼤降低。


和大脑类似,采用稀疏激活也能够在同等参数下减少大模型的推理能耗——稀疏度越高,每个词元(token)激活的神经元越少,大模型的推理成本和能耗就越少。MiniCPM-S 1.2B 采用了高度稀疏架构,通过将激活函数替换为 ReLU 及通过带渐进约束的稀疏感知训练 ,巧妙地解决了此前主流大模型在稀疏激活上面临的困境。


和同规模的稠密模型 MiniCPM 1.2B 相比,MiniCPM-S 1.2 具备:

  • Sparse-高稀疏低能耗:在 FFN 层实现了高达 87.89% 平均稀疏度,推理算力下降 84%;

  • Speed-神仙推理: 更少计算,迅疾响应。纯 CPU 环境下,结合 Powerinfer 推理框架,推理解码速度提升约 2.8 倍;

  • Strong-无损强大性能:更少计算量,无损下游任务性能;



另外,MiniCPM-S 1.2B 将知识密度空前提升:达到同规模稠密模型 MiniCPM 1.2B 的 2.57 倍,Mistral-7B 的 12.1 倍。



面壁“高效 Scaling Law” 仍在持续演绎。


相关开源链接:

  • 论文地址:https://arxiv.org/pdf/2402.13516.pdf

  • 模型地址:https://huggingface.co/openbmb/MiniCPM-S-1B-llama-format

  • PowerInfer 可直接运行格式:https://huggingface.co/openbmb/MiniCPM-S-1B-sft-gguf

开源大模型 APP 神器 MobileCPM:一键集成端侧大模型到 APP


此外面壁智能最新开源了业内首个端侧大模型工具集 “MobileCPM ",帮助开发者一键集成大模型到 APP。MobileCPM 开箱即用,包含了开源端侧大模型、SDK 开发套件以及翻译、摘要等丰富的 intent ,人人都可以一站式灵活地定制出满足不同应用场景需求的大模型 APP,低门槛速成「大模型创业者」。



MobileCPM 为开发者提供了三种模式:

  • 基础模式:包含了丰富的适配端侧⼤模型 APP 的 SDK 套件发者基于此即可⾃由灵活地搭建⼤模型 APP,但在这个过程中,基座模型和智能体仍需要开发者⾃⾏开发和接⼊;

  • 精装模式:在基础模式基础上,提供 1.2B 参数的⾯壁新⼀代⾼效稀疏⼤模型 MiniCPM-S,并且 MobileCPM 还支持任意端侧模型的集成,开发者可以根据具体需求选择替换其它端侧模型,并可以通过增加或修改 prompt 的方式定制多种 API,满足不同业务场景需求。

  • 全包配件模式:在精装模式的基础上预装丰富的 intent,并提供保姆式教程,开发者也可使用自定义 intent,减少开发时间,⼤幅提升应⽤的丰富性。

 

本次发布,MobileCPM 默认集成了面壁新一代高效稀疏架构模型 MiniCPM-S 1.2B ,一次性将智能密度拉满,更兼具:

  • 毫秒极速响应:得益于面壁小钢炮 MiniCPM 系列背后的高效大模型训练和推理工厂,MiniCPM-S 能够在毫秒级时间内完成推理和响应,确保用户体验的流畅性。

  • 零推理成本:无需云端 GPU,MiniCPM-S 专为端侧设备而生,在保证性能强大的同时大幅降低了计算资源的消耗,使得端侧推理几乎 0 成本。

  • 一键集成:大模型与 APP 无缝衔接;

  • 预装多种 intent,提供保姆式教程;


基于 MobileCPM 一键开发的示例 APP(端侧模型由 MiniCPM-S 支持),在 iPhone 15 离线环境下毫秒级对话响应,推理速度轻松可达约 30 tokens/s,相当于人类语速的 18~30 倍。


MobileCPM 拉开了端侧AI生态序幕,基于 MobileCPM,任何开发者都可以轻松打造自己的 SuperAPP,有效解决推理成本问题。PC 和智能手机时代,所有原有的应用都值得用高效端侧模型尝试一遍!


MobileCPM 现已全面支持 iOS 系统,Android 版本也即将上线,敬请期待。


  • 开源地址:

https://github.com/OpenBMB/MobileCPM

  • TestFlight 外测链接:

https://testflight.apple.com/join/dJt5vfOZ

2024-07-06 12:226679
用户头像
蔡芳芳 InfoQ 总编辑

发布了 819 篇内容, 共 616.7 次阅读, 收获喜欢 2822 次。

关注

评论

发布
暂无评论
发现更多内容

堡垒机的自动化运维,快速安全提升运维效率

行云管家

数据安全 堡垒机 自动化运维

淘宝商品详情API接口:轻松获取商品SKU信息,优化库存管理

技术冰糖葫芦

API boy API 接口 API 测试

Web3 游戏周报(5.26 - 6.01)

Footprint Analytics

链游

扫码报名活动时,如何避免重复报名?

草料二维码

二维码 活动报名 草料二维码

告别繁琐,一键同步!聚道云助力企业人力资源大升级

聚道云软件连接器

案例分享

Stable diffusion采样器详解

程序那些事

程序那些事 Stable Diffusion

1688批量自动下单接口丨1688代采系统丨1688跨境代采系统

tbapi

1688批量采购 1688代购系统

“码”力全开!高效开发就靠这款神器

ZEGO即构

UI 自定义组件 即构UIkits UIKits

降本增效下的自动化测试实践

老张

软件测试 研发效能 自动化测试 质量保障

如何将您的 API 管理从 Swagger 迁移到 Apifox:详细步骤

Apifox

Apifox 接口文档 API swagger API 文档

用Python打造你的微博热搜追踪器

我再BUG界嘎嘎乱杀

Python 后端 开发语言

保姆级教程:Redis主从复制原理及集群搭建

小曾同学.com

redis主从 redis哨兵集群 redis 底层原理 redis主从集群 redis数据同步原理

斯坦福 AI 团队被曝抄袭中国大模型开源成果;Zoom 创始人谈视频会议未来丨 RTE 开发者日报 Vol.218

声网

探索大模型技术及其前沿应用——TextIn文档解析技术

Yan-英杰

大模型 文档解析 文档解析技术

发挥财务规划隐藏的超能力,实现企业业务与财务的协作

智达方通

企业管理 全面预算管理 财务管理 财务规划

深入剖析时序Prophet模型:工作原理与源码解析|得物技术

得物技术

时序数据库 源码剖析 大模型 企业号2024年6月PK榜 ptophet

仓库数据同步难题如何轻松破解?

聚道云软件连接器

案例分享

NFTScan 获 Google Cloud 战略支持!

NFT Research

Google Cloud NFT\ NFTScan

企业号 6 月 PK 榜,火热开启!

InfoQ写作社区官方

热门活动 企业号2024年6月PK榜

软件测试公开课 | Python高频面试题解析公开课

测试人

软件测试

RESTful API 设计原则:优化您的接口设计

Liam

后端 Rest API APi设计 REST API

利用Python调用KimiGPT API接口

我再BUG界嘎嘎乱杀

Python 后端 开发语言 GPT

数据觉醒时代,以“存力”激活数据资产潜能

优刻得云计算

大数据 数据要素流通

工信部《工业和信息化领域数据安全风险评估实施细则(试行)》实行,行云管家数据产品助力企业数据安全

行云管家

信息安全 数据安全 数据安全管理

实时分析用户反馈:淘宝商品评论API助力电商创新

技术冰糖葫芦

API boy API 接口 API 测试

用这个方法给苹果电脑清理app垃圾,让电脑快如闪电

阿拉灯神丁

CleanMyMac Mac 系统 苹果软件 杀毒软件

Python高频面试题解析公开课

测吧(北京)科技有限公司

测试

面壁WAIC新发布:新一代高效低能耗架构面壁小钢炮、一键开发大模型APP的全栈工具集_生成式 AI_蔡芳芳_InfoQ精选文章