AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

第四范式入局 AI 大模型!「式说 3.0」正式亮相,参数不固定,断网也能跑

  • 2023-04-28
    北京
  • 本文字数:2015 字

    阅读完需:约 7 分钟

第四范式入局AI大模型!「式说3.0」正式亮相,参数不固定,断网也能跑

4 月 26 日,第四范式首次向公众展示其大模型产品「式说 3.0」,并首次提出 AIGS 战略(AI-Generated Software):以生成式 AI 重构企业软件。式说将定位为基于多模态大模型的新型开发平台,提升企业软件的体验和开发效率,实现「AIGS」。


媒体会现场,第四范式创始人、首席执行官戴文渊现场拔网线(切断公网,访问内网集群)测试了式说大模型在图片理解、多轮对话、图片代码、生成代码、逻辑推理上的能力。


戴文渊认为,目前这些 B 端软件极为复杂的交互体验,以及复杂性带来的极低开发效率,恰恰为生成式AI留下足够大的重构和改造空间。


“过去很难通过人类语言(自然语言)的方式去调用企业软件的功能,现在当我们有更强的语义理解和生成能力,再加上 GPT 任务翻译、任务分发和推理的能力,就可以通过更好的**「对话框式」交互方式**实现功能的调用,不再需要找到某个位于十几级的菜单目录之下的功能。”在展示大模型能力时,第四范式在现场拔断网线,在未联网的情况下式说大模型展示了其图片理解、多轮对话、写小说、迅速画图等能力。



此外,现场展示了式说通过推理能力完成更加复杂的“装箱”操作,以及其现场编写代码的能力。



在戴文渊看来,要做到 AIGS,大模型未必需要是知识广博、十项全能冠军的通才,更重要的在于模型具备 Copilot(副驾舱),和思维链 CoT(chain of thoughts,多步推理)的能力。


“要去改造企业软件,大模型不能只有语言能力。式说 2.0 就加入了多模态和 Copilot,因为很多企业软件里的数据是多模态的,而 Copilot 能把人的指令翻译成要调用后台的哪个 API。”此前发布的式说 2.0 的 Demo 中,门店员工通过语音、文本等交互方式向式说发起指令,式说理解后,联网门店监控软件调出后厨未戴口罩的图片,并直接将图片以对话框的形式输出给员工。


大模型去调用软件内置的一个个功能、数据来「对话框式」完成任务,已经能产生巨大价值。但员工用企业软件时也会面临复杂任务,需要人按照顺序执行一个个功能。


因此,式说 3.0 强调的是 Copilot 加上思维链 CoT,具有更强的推理能力,在学习大量数据和“攻略”后,能形成中间的逻辑推理步骤,从而做到拆分并执行复杂工作。


会后,在问及式说 3.0 的具体参数时,第四范式创始人、CEO 戴文渊表示,目前“式说”没有固定的参数,最高达到千亿个。


参数量其实是一个辩证的问题,我们没有一个固定的参数,给到不同客户的参数量也是不一样的,会根据客户不同场景,可能会有几十亿、几百亿参数版本。千亿万亿参数只是代表你最高的能力,但高参数意味着思维能力要求更高、算力高,而客户场景不一定需要这么高的算力要求,因为不是所有场景都能接受千亿参数量成本,所以客户要选择(大模型)。”戴文渊强调,此前 B 端的企业级软件的交互体验极为复杂,拉低了产品开发效率,如今生成式 AI(AIGC)对 B 端软件重构和改造空间足够大。“式说”每天都在进步。

首提 AIGS 战略:以生成式 AI 重构企业软件

ChatGPT 发布后,国内外科技巨头争相入局大模型赛道。国内百度、商汤、科大讯飞等均发布了自己的 AIGC 产品,那么,此次第四范式「式说 3.0」有什么不一样?


戴文渊表示:“中国目前还没有像 OpenAI 那样在大模型上绝对领先的公司,也会有更多的大模型。大模型是新的生产力,大家都得有大模型作为底座,所以入局的门槛确实是变高了。但是在达到这个门槛之后,重点在于如何选择方向。比如培养了一个大学生后,到公司再接受专业的训练,在某一个领域积累专业的能力,这是很重要的。但不具备一定的素质有很多事就干不了,所以底层的大模型也很重要。”


因此,第四范式认为比较大的机会在于改造整个的企业软件行业,也就是 AIGS 这个方向。发力的大模型技术方向是 Copilot 可控(执行可控、知错能改),和思维链 COT((chain of thoughts,多步推理、复杂任务拆分)的能力,形成数据飞轮(比如将某垂直领域的数据和流程投入大模型,很快可以形成模型在该领域的思维链)。


第四范式将 AIGS 的路径总结为三个阶段:


第一阶段,Copilot 调动不同的信息、数据、应用,作为助手完成用户的指令。相当于在所有企业级软件系统里,配备一个指挥官。指挥官听用户的指挥,比如“把照片亮度调亮 20%”。


第二阶段,Copilot+基于企业规则的“知识库”,AI 能够参照规则做复杂工作,进一步丰富了「对话框」的能力。比如 AI 查询了“人像美化”知识库后,能执行把照片修好看的步骤。


第三阶段,Copilot+CoT(思维链)。软件系统的使用行为最终会被大模型学会,形成 AI 针对这个领域的思维链,意味着“把照片处理得更好看”这种复杂指令,AI 能自动地按照步骤完成。


第四范式的 AIGS 战略,就是指基于式说大模型背后的 Copilot+COT 能力,把企业软件改造成新型的交互范式,并在新型交互上不断地学习软件的使用过程,形成领域软件的“思维链”。


除此以外,生成式 AI 对软件的改造,不仅仅体现在体验上,还体现在开发效率上。戴文渊说道,当前的软件开发,绝大多数都是以月计算时间,更复杂的软件开发可能要以年计算。但生成式 AI 改造后的软件开发,可以将这一时间维度缩短到以天计算。


2023-04-28 17:346098
用户头像
李冬梅 加V:busulishang4668

发布了 1061 篇内容, 共 679.4 次阅读, 收获喜欢 1223 次。

关注

评论

发布
暂无评论
发现更多内容

程序员:我熟悉多线程!面试官:都不敢写精通,还敢要26K?

Java 编程 程序员 面试 多线程

优酷小程序优化实战

阿里巴巴终端技术

小程序 ios android 客户端 包大小

专业版再增强 | MSE 无缝兼容 Eureka 协议,性能提升50%

阿里巴巴中间件

阿里云 微服务 云原生 中间件 Eureka

用户案例|告别传统金融消息架构:Apache Pulsar 在平安证券的实践

Apache Pulsar

Apache Pulsar

7张图揭晓RocketMQ存储设计的精髓

阿里巴巴中间件

阿里云 技术 RocketMQ 中间件 存储

浅谈DNS递归解析和迭代解析之间的区别

喀拉峻

网络安全

科技热点周刊|马斯克卖掉特斯拉 10% 股票;Facebook 停用面部识别系统;微软拥抱 Metaverse;雅虎退出中国

青云技术社区

云计算 facebook

golang源码学习--context

en

Context

如何用 Flutter开发一个直播应用

声网

flutter 人工智能

【应用分享】百度超级链助力CFCA建设基于区块链的电子数据存证系统

百度开发者中心

百度 超级链

GitHub多次霸榜,两个月拿下10000+Star,不愧是阿里内部开源的SpringCloud Alibaba笔记

Sakura

Java 编程 架构 面试 计算机

全面升级 —— Apache RocketMQ 5.0 SDK 的新面貌

阿里巴巴中间件

云计算 阿里云 RocketMQ 云原生 中间件

阿里云性能测试服务PTS新面貌 - 压测协议、施压能力全新升级

阿里巴巴中间件

阿里云 中间件 性能测试 SaaS 压测

并发编程之深入理解CAS

Fox666

CAS 并发’ 11月日更 比较与交换

如何使用注解优雅的记录操作日志 | 萌新写开源 01

Zhendong

Java GitHub

龙蜥操作系统将捐赠开放原子开源基金会

OpenAnolis小助手

Linux centos 开源社区 开放原子开源基金会

Python代码阅读(第54篇):斐波那契数列

Felix

Python 编程 斐波那契 阅读代码 Python初学者

资产管理系统是管钱的吗?不完全对

低代码小观

企业管理 资产配置 资产管理 管理系统 企业资产

RecyclerView使用GridLayoutManager为什么无法均匀分布?

Changing Lin

11月日更

Linux踩过的坑

正向成长

Linux

又碰到一个奇葩的BUG

艾小仙

巩固Java基础,备战来年跳槽——你的薪资自己说了算

Java 编程 程序员 面试 线程

GitHub标星139K的:“嵌入式Linux系统开发教程”

Java Linux 编程 程序员

JWT、JWS与JWE

喵叔

11月日更

茜纱窗下夜读书(2021年11月)

美月

#读书

如何给企业制定碳排放额度?

石云升

学习笔记 碳中和 11月日更 碳交易

使用 Spring Boot 构建可重用的模拟模块

码语者

Spring Boot Module

客户端稳定性异常检测:函数接口“扫雷”实践

阿里巴巴终端技术

函数式接口 稳定性测试 异常检测 客户端 APP稳定性

AliRTC 开启视频互动 “零计算” 时代

阿里云CloudImagine

阿里云 音视频 RTC 视频云

300M的文件,9秒钟下载完成,这款软件真的太离谱!

懒得勤快

基于 RocketMQ 构建阿里云事件驱动引擎EventBridge

阿里巴巴中间件

阿里云 RocketMQ 云原生 中间件 事件总线

第四范式入局AI大模型!「式说3.0」正式亮相,参数不固定,断网也能跑_AI&大模型_李冬梅_InfoQ精选文章