阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

“干掉程序员”,百度是认真的!发布三大开发工具和全新操作系统,李彦宏:只要会说话就会干开发

  • 2024-04-16
    北京
  • 本文字数:4447 字

    阅读完需:约 15 分钟

大小:2.22M时长:12:57
“干掉程序员”,百度是认真的!发布三大开发工具和全新操作系统,李彦宏:只要会说话就会干开发

“基本上以后不会存在‘程序员’这种职业了,因为只要会说话,人人都会具备程序员的能力。”百度创始人、董事长兼 CEO 李彦宏在 3 月份接受央视采访时表示。


而在 4 月 16 日的 2024 百度 Create 开发者大会上,李彦宏再次强调了这个观点:“过去,开发者用代码改变世界;未来,自然语言将成为通用编程语言。你只要会说话,就可以成为一名开发者,用自己的创造力改变世界”。


李彦宏以百度为例介绍道,基于文心大模型的智能代码助手 Comate 已经编写了百度内部四分之一的代码,而百度每天的新增代码中,27%是由 Comate 自动生成。Comate 也已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业,生成的代码采纳率达到了 46%。


据悉,Comate 支持 100 多种语言和所有的 IDE 平台,可以推荐代码、生成代码注释、查找代码缺陷、给出优化方案,还可以深度解读代码库、关联私域知识生成新的代码等。


“今天,你不会写代码,也可以做出一个应用;不用编程,也可以做出一个智能体。AI 正在掀起一场创造力革命,未来开发应用就会像拍短视频一样简单,人人都是开发者,人人都是创造者。”李彦宏说道。




那么,李彦宏具体要如何淡化程序员边界、降低开发者门槛呢?


“开源模型会越来越落后”


“开源模型会越来越落后。”李彦宏在现场表示。




李彦宏解释称,因为有了最强大的基础模型文心 4.0,用户可以根据需要,兼顾效果、相应速度,推理成本等各种考虑,剪裁出适合各种场景的更小尺寸模型,并且支持精调和 post pretrain。这样通过降维剪裁出来的模型,比直接用开源模型调出来的模型,同等尺寸下,效果明显更好;同等效果下,成本明显更低。“所以开源模型会越来越落后。”


另外,李彦宏也提到,多模态大模型是通往 AGI 的必经之路,而视觉大模型最大的应用场景是自动驾驶。




李彦宏介绍了文心大模型的最新进展。他表示,文心大模型已经成为了中国最领先、应用最广泛的 AI 基础模型。不仅如此,相比一年前,文心大模型的算法训练效率提升到了原来的 5.1 倍,周均训练有效率达到 98.8%,推理性能提升了 105 倍,推理的成本降到了原来的 1%。也就是说,客户原来一天调用 1 万次,同样成本之下,现在一天可以调用 100 万次。


据悉,文心一言从去年 3 月 16 日首发至今,用户数突破了 2 亿,每天 API 的调用量突破 2 亿,服务企业达到 8.5 万,利用千帆平台开发的 AI 原生应用数超过了 19 万。




另外,根据过去一年的实践,百度分享了开发 AI 原生应用的三个具体思路:


第一是 MoE。未来大型的 AI 原生应用基本都是 MoE 架构,这里所说的 MoE 不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型,需要针对应用的不同场景做匹配。


第二是小模型。小模型推理成本低,响应速度快,在一些特定场景中,经过 SFT 精调后的小模型,它的使用效果可以媲美大模型。通过大模型压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型效果更好,速度更快,成本更低。


第三是智能体。智能体是当下很热的一个话题,随着智能体能力的提升,会不断催生出大量新的应用。智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,还可以让不同的智能体互动,相互协作,更高质量地完成任务。


百度本次的正式产品发布,基本也是围绕上述思路进行的。


如何让“人人都是开发者”?


“人人都可以成为开发者”不能成为一个口号,必须有能让开发者随取随用的工具支撑才能实现。为此,百度推出了文心大模型 4.0 工具版,包括智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder 和模型定制工具 ModelBuilder 三大工具。


AgentBuilder:智能体开发


“智能体可能是未来离每个人最近、最主流的大模型使用方式。基于强大的基础模型,智能体可以批量生成,并应用在各种各样的场景。”李彦宏说道。


作为基于文心大模型的智能体构建平台,AgentBuilder 为开发者提供了零代码和低代码两种低成本智能体开发模式。开发者可以根据不同行业领域、应用场景,调用平台提供的多样化工具,打造大模型时代的原生应用。无论是专业开发者还是新手,仅用“一句话”就创建智能体。


据悉,截至目前,已经有 3 万多个智能体被创建、5 万多名开发者和上万家企业入驻。


大会现场,李彦宏演示了启德教育等智能体案例。启德教育利用百度的 AgentBuilder 打造专属智能体,上线第一周,就成功分发了 155 万次,与用户交互了 5.8 万次,线索转化量直线增长、有效线索的转化成本明显降低,经营效率大幅提升。


00:00 / 00:00
    1.0x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    李彦宏称,“每一个商家、每一个客户,都能在百度拥有专属的智能体。整个过程完全不需要编程,通过类似提示词的信息输入,和简单的几步操作调优,就能迅速生成一个智能体。”


    

    另外,百度文心智能体平台,已经打通了“流量变现”的通路。通过接入智能体的相关能力,解决流量分发的难题,目前除了百度搜索,百度生态的其他产品,如小度、地图、贴吧、车机等,都能接入智能体了。


    也就是说,AgentBuilder 不止是开发平台,开发者还可以通过百度生态矩阵分发路径,做到“开发+分发+运营+变现”一体化。未来,百度还将接入商业插件功能,进一步实现商业闭环。

    AppBuilder:AI 原生应用开发


    “AppBuilder 是目前最好用的 AI 原生应用开发工具。”李彦宏说道。


    在 AppBuilder 上,百度提前封装和预置了开发 AI 原生应用所需的各种组件和框架,如知识问答类的 RAG、具备运算能力的代码解释器、生成式数据分析 GBI 等,开发者最快只需要三步就可以用自然语言开发出一个 AI 原生应用,并且能够便捷地发布到各种各样的业务环境中,甚至“无需写一行代码,就能开发出 AI 原生应用”。


    这对应了李彦宏说的:“大模型本身并不创造价值,基于大模型创造出来的应用才真正有价值。”


    

    李彦宏指出,AppBuilder 拥有两大优势:


    • 一是功能强大。依托文心 4.0 对指令的理解和遵循能力,AppBuilder 能保证冷启动就达到一定水平,不会因为效果差再花很长时间去调优;依托检索增强技术(RAG),在知识问答等典型场景,问答准确率和友好回复程度都达到了 95%以上,大幅超越其他同类产品。AppBuilder 还提供丰富完整的组件工具,包括百度搜索等基于百度多年技术积累的 AI 能力组件、大模型能力组件,还有百度独家开放的业务组件等 55 个组件。此外,AppBuilder 还提供一些主流场景的第三方 API,比如航班查询、论文查询等,以及自定义组件,客户可以直接对接自己专有的任何工具和数据。


    • 二是简单易用。使用 AppBuilder,只需三步即可快速创建应用、一键分发。我们也支持开源的 SDK,方便大家进行二次开发。”


    ModelBuilder:定制各种尺寸模型


    ModelBuilder 是一款适合专业开发者使用的工具,可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调 SFT,这样就能达到更好的效果。


    对开发者来说,用好大模型很重要的一件事,就是掌握模型精调的方法。ModelBuilder 提供了包括文心大模型系列在内的 77 款精选大模型和全流程的模型工具链,同时提供丰富的 SDK 及全栈 API 能力,能够完成一站式的模型精调,此外还提供模型精调样板间,开发者只需要跟着样板间一步一步精调,就能做出一模一样的专业模型。


    这样,开发者可以根据需求定制任意尺寸的模型,并根据细分场景对模型进一步精调,这样就能达到更好的效果。


    现场,李彦宏展示了教育行业作文批改的案例,经过数据处理、模型精调后的“作文批改助手”,不仅可以拥有更专业的老师点评思维、做到格式遵循,而且相比未精调模型,精调后的模型打分与真实的老师点评分数更为接近。


    00:00 / 00:00
      1.0x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      他还在现场与小度实时互动,展示小度用多个模型组合的方式来执行不同任务。例如使用小模型 ERNIE Tiny 执行模型路由工作,而性能最好的文心 4.0 则用来执行日程安排等复杂需求。据介绍,相比全部使用文心大模型的旗舰版,小度可以实现响应速度提升 2 倍,成本下降 99%。


      李彦宏表示,“这几个关于 ModelBuilder 的例子,展示的是百度高效低价生产模型的能力”。


      据悉,ModelBuilder 截至目前已经服务了 8.5 万企业客户,累计精调超过 1.4 万个模型,开发超过 19 万个应用。


      “市面上有这么多模型,大的、小的、开源的、闭源的,在特定应用当中怎么样使用这些模型的组合,是有技巧的,这是创业者可以干的事儿,是可以提供价值增益的。”李彦宏说道。


      “我们需要一个全新的操作系统”

      

      “编程不再是少数经过专业训练的程序员的特权,相反,人人都是开发者。”


      “编程不再需要从 c/c++学起,而是从自然语言开始。”


      “编程不再是面向过程、面向对象,而是面向需求,以后,编程的过程,就是一个人表达愿望的过程。”


      百度执行副总裁、百度智能云事业群总裁沈抖在 2024 百度 Create 开发者大会上强调。


      沈抖表示,这是革命性的变化,它会彻底颠覆原有的操作系统。


      在操作系统的内核中,底层的硬件从以 CPU 算力为主变成以 GPU 算力为主,而且第一次增加了硬件和软件以外的资源,也就是被大模型压缩的世界知识。操作系统管理的对象也因此发生了本质的变化,从管理进程、管理微服务,变成了管理智能。


      “传统的云计算系统依然重要,但不再是主角,我们需要一个全新的操作系统。”沈抖认为,这个全新的操作系统需要管理万卡规模的集群,需要极致发挥 GPU、CPU 的性能、高速互联,需要有强大的大模型作为核心引擎,包括语言大模型、视觉大模型等,这些构成了操作系统的内核。

       

      在内核层之上,这个操作系统还需要构建起强大的大模型服务能力,提供全面的模型精调、评估、部署、调用等工具链;还需要有好的应用开发工具去做工作流编排、插件管理;还有必不可少的安全和运维,隐藏掉上一代云原生系统的复杂性。


      基于上述思考,沈抖宣布推出新一代智能计算操作系统——万源。“软件定义世界,万源用自然语言定义软件。”沈抖说道。


      

      据介绍,万源操作系统主要由 Kernel(内核)、Shell(外壳层)、ToolKit(工具层)组成。


      万源的内核层既包含了业界领先的 ERNIE 4.0、3.5 大语言模型、也包括 ERNIE Speed/Lite/Tiny 系列轻量模型,此外还包括文心视觉大模型和第三方大模型。


      

      另外,考虑到芯片供应不确定性带来的多款芯片并存格局,为管理好多个厂商、不同代际的芯片,百度的百舸平台实现了百卡规模、单一训练任务下,不同厂商芯片的混合训练,并且把训练的性能损失控制在 3%,千卡规模的性能损失也不超过 5%。百舸屏蔽掉了芯片之间的差异,给用户自由选择不同芯片组合的权力。


      内核之上是千帆 ModelBuilder,负责内核中模型的管理、调度、二次开发。ModelBuidler 提供的模型路由服务,可以自动给不同难度的任务选择最合适的模型,实现效果与成本的最优组合,在效果基本持平的情况下,平均降低 30%的推理成本。


      工具层方面,千帆 AppBuilder 和 AgentBuilder 则是强大的应用开发平台。


      此外,百度还发布了全球首个 AI 原生操作系统 DuerOS X,该系统基于文心大模型全面焕新,在多模态感知、拟人化呈现上有重要升级,小度的人机交互体验将迎来质的飞跃。


      结束语


      “人人都可以成为开发者,未来必将是一个由开发者一起创造出来的未来。”李彦宏表示。那么未来,百度能否真正实现这个理想,我们拭目以待。


      公众号推荐:

      跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

      2024-04-16 14:077062

      评论 10 条评论

      发布
      用户头像
      如果真这么牛逼直接介入芯片制造了,问问 ai 怎么造出1nm 的光刻机
      3 小时前 · 福建
      回复
      用户头像
      有个问题,ai一天能写十万行代码,谁来审核呢?ai写的程序出了问题,谁背锅,ai背吗?
      2024-04-22 11:06 · 北京
      回复
      用户头像
      和无代码开发这么像。
      2024-04-21 07:39 · 北京
      回复
      用户头像
      百度就是个笑话
      2024-04-20 08:43 · 广东
      回复
      用户头像
      代码采纳率99%能干啥,缺了1%都不能工作
      2024-04-19 14:25 · 广东
      回复
      用户头像
      做的东西不咋滴,吹牛当当响
      2024-04-19 10:03 · 上海
      回复
      用户头像
      李艳红被手下忽悠的够呛,难怪被BAT除名,信誓旦旦一本正经的胡说八道
      2024-04-19 09:19 · 北京
      回复
      李艳红,我要用你的问心生成个千度
      2024-04-19 09:21 · 北京
      回复
      用户头像
      错别字

      相应

      2024-04-17 17:16 · 北京
      回复
      用户头像
      喜马拉雅这个手机晃一晃就跳广告的流氓,有什么脸用先进技术。不是技术的事,懂吗?
      2024-04-16 14:19 · 四川
      回复
      没有更多了

      Flink X Hologres 构建企业级 Streaming Warehouse

      Apache Flink

      大数据 flink 实时计算

      运维训练营第14周作业

      好吃不贵

      新型掩码自编码器 AdaMAE,自适应采样

      Zilliz

      计算机视觉

      数字货币现货合约秒合约交易所系统开发案例

      开发微hkkf5566

      Windows安装ElasticSearch

      代码的路

      elasticsearch

      软件测试 | App结构概述

      测吧(北京)科技有限公司

      测试

      低代码如何快速提升客户体验

      力软低代码开发平台

      JS常见错误和解决方法集锦

      观纵科技

      前端 js 错误处理

      ChatGPT时代的打工人众生相

      脑极体

      ChatGPT

      最佳实践数据服务之设备数据格式ProtoBuf转JSON——实践类

      阿里云AIoT

      阿里云 物联网 IoT

      Java开发技术培训应该怎么学习?

      小谷哥

      深思考联合昇腾推出AI智慧病理“慧眼”计划

      Geek_2d6073

      前端开发技术培训机构怎么选好?

      小谷哥

      轻舟已过万重山:华为之路,平板PC之变

      脑极体

      华为 PC

      前端报表如何实现无预览打印解决方案或静默打印

      葡萄城技术团队

      在前端培训机构怎么系统学习前端知识

      小谷哥

      Blender的布局和工作区

      Finovy Cloud

      Blende

      无需依赖Docker环境制作镜像

      tiandizhiguai

      Docker k8s

      云小课|MRS基础操作之配置DataNode容量均衡

      华为云开发者联盟

      大数据 华为云 企业号 2 月 PK 榜 华为云开发者联盟

      华为云发布分布式编译构建系统CodeArts Build

      华为云开发者联盟

      云计算 华为云 企业号 2 月 PK 榜 华为云开发者联盟

      前端培训班学习哪家比较好

      小谷哥

      2023年中国网约车行业用户体验洞察

      易观分析

      用户体验 网约车

      令人期待的 SysOM 2.0 OS 迁移、超异构计算系统直播又来了 | 第 63-64 期

      OpenAnolis小助手

      操作系统 系统运维 sig 龙蜥大讲堂 SysOM

      比Worktile好用的项目管理软件有哪些?

      PingCode

      项目管理 Worktile 项目管理工具

      大数据培训去哪学靠谱?

      小谷哥

      嵌入式ARM设计编程(二) 字符串拷贝

      timerring

      arm

      研发提效:服务端技术方案模板参考

      邴越

      技术方案 模版

      IoT设备数据的存储、解析和价值挖掘实践——实践类

      阿里云AIoT

      阿里云 物联网 IoT

      如何运维多集群数据库?58 同城 NebulaGraph Database 运维实践

      NebulaGraph

      运维 数据库运维

      【2023年最新】轻松搞定MySQL数据库迁移

      NineData

      MySQL 数据库迁移 数据复制 数据迁移 SqlServer

      开心档之Java 流(Stream)、文件(File)和IOJava.io

      雪奈椰子

      Java 开心档

      “干掉程序员”,百度是认真的!发布三大开发工具和全新操作系统,李彦宏:只要会说话就会干开发_百度_褚杏娟_InfoQ精选文章