2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

钉钉卡位战:SaaS 挣不到的钱,Agent 会挣到

  • 2024-04-10
    北京
  • 本文字数:4628 字

    阅读完需:约 15 分钟

大小:2.27M时长:13:13
钉钉卡位战:SaaS 挣不到的钱,Agent 会挣到

出品|InfoQ 《大模型领航者》

访谈主持|霍太稳,极客邦科技创始人兼 CEO

访谈嘉宾|叶军(不穷),钉钉总裁

作者|褚杏娟

 

2020 年,刚带队做出全国第一张健康码的不穷加入了钉钉。不穷是阿里的第一位校招计算机博士,从 PC 时代开始触网,完整经历了移动互联网时代。而他如今面临的,是一场关于大模型的竞备赛。

 

想必已经无需用过多笔墨赘述。2022 年底至今,ChatGPT 的出圈程度还没有谁能超越,其背后的技术方向也早已经被竞相追捧。就像不穷说的“大家都充满了 FOMO 情绪。”

 

那么身处其中的钉钉,能够在这次浪潮扮演什么样的角色?

 

和很多企业一样,钉钉最初也没有一下就找到合适的入局方式。一年多前,看到自己与微软不约而同地都选择了给当前产品增加 AI 能力时,钉钉团队觉得这种方式已经很让人眼前一亮了,大模型爆发的能量远比想象得还要大。

 

整个 2023 年,OpenAI、微软、谷歌等大模型发布频繁,李开复、王小川等也亲自下场发布大模型……去年 4 月,钉钉全面投入智能化,开始用大模型逐个将高频产品重做。到了当年六、七月份,钉钉内部有人提出:能否有一个直接 AI 原生的产品?这引发了内部关于从“+AI”到“AI+”的争论。这个想法与去年 10 月李彦宏公开提到的 AI 原生理论异曲同工,可见国内的探索思路其实差异并不大。

 

那什么是 AI 原生?钉钉也在思索。其实在将思维转换成以 AI 为中心后,这个问题就不难回答。

 

“AI 原生产品从一开始的思考就是全新的,就是要用纯 AI 的思路来解决一个任务。它从数据感知、任务分解,再到思维链,最后到行动执行,是一种全新的思考架构。”不穷表示。

 

而对于做 AI 原生的方式,钉钉选了 Agent。

 

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    “我们依赖这些大模型公司”

     

    今年 1 月,OpenAI 正式推出了 GPT Store。几乎同时,钉钉发布了 AI 助理,并宣布 4 月推出 AI 助理市场。

     

    “GPT Store 上线的第一天我就用了,当天就已经有非常多的产品了,速度非常快。但我分析了所有数据后发现,GPTs 同质化非常严重,而且都是一些通过简单限定词、指令或角色扮演来形成的 AI 助手。”不穷说道。

     

    这一体验让不穷认定,钉钉未来的 AI 助理市场不做全量推荐,只会推荐自己精选过的 AI 助理。

     

    不穷强调,钉钉模式与 GPT Store 的不同:GPT Store 通过不断丰富插件使 AI Agent 能够批量调用外部系统的能力,但它的组合效率要比钉钉低,因为钉钉拥有天然的 To B 环境,其中有大量的工作任务需要解决。

     

    不穷认为,目前钉钉的能力不在于做自己的大模型,而是在应用和数据,在工程性、用户体验以及 To B 理解方面。对于 Agent 来说,大模型只是其中的一个能力,此外还需要非常好的场景和高质量的业务环境数据,这两者恰恰是钉钉有、而 OpenAI 目前还欠缺的。

     

    对于与国内大模型公司的关系,用不穷的话说是:“我们依赖这些大模型公司,它们是我们的发动机和心脏。没有它们,我们无法运行。”

     

    面向 AI,不穷把钉钉定义为 AI 应用创作平台,企业在这个平台上连接、开发和加工各种应用。钉钉的核心任务就是连接场景和数据,实现结构性自动化和批量处理各种工作,并通过 Agent 让创作变得更简单。

     

    具体来说,钉钉的职责是确保外部记忆存储部分的完善,包括短期和长期记忆的处理,同时做好任务规划,之后将大模型生成的内容与本地业务数据集成,并将形成的行动在各个系统中落地。

     

    在不穷看来,当前国内各个基础模型之间的差距并不大,未来不是每个开发者都会关心基础模型的选择,他们更注重解决业务场景中的问题。因此,如果基础模型效果不理想,开发者应该可以随时更换。

     

    因此,为快速上线和体验,钉钉选择了通义千问作为默认大模型,除此之外用户有需求时还接入了其他大模型公司的模型,如智谱 AI、月之暗面、Minimax 等。用户的业务逻辑可以建立在自己选择的基础模型体系上,业务流程和数据流也不会进入钉钉平台。

     

    “根据不同的场景和需求,我们可能还会推荐小模型或专用模型。”不穷说道。

     

    不穷在给用户提供模型的选择建议时,会提醒他们更加关注模型的性能,如每秒处理的 token 量;大模型的安全性问题等,如本地部署还是云上部署;工程解决方案的多重性和便捷性等。这些问题也是钉钉构建 AI 助理时实际遇到的。

     

    “C 端还没有太多优秀的产品形态出现”

     

    无疑,GPT Store 的模式吸引了大批用户:刚正式发布时,OpenAI 就宣称已经有超过 300 万个 GPTs。

     

    与传统软件相比,AI 助理、GPTs 等的不同之处在于拥有非常快的更新速度,模型、交互方式、数据和产品形态等方方面面都变得迅速,开发者也不要从头到尾进行开发和维护。这种模式还大大降低了开发门槛,没有研发背景的人也可以尝试,而对于研发人员来说则大大缩短了研发、测试等成本。

     

    一方面,这意味着传统软件的研发模式可能会面临变革;但另一方面,不穷也指出,百万千万级的 GPTs 目前看相对来说形式比较单一,没有传统软件那样强大的业务理解能力,因此目前 GPT Store 中的应用很难成为高价值产品。

     

    不穷认为,尽管 GPTs 的创建能力很强,甚至一天可以创建几十个,但它目前还代替不了传统软件市场。

     

    钉钉也在寻找有价值的产品。在 1 月份宣布启动的 AI 助理创造大赛上,目前有超过 2000 支队伍提交作品,不穷也会亲自体验这些 AI 助理,寻找优秀的作品。 

     

    那么,个人玩家又如何在 GPT Store 这种模式中赚到钱呢?

     

    不穷的答案是价值,“只要有价值就一定能挣到钱,只是迟早的问题。”在他看来,个人或企业创建 AI 助理的核心在于要解决具体的问题,解决问题本身就有价值。但现在“卖工具”的人可能不是最终解决问题的人,解决问题的人是那个场景中离问题最近的人。

     

    AI 助理的商业模式则与传统软件相似,需要一定的用户使用量,“只要使用量上去了,很快就会有开发者赚到第一桶金。”根据不穷的经验,一旦调用量达到百万次,软件做商业化就是必然的。

     

    这与之前钉钉在与 IDC 联合发布的《2024 AIGC 应用层十大趋势》中提到的观点“新一轮的 AIGC 之争,也将会是一场流量入口之争”是契合的。钉钉在其中也提到了有望成为超级 App 的想法。

     

    “在目前的 To C 场景中,我还没有看到太多优秀的产品形态出现。”不穷说道,“但是,AI Agent 绝对不是自我陶醉,我相信一定会有出色的产品出来,应该给创新者更多的时间。”

     

    根据不穷之前的访谈,AI Agent 和智能助理产品发展到一定程度后,中间态、碎片化的产品成为极简流量入口,就会出现“No App”理念重塑应用的情况:通过对话即可直接调取、使用各种工具,更多非软件专业人员也能获得强大的系统服务。

    “SaaS 挣不到的钱,会通过 Agent 挣到”

     

    相较 C 端,B 端是不穷更看好的方向,因为 To B 场景更容易产生有效的产品:确定的数据和场景可以帮助解决大模型的幻觉问题,同时通过批量和自动化的方式提高 To B 常见工作流和任务流的效率问题。

     

    不穷指出,To B 软件的目的是解决问题,所以这里天然聚集了大量的问题和数据。在这样环境里构建的 AI Agent,传统 SaaS 和 PC 软件软件的开发流程、产品交互、形态及维护等的缺陷都将得到弥补。未来,SaaS 的定制化或各种行业需求,都可以用简单、低成本的方式实现。

     

    “Agent 市场形态肯定会取代传统软件市场形态。更重要的是,它将取代传统 SaaS 产品的产品形态。”不穷说道。

     

    现在 AI 助理的 to B 服务中,钉钉要与用户频繁、深入地互动,根据反馈不断调整和改进。比如在解决一家芯片企业客服培训难题时,钉钉团队要去公司了解实际工作流程,然后将线下流程转化为线上的 AI 助理。

     

    虽然每个企业的需求相同,但产品会逐渐沉淀下来。企业自行完成标注、训练和本地化数据接入,钉钉则保留抽象层和公共层,逐渐完成产品的广泛行业适用性。

     

    不穷评价 OpenAI 做产品就像是科学家通过成千上万次的实验,最终找到一个正确的方向,逼近科学真理。而钉钉则投入大量时间与客户共创,解决他们的实际问题。两者虽然方向不一,但殊途同归。

     

    与大模型创业公司苦苦寻找自己的商业模式相比,钉钉探索出来的大模型商业模式已有三种。

     

    第一种是基于调用量的模式。无论个人 AI 助理还是企业助理,产品使用频率越高、解决问题的能力越强,吸引的用户就越多,自然也就需要更多的调用。使用量大,消耗的算力和资源也就越多。

     

    第二种是应用层本身带来的商业模式。传统的 SaaS 模式赚钱较为困难,因为它需要大量的定制和本地化需求,AI Agent 的应用能力提供了一个解决方案:

     

    简洁的界面、任何需求都可以通过对话来理解,并通过行动系统对接外部系统逻辑,这样就将界面定制化和流程重构的职责就交给了后端模型和 AI Agent 系统。这样,从交互层到模型层,再到持久层,整个过程都得到了简化。因此,SaaS 的维护成本也就降低了。

     

    “AI 助理的盈利天花板目前还看不到,随着更多优秀产品的出现,我们可能还会发现新的盈利途径,带来新的惊喜。”不穷说道。

     

    不穷认为,通过消耗算力来提供服务只是最基本的模式,除此之外,服务消耗还有很多其他的可能性。他的判断是,未来十几年中国 SaaS 行业挣不到的钱可能会通过 AI Agent 来实现。

     

    结束语

     

    在提到当前钉钉 AI 助理接下来要重点攻关的方向时,不穷还是说到了数据和场景:

     

    数据和场景是 Agent 普遍存在的问题,钉钉的 AI 助理现在有更专注的场景和数据,就像是给“孙悟空戴上了紧箍咒”,好处是能够减少幻觉、能够解决一些通用场景里难以解决的问题。这也意味着,钉钉未来还需要发掘和洞察到更多的场景、沉淀和积累更多的高质量数据。

     

    其次,行动能力是目前 Agent 所欠缺的,只是让它们聊天未免太乏味。因此 AI 助理会接入钉钉上原有的应用、低代码等开放能力,不穷希望以此让 AI 助理能够不断出现各种创新玩法,而不仅仅是简单的信息查询和单向交互。比如,AI 助理对接了很多的主流 App 行动系统,比如可以查看淘宝订单等,App 的行动系统实际上就变成了一个 AI 助理,无需在不同系统间切换。

     

    在不穷看来,Agent 的最大好处就是它的无限可能性,这种模式不受传统思维和现有框架的限制,是真的可以让想象力转化为生产力的。

     

    “我今年非常期待行动系统能够变得更加强大、数据质量得到提升。随着越来越多的人洞察到新的场景,AI 助理将不再是一个个废话大师、一个个应对亲戚的聊天工具、一个个面试官。”不穷说道。

     

    访谈里,不穷不掩对微软战略眼光的称赞。“战略需要耐心,如果没有耐心,那就只是投机。”同样地,钉钉对 AI 助理的耐心有多久?AI 助理未来的价值能有多大?这些也是不穷现在要面对的课题。

     

    栏目介绍

     

    《大模型领航者》是 InfoQ 推出的一档聚焦大模型领域的访谈栏目,通过深度对话大模型典范企业的创始人、技术负责人等,为大家呈现最新、最前沿的行业动态和思考,以便更好地参与到大模型研发和落地之中。我们也希望通过传播大模型领域先进的实践和思想理念,帮助潜在大模型应用者、创业者、开发者等做好各类决策和选型。

     

    如果您有意向报名参与栏目或想了解更多信息,可以联系:T_demo(微信,请注明来意) 

    活动推荐

     

    除了叶军(不穷)的思考,钉钉 CTO 程操红(巴布)也将在明天(4 月 11 日)开幕的QCon 全球软件开发大会暨智能软件开发大会上分享《钉钉智能化之路:打造未来交互新形态,重塑组织效能》的主题演讲,分享大型平台智能化实践,探究 AI 产品到平台如何实现跨越。

      

    本次会议还邀请了微软(中国)公司首席技术官韦青,深圳开鸿数字产业发展有限公司高级副总裁、研发体系总裁王皓博士,Coupang 副总裁郭东白等专家带来精彩主题演讲。在圆桌论坛环节,ProtonBase 研究员蒋晓伟、 AutoMQ 联合创始人 & 首席战略官章文嵩、 阿里云数据库产品事业部负责人李飞飞、蚂蚁集团 AI 安全商业化总经理张凯将带来关于「大模型时代的数据智能新趋势 」主题的前瞻视角。

    2024-04-10 15:058355

    评论

    发布
    暂无评论
    发现更多内容

    艾卡货车救援系统(源码+文档+部署+讲解)

    深圳亥时科技

    LED和LCD的15个不同之处

    Dylan

    LCD1602液晶显示屏 LED LED display LED显示屏 lcd

    构建AI Agent必学的4种设计模式,一文了解

    Baihai IDP

    程序员 AI LLMs AI Agents AI 助手

    阿里拿38K出来的大佬良心分享,熬夜整理10 万字详细Java面试笔记!

    Summer

    Java 程序员 面试 架构师 大厂

    2024年12月文章一览

    codists

    文章一览

    HarmonyOS next之APP 服务卡片获取 APP 内数据

    flfljh

    亚信科技研发智能化实践之路

    阿里云云效

    阿里云 云原生 通义灵码

    VMware ESXi 8.0U3c macOS Unlocker & OEM BIOS 集成驱动版,新增 12 款 I219 网卡驱动

    sysin

    esxi

    京东供应链创新与实践:应用数据驱动的库存选品和调拨算法提升履约效率

    京东科技开发者

    Elasticsearch VS Easysearch 性能测试

    极限实验室

    elasticsearch ES easysearch

    社区信息化管理系统(源码+文档+部署+讲解)

    深圳亥时科技

    行业分享丨延锋国际基于数据分析和AI平台的仿真工具探索

    Altair RapidMiner

    人工智能 数据挖掘 数据分析 AI在仿真应用 ai与cae

    VMware ESXi 8.0U3c macOS Unlocker & OEM BIOS xFusion (超聚变) 定制版

    sysin

    Altair助力著名工业电子控制系统供应商Psicontrol提升PCB开发流程效率

    Altair RapidMiner

    EMC 电子设计 电磁仿真 PCB开发 FEKO

    AI技术在英语学习领域的应用

    北京木奇移动技术有限公司

    AI教育 软件外包公司 AI英语学习

    业务监控—一站式搭建jmeter+telegraf+influxdb+Grafana看板

    京东科技开发者

    2024年Apache DolphinScheduler社区高光时刻总结!

    白鲸开源

    Apache DolphinScheduler 2024年终总结

    亚信科技研发智能化实践之路

    阿里巴巴云原生

    阿里云 云原生

    DVWA靶场文件上传漏洞全级别通关及源码深度解析

    代码忍者

    HarmonyOS next之flutter鸿蒙项目初体验

    flfljh

    《计算机组成及汇编语言原理》阅读笔记:p177-p177

    codists

    计算机组成及汇编语言原理

    面向教育场景的大模型 RAG 检索增强解决方案

    阿里云大数据AI技术

    人工智能 大模型 LLM rag PAI

    天润融通工单系统:一键催单功能提升客户满意度

    天润融通

    HarmonyOS next之Flutter插件支持鸿蒙系

    flfljh

    每年一问:Java日期格式化中周所在年引发的bug

    白鲸开源

    开源 Apache DolphinScheduler 日期 大数据调度

    GDP一直在增长,为什么钱却这么难挣

    博文视点Broadview

    CST软件如何计算天线fidelity保真度?达索代理思茂信息

    思茂信息

    cst cst操作 CST软件

    由 Mybatis 源码畅谈软件设计(九):“能用就行” 其实远远不够

    京东科技开发者

    Java面试突击手册,一周刷完这300道面试题,你也可以当架构师!

    Summer

    Java 程序员 面试 架构师 大厂

    LeetCode题解:2625. 扁平化嵌套数组,递归

    Lee Chen

    智慧人大综合管理平台(源码+文档+部署+讲解)

    深圳亥时科技

    钉钉卡位战:SaaS 挣不到的钱,Agent 会挣到_AI&大模型_褚杏娟_InfoQ精选文章