AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

AI 正在淘汰“中间层”!昆仑万维方汉:要么冲进前 10%,要么学会“向下兼容”

  • 2025-06-24
    北京
  • 本文字数:14296 字

    阅读完需:约 47 分钟

大小:6.94M时长:40:27
AI正在淘汰“中间层”!昆仑万维方汉:要么冲进前10%,要么学会“向下兼容”

采访 | 霍太稳

编辑 | Tina


过去一年,全球科技巨头都把宝押在了 AI 上。像 Meta、微软、亚马逊、谷歌 这些大公司,今年光是在 AI 基础设施上就打算砸 3,250 亿美元,秉持“先烧钱、后吃肉”的战略,推动大模型技术快速发展。在这一波浪潮中,DeepSeek 等企业在大模型上的创新,更是把各路玩家卷得不行,甚至逼得 OpenAI 都打起了价格战。


面对全球激烈的竞争态势,中国企业不仅没有被拉开差距,反而在多个 AI 领域实现了反超,尤其是一批敢于投入并抢先布局的企业正迅速崛起。以昆仑万维为例,他们始终紧抓行业风口,业务已覆盖全球 100 多个国家和地区。从早期的音乐社交平台 StarMaker,到成功收购全球互联网巨头 Opera,再到现象级 AI 音乐产品 Mureka,昆仑万维的布局广泛且有前瞻性。


到了 2025 年第一季度,昆仑万维的总营收达到了 17.6 亿元,同比猛增了 46%,其中 94% 的收入都来自海外。旗下 AI 音乐业务年化流水约 1,200 万美元,单月流水突破 100 万美元。另外,短剧平台 Dramawave 的 ARR 更是高达 1.2 亿美元。昆仑万维的 AI 业务在海外取得的盈利,不仅证明了中国企业在国际 AI 赛道上的竞争力,也为其他希望“出海”的企业树立了一个榜样。


现在,AI 竞技的焦点正从“谁的模型更强”转向“谁能更好地落地场景、抢占市场”。近期,InfoQ 在 AICon 全球人工智能开发与应用大会上海站上,特别专访了昆仑万维董事长兼 CEO 方汉,他将带来独家解读。


采访嘉宾:

方汉,昆仑万维董事长兼 CEO。毕业于中国科学技术大学近代物理系,曾任职于中国科学院高能物理研究所、拓林思、亚信以及千橡互动,2008 年 3 月协助周亚辉先生创立昆仑万维。


方汉先生拥有 30 年互联网从业经验,从 1994 年开始参与和倡导开源运动,是中文 Linux 奠基人、中文 Linux 四剑客之一,著作国内第一本 Linux 书籍《Linux 实用大全》;也是国内最早的网络安全专家,曾负责三大电信运营商的全网安全审计,负责研发了国内市场占有率最高的网页游戏《三国风云》,为中国互联网最资深的参与者。


“程序员反而是最不容易被淘汰的”


InfoQ:我记得此前有一篇报道中你提到过:“我一开始低估了 AI,以为它只是颠覆内容行业。现在我觉得它将超越互联网和移动互联网。”是什么促使你对 AI 的判断发生了如此大的转变?


方汉:我觉得原因其实很简单。电脑本质上是人脑的延伸,它能帮助人类完成大量重复性工作,这一点我们早就习以为常了。但 AI 的不同之处在于,它已经开始具备协助人类完成非重复性工作的能力。


可以说,电脑带来了“信息化”,而 AI 则正在推动“智能化”。而且是实打实的智能化,它正在显著提升各行各业的效率。


比如,像文生图、文生视频这样的技术,已经让我们这些做内容的人切实感受到效率上的飞跃。而且像谷歌 DeepMind 在科研方面的进展也非常惊人。我大学时学的是核物理,还有不少同学现在在从事科研工作,他们告诉我,一些研究团队已经开始用 AI 来辅助物理研究了。


所以我觉得,AI 就像一个“催化剂”,能够全面提升行业效率,对整个社会的影响也会非常深远,甚至不亚于当年电脑刚刚问世时带来的变革。


InfoQ:所以说,AI 已经不仅仅是一个技术本身了。从您的角度来看,未来会有哪些超越技术周期的重大机会?


方汉:我觉得 AI 就像一个“催化剂”。人类整个科技发展的架构,其实就是从基础科学到应用科学这么一条路径。而 AI 正好在这两个层面都开始发挥作用。在应用科学层面,比如说写代码变轻松了,编程门槛降低了,做视频、做音乐也都更容易了,这些变化已经开始显现出来了。


但更重要的是,在基础科学领域——比如物理、化学、数学,AI 也开始展现出潜力。像著名数学家陶哲轩,他现在就用 AI 来帮助他进行数学证明。也就是说,AI 能够在基础科学和应用科学之间全面发挥催化剂的作用,让整体效率大幅提升。


而且你会发现一个很有意思的现象:AI 在每个行业里都会产生类似的结构性变化。最顶尖的那 10% 的从业者,他们的工作效率会成倍、成 10 倍的上升;而刚入行的 20% 到 30% 的人,在 AI 的帮助下,原本需要两三年才能积累的经验,现在可能两三个月就能掌握,迅速成长起来。相对来说,冲击最大的是中间那一层不上不下的从业者。


所以我认为,AI 会在每个行业中加速优胜劣汰的过程,但从整体上看,它带来的效率提升是指数级的。


InfoQ:我也代表很多 InfoQ 的用户问一个问题。其实我理解,现在很多 InfoQ 的读者正处在你刚才说的“不上不下”的那个阶段——要么冲过去,要么可能就会被淘汰。从你的角度来看,他们有没有什么办法可以比较高效地冲出这个困境?


方汉:我觉得核心还是一句话:拥抱变化。因为我们没有办法去对抗这种变化,那就只能选择拥抱它。

那什么叫“拥抱变化”?就是心态上要更开放一点。其实我认为,真正阻碍那些“不上不下”人的,不是 AI 本身,而是他们对学习的态度。有句话不是说得特别好吗?“活到老,学到老”。要不断从一些高质量的渠道去学习,去了解 AI 的最新进展,去看各种优秀 AI 项目的源代码。学习是手段,它的目的是什么?就是提升你的工作效率。只要你不断提高效率,你就不会被淘汰。


而且现在 AI 还处在一个多数人认知还没跟上的阶段。程序员其实是最早一批能真正理解 AI 的人。就算你不一直做程序员,你也能够把你的认知传达给其他的工种其他行业的人,所以说我觉得程序员反而是最不容易被淘汰的,但前提是你得终身学习。


InfoQ:我们看到,无论是国外的大厂,还是国内的大厂,最近都在大量裁员,很多技术人员被推向了市场。从你的角度看,这背后的逻辑是什么?是因为这些人真的没有进步空间了吗,还是另有原因?


方汉:因为这些企业都是上市公司,而上市公司在财报上最容易呈现效果的方式,就是“减员增效”。他们通常会认为,自己原本就养了很多冗余的人力资源,尤其是一些只从事基础代码编写工作的岗位。而现在有了 AI,这些重复性强、质量要求不高的工作完全可以被替代。与此同时,他们也需要向资本市场交代业绩,所以裁撤这部分人就成了自然的选择。


但我们也要看到,即便没有 AI,在经济周期下行的情况下,这批人本来也很可能是第一批被裁掉的。现在的问题在于——你是否具备“上”和“下”的能力。也就是说,你既要能在行业景气时抓住机会“上”,也要能在行业低谷时适应环境“下”。你不能总觉得自己是大厂出身,就不愿意去小厂,更不能因为离开大厂了就不敢创业。


所以我觉得,关键还是在于你能不能“下得来”。因为任何一个行业都会经历周期波动,有高峰也有低谷。在低谷期,你要有能力找到自己的位置,活下来。而且我认为,这不只是程序员面临的问题。其实程序员已经算是很有优势的一类了。因为这一波 AI 应用在各行各业落地,程序员反而是最有条件、最有可能抓住这个机会的群体。


我用一个比喻来总结:当汽车出现时,确实会导致马车夫失业。但什么样的马车夫不会失业?是第一个学会开汽车的那位马车夫。所以,我们程序员其实就是“旧时代的马车夫”。我们最好的选择,就是尽量转变成“汽车驾驶员”,而不是死守着马车,等着下一家马车行来雇佣我们。相反,我们应该主动去寻找驾驶汽车的机会——这是我的看法。


InfoQ:我觉得这个观点对我们很多的技术人或者程序员来说,是一个非常好的鼓励。


目前的问题不是“AI 市场太大”,而是“它还太早期”


InfoQ:下面这个问题可能更和你作为 CEO 的身份有关。现在很多公司都在强调“单点突破”,但我们看到昆仑万维选择了多点并进,布局了 AI 大模型、AI 搜索、AI 游戏、AI 音乐、AI 视频、AI 社交六个方向。作为董事长兼 CEO,你是如何进行资源分配的?这些方向之间有没有优先级之分?


方汉:我觉得其实很简单,有句话叫“是驴子是马拉出来遛遛”。我们看中的这些方向,是基于我们的判断认为它们更接近应用、离用户更近、离商业化更近,所以我们会优先投入去尝试。当然,不同的方向也和我们过往的经验有关,比如我们做过游戏,所以会切入 AI 游戏;我们也运营过音乐社交平台 StarMaker,所以在 AI 音乐上也有一定积累。这些领域我们都有一定的数据优势,能帮助我们快速切入。


但从整体来看,我们的策略是一开始广泛探索,然后依靠市场反馈来调整节奏。比如我们现在在做的短剧相关产品,用户增长非常快;有些方向增长慢,那我们就会及时调整。早期最重要的就是“快速试错”(fast fail),避免错过风口。



另外,从行业发展看,过去三年,大家都在“卷模型”,可以说是“千模大战”;现在又开始“卷 Agent”。但我认为现在还是要从用户角度出发,让用户真正感知到产品的价值和可用性。所以我们布局的这几个方向,其实都在尝试中,最终还是看用户反馈来决定。


此外,我们的整体脉络也比较清晰,一方面是 AGI,另一方面是 AIGC,我们目前的重点是 AIGC 。AIGC 主要包括音乐、视频、游戏这些内容行业的应用;而像搜索这样的方向,则偏 To B,更像是 API 服务。总之,六大方向我们都会持续探索,但最终资源分配和优先级,一定是由市场反馈来决定的。


InfoQ:是不是你们也会觉得,现在整个 AI 市场的机会太大了,如果只专注于一个方向,可能就会错失其他的可能性?


方汉:我觉得目前的问题不是“AI 市场太大”,而是“它还太早期”。正因为早期,才更难判断哪些方向最终会成功。如果这个市场已经足够成熟,反而更容易判断出哪些赛道是值得投入的,那时候选一个点专注也许更合适。而在当前阶段,没有人能拍着胸脯说,哪个方向一定能跑出来,只能根据经验去做判断。比如我们判断 AI 短剧、AI 视频生成可能是最大的市场之一,但这也还需要靠市场去验证。


这其实也涉及技术成熟度的问题。像视频生成目前还不够成熟,导致现在的 AI 视频产品在商业化上还没有那么快、用户接受度也没那么高。但一旦视频生成的拐点到来,可能瞬间整个市场就爆发,大家都开始用 AI 视频来做内容。


所以我们现在的策略,更多还是快速试错。因为我们是一个中等规模的企业,去年营收是 56 亿,研发投入有 15 亿,投入比例算是很高的。这样的投入也让我们有能力在多个方向上同时探索,进行多点突破。


出海不是 PPT 上画出来的,是一把手蹲在前线打出来的


InfoQ:刚才您也提到了 StarMaker,其实这一仗打得非常漂亮,现在在全球市场的占有率也很高。我昨天刚好还在杭州参加了阿里云的中期出海大会,感觉现在大家都把出海当作一个非常重要的战略方向。而昆仑万维好像有 94% 的收入都来自海外。从您的视角来看,在全球范围内推进大模型商业化,中国企业的主要优势体现在哪些方面?



方汉:首先我想说,中国企业在 AI 领域的技术实力其实已经不容小觑。我现在经常看 AI 相关的论文,十篇里面起码有八篇作者里有中国人的名字。很明确,这一轮的 AI 竞争已经是“中美双强”的格局。无论是技术积累、人才储备,还是大模型的实际表现,中国和美国基本是全球前两名。甚至可以说是“前两断层领先”,没人真正关心谁是第三名,因为差距太大了。


这种局面的形成,和我们国家早期在人才培养、科研投入上的持续建设密切相关。当然,我们也必须看到现实的一面:中国现在整体的风险投资环境偏冷,导致中国 AI 企业拿到的融资规模和数量明显比美国同行少。但我认为,这其实也是一体两面,也倒逼了中国企业必须在商业模式和产品形态上进行更多创新。因为没法“烧钱跑模式”,那就只能一开始就想怎么赚钱。你会看到,美国的公司可能在大模型的科研层面走得更快,但在产品化落地、商业模式探索上,反而是中国企业走得更实、更快。


这其实也是中国传统互联网和移动互联网企业的一贯优势——在这些领域,我觉得中国企业的进步是非常快的,这些领域也是我们中国企业能够大显神通的地方。其实你看中国的移动互联网领域的商业模式创新,美国同行都得学。所以说我觉得在这方面我们还是比较有信心的。


InfoQ:所以说,当年 DeepSeek 出来的时候,很多人还调侃,说这家公司一方面技术不错,另一方面也是因为没别的选择了,只能靠极致优化来降低成本。


方汉:这种情况我们常说“穷人的孩子早当家”。现在我们没法轻易拿到充足的算力资源,那就只能拼命去优化算法。但好在中国最不缺的就是科研人才,尤其是 AI 方向的人才,在数量上中国绝对是全球第一,所以你会发现,我们面临的这些困难,往往最后都能变成推动创新和前进的动力。


InfoQ:想请教一下关于教育的问题。很多年前,大家常常谈论美国教育有多先进,而中国的应试教育似乎存在很多问题。但让人好奇的是,为什么在这样一种应试教育体系下,中国却能培养出如此多的 AI 人才?


方汉:我不是教育学家,没法系统地评价哪个国家的教育质量更好。但作为一名物理出身的理工科背景从业者,我有一个基本判断:很多事情,首先要看“数量”。质量当然也重要,但评判标准比较主观,而数量是客观的、第一性的。比如质量的标准可能是你能否读到博士、硕士,或者本科毕业,这些是阶段性的指标;但从数量来看,最直接的就是每年培养出多少工程技术人才,也就是 STEM 人才,就是工程师。

如果以大学本科毕业生为例,中国每年大约培养出 370 万到 390 万名工程师,是全球第一;第二名是印度,约 320 万;第三名是美国,只有约 80 万。其他国家年产工程师的数量,基本都远低于 80 万。


再看“存量”,中国的工程师总数大约是 6000 万人,而印度是 2000 万人左右。这个庞大的工程师基数,才是中国科技产业爆发的根本原因。也就是说,存量 6000 万工程师,然后每年还以 370 万到 390 万的速度增长,这才是说美国人没法跟中国去竞争世界工厂的原因。正是因为有这样的人才供给,中国才能成为“世界工厂”。说起世界工厂的迁移,我认为全球最后只有两个国家有可能,一个是中国,一个是印度,其他国家都没戏。因为工程师数量不够,这是一个铁律。世界工厂要看两个核心要素:一是电力供应,二是人才供应。在这两个方面,中国都是全球第一。


当然,如果再看科研层面,比如博士这个维度,中国确实还与美国存在差距。我们来看博士存量:目前中国大约有 110 万博士,而美国大概是 340 万,这才是中美在高端科技人才方面的差距所在。不过这个差距正在快速缩小。过去,中国每年大概培养 9 万名博士,美国也是 9 万。但今年,中国的博士招生数已经达到 17 万,意味着未来几年内,我们的高层次科研人才储备也将快速赶上。如果放眼全球,除了美国的 340 万博士以外,其他国家——比如德国、日本等——大多只有 60 万到 80 万。也就是说,从整体科研力量来看,中国已经稳居世界第二。


但在 AI 这个特定领域,情况又有些不同。AI 是我们并不落后的一个关键技术领域。前面我也提到,我经常看 AI 领域的论文,十篇里至少有八篇有中国人署名,华裔博士在 AI 领域可能占据六成以上。甚至可以说,在 AI、CS 等特定方向,中国博士的数量可能已经超过美国。所以我认为,中国在 AI 领域不落后的根本原因,就是我们在这一领域具备强大的人才基础和快速增长的科研力量。


InfoQ:之前有一个段子说,在硅谷创业时,如果团队里有一个华人工程师,投资人可能会犹豫,因为“那谁来干活呢?”这当然是个玩笑。


我们刚刚也聊到“出海”这个话题。昆仑万维作为一家上市公司,目前 94% 的收入来自海外,在出海这条路上可以说走在了前列。因此,很多也在布局出海的企业会非常关心你们的经验。能否请方老师介绍一下,昆仑万维目前在出海方面是否形成了相对成熟的方法论?有哪些经验可以分享?


方汉:谈不上非常成熟的方法论,但我们确实在出海这条路上走得比较早、时间也比较长。总结下来,我认为有几个关键点:


第一,选市场。这个其实本质上不复杂,可以从人均 GDP 来做初步判断。T0 市场无疑是欧美日韩,这些地区人均收入高,付费能力强;T1 市场包括中东、东南亚和南美;T2、T3 市场则是像南亚、非洲等人均收入相对较低的地区。不同类型的企业要根据自身业务的特点选择适合自己的市场。对我们这种做软件和互联网的企业来说,T0 和 T1 市场更适合,T2、T3 做起来会困难很多。


当然,除了看市场本身的潜力,还要看竞争情况。竞争激烈的地方,资源实力不足的企业可能很难打得进去。那就可以从竞争较小的地区切入,从边缘市场起步。选市场,这是第一步。


第二,我认为一定要强调本地化,要做到强烈的本地化。这里说的本地化,不是指产品运营或研发的本地化,而是指需求的收集和本地运营,这一点必须做好。如果不了解当地用户的需求,就没办法做出好产品。比如说,企业的经营者最好能够常驻当地,同时也要在本地组建一支优秀的团队,由本地员工来负责需求收集、市场开拓和客户支持等工作。


我认为本地化非常重要。但现实中,很多中国企业由于处在自己的“舒适区”,存在一些天然障碍:比如英语水平有限,或者不懂当地的小语种,就不愿意走出去,更倾向于留在国内,或者去东南亚这些华人较多、相对熟悉的地方。我觉得要跳出舒适区,尽可能去一些市场潜力大、但中国企业相对较少涉足的地区。在这些地方,竞争往往也会小一些。所以我认为,第二个关键点就是:真正把本地化做好。


第三,我觉得其实和是不是出海没有太大关系,关键还是要做好产品的差异化,也就是差异化竞争。同时,在商业模式上要多做创新,能够快速实现商业化的平衡。我认为,基本上也就是这些要点,差不多都围绕在这几个方面。


InfoQ:您现在一年大概有多长时间在国外?


方汉:以前出国的时间比较多,最近因为 AI 的研发主要在国内,所以待在国内的时间相对多一些。不过在我们开拓某个新市场的时候,确实会在当地呆很久。比如我们当初在非洲开市场时,我在尼日利亚就待了将近三个月,还是挺艰苦的。


InfoQ:那三个月里,你一般都会做些什么?


方汉:主要就是和当地人交流,收集本地信息。很多信息只有到了现场你才会知道,比如我们到了之后才了解到,当地网络普及情况是全国覆盖了 3G,而大城市则普及了 4G。3G 和 4G 的网络差异会影响我们的技术策略,比如我们后来就发现使用容错性更好的 QUIC 协议这些,在当地网络环境下非常有帮助,成功率提升得很明显。


InfoQ:像这种情况,让工程师过去亲身感受不就可以了吗?


方汉:工程师的感受和管理层的感受是不一样的。我觉得华为有句话说得特别好——“让听得见炮声的人呼唤炮火”。如果你不在第一线,就很容易产生认知偏差,只有真正身处前线,才能消除这种偏差。

对企业的一把手来说,还是应该多去前线,最好是能和当地一线工程师直接沟通。因为受限于公司架构,一线工程师往往没办法直接向管理层反馈。但如果你亲自到了现场,大家能坐在一起沟通,很多问题就能直接解决了。所以我觉得,多去当地、深入一线是非常重要的。


当年网站能换奥迪,如今网页 200 块一单,AI 也逃不过这条老路


InfoQ:这也让大家更有信心了。但与此同时,其实 AI 赛道也有很多质疑,比如大家会说模型太贵、用户留存难、场景也难以跑通。你怎么看待这些声音?


方汉:AIGC 商业化落地其实相对比较简单。我认为 AIGC 的用户容忍度是比较高的。比如你生成一张图,可能多长了一根手指或者少了一根手指,或者视频里手的动作有点歪,其实用户都是比较能接受的。但如果是用在严肃任务场景,比如财报分析,那就完全不一样了。如果出错一个小数点,可能就是巨大的运营损失。所以我觉得 AIGC 的应用场景是相对更容易落地的。


另外,在 AIGC 相关领域,比如图像、音乐、音效这些,技术水平已经可以达到人类 95% 左右的能力,替代人类工作已经相对容易。但像视频这类复杂的内容,现在可能只能达到人类百分之五六十的水平,还没有达到可大规模替代的门槛。所以我认为 AIGC 领域的确是更容易先跑出来的方向。


至于你说的 AI 的商业模式,其实我觉得天底下没有什么新鲜事。关键是如何用传统经验,在 AI 领域不断摸索出适合自己的商业模式。C 端这边可能还是要烧钱、跑马圈地;而 B 端虽然见效快、能带来收入,但增长相对慢。


我觉得对于那些经历过移动互联网创业的人来说,AI 的商业模式没有什么本质区别。互联网刚兴起那会儿,做一个网站都能换辆奥迪,成本也挺高的,但互联网不也发展起来了么?我经常开玩笑说,任何技术都有一个“白菜化”的过程——早期都很贵,后来就便宜了,现在写个网页挣 200 块钱都很正常。


所以说,AI 现在确实很贵,但我相信它的价格会迅速下降,这是技术发展的必然路径。


InfoQ:为什么现在很多 AI 生成的视频长度往往只有 5 秒左右,有的最多也就 8 秒?背后的主要原因是什么?


方汉:这其实还是模型本身的局限性,不是因为算力问题。目前主流的视频生成模型在训练阶段,通常是将视频裁剪成 5 到 8 秒的小片段来训练的。所以在生成的时候,也只能生成 5 到 8 秒的视频。超过这个长度后,生成就会变得不可控,导致质量下降,所以才受限在这个范围内。


但这个问题其实并不难解决。比如我们在 SkyReels 这个短剧模型上就做了一些改进,现在已经可以一次性生成长达 40 秒、带剧本的视频了。其实现在已有很多优化方法可以应用,我相信随着视频模型的快速迭代,这个问题很快就能被解决。


InfoQ:那你怎么看待未来的发展?比如说现在短视频基本上是一分半到三分钟不等,您觉得大概什么时候我们能做到:我给一个脚本,模型就能快速生成一个完整的三分钟视频?


方汉:我认为快的话 1 到 2 年内就可以完全实现。如果慢一点,那可能是指电影级别的内容,那可能要 3 到 5 年。像您说的这种 1 到 2 分钟的短视频,我觉得在 1 到 2 年内,AI 就能完全胜任,甚至可以完全替代人工制作。


InfoQ:对于很多做短视频的来说这是一个福音。另一个问题,您提到了 B 端的“降本增效”和 C 端“谁能更高效地供给多巴胺”这两条路径,您认为这两条路都非常可行。那您怎么看,真正可行的突破口大概在哪里?



方汉:C 端肯定是视频,我之前说过,视频是“文盲也能看懂”的,对吧?而短剧是一种新的娱乐形式。所以我认为视频领域最大的突破口就是短剧。


最早落地的一定是广告,因为广告一般就 15 秒左右,而广告素材的需求是无穷无尽的。大多数广告平台都是支持你一口气上传几万个素材,然后平台通过算法不断地测试、爬坡,最终爬出一两个爆款。这正是 AI 生成内容非常适配的场景。


第二个是短剧市场。短剧基本上单部剧也就 5 分钟,都是竖屏的,对产品的精细度要求也不高,非常适合 AI 生成。最难的当然是电影,因为电影对精度的要求最高。所以我觉得这是个“先易后难”的过程,先从容易的领域突破。


B 端其实是内容制作工具这条线。我觉得这块谈不上“突破口”不“突破口”,更多是它的商业模式天花板比较有限。比如说内容制作工具的天花板,大概就是 Adobe 全家桶这种水平。Adobe 一年也就一两百亿的收入规模,所以我觉得这块是一个比较稳健的市场,但它的天花板不会特别高。


InfoQ:我想引申一个话题。现在很多做 SaaS 的公司也在尝试加入 AI,你认为 AI 能够“拯救”整个 SaaS 行业吗?


方汉:我觉得 SaaS 行业的问题不在于“拯救”不“拯救”。美国 SaaS 公司确实是一个好生意,但在中国 SaaS 模式问题就相对多一些。我觉得主要还是和竞争态势有关,跟有没有 AI 加持关系不大。


AI 能提升效率,这是肯定的。但 SaaS 这个模式,更多的是行业的使用习惯。在中国,这种行业习惯本身对 SaaS 的发展就不太有利。我认为中国市场的特殊性是导致 SaaS 行业不景气的根本原因,而不是 AI 有没有加持的问题。


InfoQ:那从用户的销售习惯、使用习惯来看,SaaS 有可能迎来所谓的“春天”吗?


方汉:我觉得挺难的。但 AI 出现之后,反而可能带来一个新的局面。中国人一向倾向于“自己搞一套”,那么未来可能每个企业都用 AI 去定制一套属于自己的 SaaS。


如果企业想拥有一套自己的系统,以前做定制开发很难,现在有了 AI 的加持就变得更容易了,私有化部署反而会因为 AI 的加持而蓬勃发展。我个人是这么看的。而且以前系统集成公司是没什么编程能力的,现在有了 AI,他们也可以做定制开发了,这其实是个很大的变化。


InfoQ:那新一代创业者崛起后,因为他们思想更西化、也更能接受 SaaS 模式,会不会带来一些变化?


方汉:云厂商不也在年年增长嘛,对吧?所以我觉得每个市场都有自己的特点。中国的主体用户也在逐步转变,整个 IT 信息化过程也在持续推进。我个人认为,SaaS 在中国起不来的根本原因,还是企业的信息化程度不够。信息化是基础,只有先实现了信息化,才有可能进一步走向 SaaS 化。所以这个过程其实也在逐步改善中。


从 Linux 到大模型:开源精神与商业价值的三十年演进


InfoQ:接下来几个问题可能和你十几年前做 Linux 的经历比较相关。你作为中文 Linux 的奠基人之一,三十年前就开始推动开源,强调工程师的自治和共享精神。现在,在大模型时代,包括昆仑万维也在推广自己的开源大模型。在这两波浪潮中,你认为开源的核心驱动力和生态格局发生了哪些重要变化?


方汉:三十年前我还是一个很纯粹的工程师,就是埋头干活那种。而现在作为一家上市公司的负责人,我更多是从商人和企业的角度来看待这些事情。但我觉得,三十年前我们推动开源,更多是一种朴素的共享精神。


那时候我们觉得写代码就应该互相共享,最牛的程序员像 Linus Torvalds、Richard Stallman,让我学到了很多东西。可以说,三十年前的开源是基于学习兴趣、出于对技术的热爱产生的朴素共享精神,这在全球范围内其实都是一样的,没有太大区别。


到了三十年后,我们会发现,开源已经和商业结合得更紧密了。以前我们搞开源的,看不上闭源,对商业化也有些抵触。但今天再回头看,我们会发现,其实开源也是一种非常好的商业模式。比如 MongoDB、Spark 这些都是从开源发展起来并最终上市的。


尤其是现在整个云计算产业,几乎完全是建立在开源基础设施上的。从企业的角度来看,开源有两个特别大的好处。


第一个好处是:它能满足大量长尾需求。一个行业里一定存在大量用户需求,但企业不可能面面俱到,你只能满足主流需求。对于那些长尾需求,企业自己甚至都不知道具体是什么、在哪里,因为距离太远。但如果用开源模式,那些拥有一定能力的用户,就可以基于你的开源代码进行二次开发或修改,来满足他们自己的长尾需求。久而久之,社区也就形成了。


这样一来,在满足长尾需求方面,开源产品的迭代速度就会远远快于闭源产品。


我举个例子:基于 Stable Diffusion,ControlNet、Railway 这些二次开发产品就让开源生态在迭代速度上反超了闭源产品,因为它能快速满足多样化、定制化的需求。


而且,满足长尾需求后,还会带来很强的用户粘性。比如现在 GPT-4o 已经推出了新的图像编辑能力,但很多企业内部的文生图链路依然是基于此前的开源服务构建的。这就是因为开源满足了他们特定的需求,让他们绑定在了这个平台上。


所以我认为,开源是满足长尾需求的唯一方式。


第二个好处是:开源可以带来大量销售线索。为什么这么说?因为开源项目虽然好用,但并不是每个用户都有能力在本地部署、买很多推理卡来自己用。那怎么办?他肯定还是要找供应商,而第一选择就是开源项目的发布者,因为他们最懂这个产品。


比如我们的 SkyReels 短剧生成大模型开源之后,就带来了大量订阅用户。很多人试用了模型,觉得不错,但又觉得自己部署太麻烦,就直接订阅了我们官方提供的 API 服务。这个量是暴涨的,而且遍布全球。


对初创企业来说,这种“销售线索”是极其宝贵的。你去一个个跑客户很难,买流量也贵得离谱,现在流量成本已经让很多公司承受不起了。而开源就像一个天然的引流入口,为你带来真实的使用者和潜在客户。


所以现在中国也出现了很多基于开源的成功企业,比如我们投的 PingCAP,中国最好的数据库公司之一,他们就是靠开源获得了大量销售线索。


总结两点:第一,开源是满足长尾需求的唯一办法;第二,开源可以为商业模式带来大量高质量的销售线索。这两点,是企业选择拥抱开源的重要理由。完全可以说,在商言商,开源是值得做的好生意。


InfoQ:PingCAP 是我们 TGO 最早期的会员之一,东旭还是我们 TGO 硅谷分会的会长。刚才我们聊到开源,在 Linux 时代,这种模式是成立的——我们可以看到,它从最初的理想主义驱动,逐步演变成全球关键产业的基础设施。那么你怎么看大模型的开源?它会不会也出现类似的发展路径?


方汉:大模型和当年还是有点区别的。因为大模型的训练目前需要大量的算力和基础设施,成本仍然比较高。不过我认为,随着算法不断优化、Scaling Law(扩展法则)逐渐放缓,训练大模型未来是有可能慢慢变得平民化的。到那时候,真正的大模型开源也会迎来爆发。


打个比方,在 Linux 的早期,它为什么能发展起来?是因为 PC 的普及——一开始所有 Unix 系统都运行在小型机上,普通人是接触不到的。这跟现在的大模型场景其实挺像的。但当 PC 这种廉价硬件出现后,人人都能自己装个 Linux,玩起来了。


我认为大模型也会走向类似的局面——一旦硬件成本降低、算法效率提升,未来可能只需要自己买一台机器,就能自己训练和跑模型。那个时候,大模型的开源生态就会真正大规模涌现出来。


InfoQ:你刚才也提到,大模型开源正在迅速平民化。但这里有一个很关键的问题,我们也观察到,很多开源社区越来越受到大公司和算力结构的主导。有人因此认为,这其实是一种“类开源”甚至“伪开源”的趋势。你怎么看待这种对 AI 开源生态的质疑?


方汉:我觉得这种质疑是很正常的。因为现在大多数所谓的开源,并不开放数据,也不开放训练方法,更多是从论文层面发布,最终开源的主要是模型权重,但即使是这样,对于真正想基于这些成果去做商业化的人来说,有了权重,其实就已经足够用了。我们行业内都明白这一点。


所以我认为这种开源现状,对从事 AI 创业的人并没有什么本质影响。至于从学术角度来说,你是不是一定需要拿到代码和数据,才能真正学会和复现,那是另一个问题。现在的确是,想通过别人的训练代码和数据来深入学习训练方法变得更困难了,这是客观现实。


但我们也在推动一些改变。比如我们公司就开源了 Skypile,这是目前最好的中文开源数据集之一。开源数据集的增长速度其实是最快的。另外,现在每年也有大量论文发布,很多论文背后也附带了开源代码。总体来看,我觉得这个局面是在逐步改善,生态也在朝着更好的方向演进。


InfoQ:昆仑万维是如何在基础主权和生态之间保持平衡,同时保持技术核心竞争力,并营造开源生态的?


方汉:其实比较简单,不用刻意去想闭源能保持多久的优势。更多时候,应用创新、产品模式创新和商业模式创新才是关键。这些创新其实和开源、编程关系不大。我们拥抱开源,但真正的核心竞争力还是在产品创新和商业模式创新上。


我们的护城河,除了技术之外,主要还是市场份额。用户的使用习惯才是最重要的护城河。最终用户其实不太关心你背后用的是什么技术,他们关心的是自己的用户体验是不是最好。


InfoQ:现在开源已经成为趋势,大家都在走开源路线。您在开源领域也待了很多年,您觉得未来开源模式还需要改进哪些方面?或者目前有哪些做得还不够好的地方?


方汉:我觉得目前的问题是,现在做 AI 算法的人太多了,但真正把开源产品推向市场的领导者却比较少。为什么强调“产品上市”?因为用户和开发者的需求,往往和做算法、做模型的人是南辕北辙的。怎么打通这中间的关系非常关键。


举个例子,Stable Diffusion 生态里,ControlNet、Railway 这些开源项目之所以受欢迎,是因为它们抓住了用户的痛点,比如可控性、分层、光线追踪等。这些精准解决了商业用户的需求,所以用户才大量采用它们的开源方案。


所以我觉得,单纯做算法研究,如果没有产品意识,做出来的东西往往是“叫好不叫座”。一个算法既叫好又叫座才是最重要的,而要做到“叫座”,一定要有产品思维。没有产品思维,是做不出受欢迎的产品的。


我建议,现在做开源的同学,还是要从用户需求出发去做东西。早期的开源作者,比如 Linux,就是因为看到了用户需求——PC 上没有好用的操作系统,才去做的。而有些开源项目,如果固步自封,不重视用户需求,结果就不好。


比如最著名的 X Server,用户体验差、性能慢、功能支持不足,最终被 Wayland 取代,这也是顺理成章的。


你会发现很多开源项目能持续活跃,是因为它们最能满足用户需求,且对需求响应迅速。比如 FFmpeg、QEMU 这些项目,至今依然活跃,正是因为作者快速响应用户的需求。


“AI 这波浪潮里我也很痛苦,但不学就会被时代甩下”


InfoQ:我能从方老师身上看到,一个典型的技术人、程序员,如今成长为一家上市公司的负责人、董事长兼 CEO。你觉得在这几十年的历程中,有哪些让您感触特别深的地方?对现在很多技术人员来说,上升通道应该怎么走?您有什么建议可以分享?


方汉:首先我觉得,对于我们所有技术人员来说,很多人选择技术这条路,就是因为技术工作相对纯粹,不用跟人打太多交道。但如果你一直这样,其实很难走得更高。说实话,要往上走,不是“对付人”的问题,而是你需要提升自己对产品的理解,对商业的思考。你作为一个程序员,如果不去思考你做出来的东西到底是谁在用,那你就很难做出真正好的产品。


所以我认为,所有做技术研发的人,一定要训练好自己的产品思维和商业思维。这个才是能让你走得更高、看问题角度更全面的重要原因。


我觉得想走上去的人,不一定要擅长和人打交道,但你一定要愿意接触用户,要愿意思考客户需求,要理解商业模式。你可以不跟人打交道,但你必须和“用户”打交道,必须多思考商业模式和产品模式,这样你才能走得更远。


第二点,我觉得就更直接了。在这一波 AI 浪潮里,我个人感觉非常痛苦。为什么?因为全是全新的知识,我以前也没学过,那怎么办?说实话,唯一的办法就是每天读论文、每天和别人交流,从中获取新的知识。


我的感受是,如果我这一波不这么拼命去学,我肯定就被淘汰了。对吧?所以第二个建议就是:要终身学习、拥抱变化。否则你真的会被落下,变成那个“马车夫”。


你想,我就像一个马车夫,看到汽车来了,我赶紧去学怎么开车——现在总算会开车了,对吧?那我觉得自己被淘汰的风险就小一些。


所以总结一下,我认为两个最关键的点:第一是要熟悉产品和商业模式,第二是要拥抱变化、终身学习。这两点对所有程序员来说,都是需要长期坚持的习惯。


InfoQ:最后一个问题,很多人说 AI 是这一代技术人的终极一战。首先,你认不认同这种说法?另外,站在今天这波技术浪潮的前沿,您最想对年轻一代的技术人说些什么?


方汉:第一个,我觉得“终极一战”这个概念,某种程度上是自己吓自己。技术总是在不断演进的。爱因斯坦之后量子力学发展出来了,但这是不是物理的终点?显然不是,之后还会有新的理论、新的逻辑。人类的认知是一直在进化的,一旦停止进化,也就意味着这个文明的终结。所以我不认同“终极一战”的说法,我觉得不存在这种事。


大家不用焦虑。说到底,这件事取决于你能活多久。你活得越久,就越可能看到下一轮技术的变化。我认为 AI 的这波浪潮,的确是一个将持续二三十年,甚至三四十年的长期趋势。但如果你活得够久,也许还能看到下一波浪潮的到来。


至于年轻人,我觉得这代年轻人有一个显著特点:他们从小接触的信息比我们那个年代多太多了。他们不是在电脑上长大的,而是在移动互联网、甚至是 AI 时代长大的。他们获取信息的速度、质量、广度,远超我们这一代。


但他们也面临一些问题,这些问题不完全是他们自身造成的。我觉得现在最大的问题是信息高度碎片化、媒体化。很多人已经没有耐心去看长篇大论的内容了。我们观察到,短剧兴起的一个很重要原因,就是短视频把大家的注意力从两个小时压缩成了几分钟。这种碎片化,会对年轻人在学习上的专注力造成影响。

我们常说,小孩如果不能集中注意力,就无法好好学习。那放在成年人身上也是一样的道理。所以我觉得,对于年轻人来说,在这个碎片化、信息爆炸的时代,如何找到适合自己的、甚至是高效的学习方法,是每一个人都需要去钻研的事情。


因为一个人最终能到达的高度,关键就在于你的学习速度。而今天的碎片化内容,反而在某种程度上拖慢了我们的学习效率。这是一个值得每个人深思的问题。

2025-06-24 19:115328

评论 1 条评论

发布
用户头像
拥抱变化,具备产品思维
2025-06-25 15:14 · 四川
回复
没有更多了

属实不赖!Alibaba开源GitHub星标114K微服务架构全彩进阶手册

冉然学Java

Java 阿里巴巴 开源 微服务 微服务架构

连流量染色都没有,你说要搞微服务?

得物技术

架构 微服务 云原生

一文搞懂│mysql 中的备份恢复、分区分表、主从复制、读写分离

MySQL 高并发 经验分享 签约计划第三季 8月月更

Groovy语境下的Map

FunTester

StarRocks 技术内幕 | 基于全局字典的极速字符串查询

StarRocks

数据库

前端监控系列2 |聊聊 JS 错误监控那些事儿

字节跳动终端技术

APM 前端监控 火山引擎 JS错误

创新能力加速产业发展,SphereEx 荣获“中关村银行杯”『大数据与云计算』领域 TOP1

SphereEx

数据库 开源 架构 SphereEx Apache ShardingSphere

多原则等于无原则,微服务识别方法究竟该怎么选?

老坛架构

架构 微服务

用Rust编写的Linux内核GPU驱动程序,或将到来

非凸科技

Linux gpu rust 编程语言

寻找OpenHarmony「锦鲤」|万元豪礼+技术干货全是你的!

OpenHarmony开发者

OpenHarmony

基于RocksDB实现高可靠、低时延的MQTT数据持久化

EMQ映云科技

物联网 mqtt RocksDB emqx 8月月更

Vue3知识点梳理(一)

青柚1943

Vue3

DBPack 数据库限流熔断功能发布说明

峨嵋闲散人

分布式事务 云原生 分库分表 dbmesh Database Mesh

以合规交易释放数据“红利”,合合信息旗下启信宝签约福建大数据交易所首批数商

合合技术团队

数据 峰会

开源 | WLock:高可用分布式锁设计实践

开源 分布式 分布式锁

微服务性能分析|Pyroscope 在 Rainbond 上的实践分享

北京好雨科技有限公司

Kubernetes 微服务 云原生

一文详解特权访问管理(PAM)

SEAL安全

安全 访问权限 访问管理 特权访问

《数字经济全景白皮书》银行业数字普惠金融发展与优化策略分析 发布

易观分析

金融 数字经济全景白皮书 易观分析

最常见的 10种网络安全攻击类型

郑州埃文科技

网络安全 IP地址 网络攻击

35岁程序员危机,有何破解之法?

博文视点Broadview

DAPP和APP有哪些区别?多链跨链NFT铸造挖矿dapp系统开发技术原理分析

开发微hkkf5566

增强分析在百度统计的实践

百度Geek说

数据库

推荐一款微软出品的开发神器,体验不输IDEA!(含参考资料和项目源码)

收到请回复

面试 springboot 应届生 金九银十 java项目实战分享

测试开发【Mock 平台】09 开发:项目管理(五)搜索、删除和Table优化

MegaQi

测试平台开发教程 8月月更

SpringBoot 日志的各种使用姿势,你真的用对了吗?

程序知音

Java spring 程序员 springboot 后端技术

为什么电商云产品需要 Assisted Service Module (ASM) 模块的支持

汪子熙

typescript 电商 SAP 8月月更 Storefront

阿里大佬 推荐的 “ Spring Cloud Alibaba项目文档 ” 正式发布

冉然学Java

Java 微服务 Spring Cloud Alibaba

为什么不做APP而要做小程序

源字节1号

小程序开发

人手一套的K8S命令集合,它来了!

wljslmz

云计算 Kubernetes 容器 8月月更

Linux下玩转nginx系列(八)---如何使用upsync模块实现动态负载均衡

anyRTC开发者

nginx Linux 负载均衡 音视频 服务器

AI正在淘汰“中间层”!昆仑万维方汉:要么冲进前10%,要么学会“向下兼容”_生成式 AI_Tina_InfoQ精选文章