写点什么

谷歌 TurboQuant 惊天反转,被锤学术不端?曝腾讯挖走字节 Seed 多名核心骨干,向姚顺雨汇报;多家公司用 KPI 逼员工内卷 Token|AI 周报

  • 2026-03-30
    北京
  • 本文字数:11465 字

    阅读完需:约 38 分钟

传月之暗面考虑赴港上市,估值 3 个月涨 4 倍飙至 1200 亿;消息称腾讯挖来多位字节 Seed 骨干,向姚顺雨汇报;谷歌 TurboQuant 大反转:核心技术早有先例,学术不端实锤?;与 OpenAI 赛跑,Anthropic 被曝最快 10 月 IPO 上市;马斯克旗下 AI 公司初创“11 罗汉”全部离职,SpaceX IPO 散户和粉丝先上桌;苹果 App Store 被海量“垃圾 AI 应用”冲击,导致审核周期延长;美团客服回应安卓用户图片被删;OpenAI 关停 Sora,精简产品线为 IPO 铺路……

行业热点

 

传月之暗面考虑赴港上市,估值 3 个月涨 4 倍飙至 1200 亿

 

3 月 26 日消息,据报道,AI 大模型公司月之暗面正考虑在香港 IPO 的早期阶段,已与中金公司、高盛展开接触。不过,目前的讨论仍在进行中,最终会否落实上市,以及具体的时间表及集资规模仍属未知。月之暗面及高盛代表拒绝置评,中金则未有回应。而在前几天,外媒还爆料月之暗面正在洽谈筹集高达 10 亿美元(约合人民币 69 亿元)的资金,这或许会使其估值被推高至 180 亿美元(约合人民币 1243 亿元)。在 2025 年末,月之暗面估值为 43 亿美元,短短三个月暴涨 4 倍。

 

月之暗面要 IPO 的消息引发了业内人士的诸多关注,主要因其与创始人杨植麟此前的表态形成反差。据报道,去年底,杨植麟曾在内部信中明确表示“短期不着急上市”,认为公司现金储备也超过 100 亿元人民币,比不少上市公司还有钱。当时,杨植麟在内部信中总结:“2025 年可以说只做了一件事,All in 模型能力和 Agent。”如今,同行的上市表现或是催化剂,今年 1 月,智谱与 MiniMax 先后登陆港交所。智谱和 MiniMax 目前市值分别约 3070 亿港元和 3127 亿港元,市场对 AI 公司的估值逻辑或发生变化。

 

外交部回应中国禁止 AI 公司 Manus 两名高管离境

 

3 月 26 日,外交部发言人林剑主持例行记者会。针对法新社记者提出的“中国已禁止人工智能公司 Manus 两名高管离境”的报道,林剑回应称,不了解相关情况,建议向中方主管部门询问。

 

这一回应源于英国《金融时报》当日的报道。报道引述知情人士称,Manus 联合创始人、首席执行官肖弘与首席科学家季逸超本月被中国国家发展和改革委员会召至北京开会,讨论该公司以 20 亿美元出售给美国科技巨头 Meta 的交易情况。

 

会后,两人被告知因监管审查不得离开中国,但仍可在境内自由活动。Manus 方面正积极寻求律所和咨询机构协助处理此事。

 

Manus 是一家通用型人工智能代理公司,成立于 2022 年,最初在中国境内注册,其核心技术研发均完成于国内。2025 年,该公司将总部及核心团队迁至新加坡。同年 12 月,Meta 宣布收购 Manus,交易金额约 20 亿美元。收购完成后,Manus 创始人肖弘计划出任 Meta 副总裁,负责通用人工智能代理方向的全球业务。

 

今年 1 月,中国商务部新闻发言人何亚东曾公开表示,商务部将会同相关部门对 Meta 收购 Manus 一事开展评估调查,重点审查该交易是否符合出口管制、技术进出口及对外投资等相关法律法规。当时,Manus 已停止对中国境内用户服务,其官网对中国地区访问显示不可用。

 

媒体报道指出,此次监管审查的核心关切在于 Manus 的核心技术研发完成于中国境内,而交易可能涉及敏感人工智能技术向境外转移,触及《禁止出口限制出口技术目录》的相关规定。目前尚未有正式调查启动,也未提出任何指控。

 

消息称腾讯挖来多位字节 Seed 骨干,向姚顺雨汇报

 

腾讯近期密集挖来多位原字节跳动 Seed 团队核心技术骨干,相关人员均直接向腾讯首席 AI 科学家姚顺雨汇报。

 

据报道,此次入职的核心人员包括原字节 Seed 视觉 AI 平台负责人肖学锋、Infra 团队张弛、训练 Infra 组负责人黄启、RL 算法组负责人袁钰峰等。其中肖学锋任腾讯新成立的 AI Infra 部助理负责人,协助姚顺雨管理部门,其余人员也分任腾讯大模型相关部门的核心岗位。

 

华为盘古大模型负责人王云鹤离职,被曝 Agent 创业

 

华为盘古大模型负责人王云鹤宣布离职,将投身 Agent 创业并已在进行水下融资。王云鹤 1991 年出生,本科毕业于西安电子科技大学,北大博士,2017 年进入华为诺亚方舟实验室实习,2018 年正式入职。8 年间历任高级工程师等职,2025 年接棒姚骏成为诺亚方舟实验室主任。他学术成果颇丰,被引数 33109,h-index 为 68,曾获华为「十大发明」奖,其获奖成果应用于中国天眼 FAST。在朋友圈离职官宣中,他未透露去向。

 

多家公司用 KPI 逼员工内卷 Token:休息的时候也停不下来

 

3 月 25 日消息,AI 时代的职场内卷已呈现全新形式,一场围绕 Token 的疯狂竞赛正在全球科技公司蔓延。上周,OpenAI 一名工程师创下离谱纪录,仅七天就消耗 2100 亿个 Token,这个数字相当于完整读完 33 遍全部维基百科。不止 OpenAI,另一家 AI 巨头 Anthropic 的产品 Claude Code 用户,一个月就产生超过 15 万美元的算力账单。斯德哥尔摩软件工程师马克斯·林德坦言,自己花在 Claude 上的费用甚至超过薪水,而这笔高昂的 Token 开销由其公司承担。

 

值得注意的是,这些天文数字般的 Token 消耗并未带来同等规模的产出。所谓 Token 最大化,本质上不是把工作做得更好,而是单纯追求更多 Token 消耗。Meta、Shopify、OpenAI 等顶级科技公司,如今衡量员工优劣的核心标准只剩一个:每天消耗多少 Token。Token 已悄然成为职场人的福利、KPI 甚至第四份薪水。知情人士透露,Meta 和 OpenAI 内部随处可见 Token 消耗排行榜,实时更新员工 AI 用量,如同游戏战力榜般刺激着每一位职场人。在招聘市场,丰厚的 Token 预算已取代餐补、交通补贴等传统福利,成为企业吸引人才的新亮点。

 

这股风气也蔓延到国内企业,腾讯、阿里纷纷将 Token 作为员工福利,鼓励员工多用 AI 工具。阿里为员工提供大量 Token 额度,办公和研发中使用悟空、Qoder 等付费 AI 工具可随意报销。小米 MiMo V2 发布时,团队负责人罗福莉曾发文要求团队全员多使用模型,甚至提出对话少于百次者无需继续任职。企业投入高额成本提供 Token,本质是为换取十倍工作量。Token 即时、可量化、看似客观的特点,让它成为管理者最青睐的考核指标,但也催生了荒谬的装忙艺术。更令人担忧的是,Token 焦虑已彻底绑架职场人,不少科技工作者放弃休闲,即便不加班也时刻让 AI 代理运转,生怕因 Token 消耗不足被淘汰。

 

在美团业绩会上,CEO 王兴称 AI 将彻底改变一切,在 AI 革命中应主动出击而非仅防守,且不必急于成为 Token 工厂。他认为通用 AI 无法可靠管理真实物理世界服务体验,若不深度参与履约服务管理,AI 只是聪明的聊天机器人。

 

遭中国学界集体“拉黑”后,NeurIPS 道歉

 

3 月 28 日消息,中国计算机学会、中国自动化学会、中国图象图形学学会等机构近日相继就 NeurIPS(神经信息处理系统大会)禁止部分受美国制裁机构参与投稿一事发出郑重倡议:相关领域科技工作者及相关机构拒为 NeurIPS 提供各类学术服务、拒向 NeurIPS 会议投稿。

 

3 月 27 日,NeurIPS 通过社交媒体账号发布最新声明,就征稿指南中的不当内容公开致歉。

 

谷歌 TurboQuant 惊天反转:核心技术早有先例,学术不端实锤?

 

2026 年 3 月 28 日,谷歌一篇引发市场巨震的 AI 顶会论文被曝涉嫌学术造假,苏黎世联邦理工学院博士后、RaBitQ 算法第一作者高健扬公开指控谷歌 ICLR 2026 收录的 TurboQuant 论文,在对 RaBitQ 的描述、理论及实验对比中存在多处严重问题,且相关问题此前已被指出却遭谷歌团队刻意忽视。

 

TurboQuant 是谷歌提出的大语言模型 KV 缓存压缩算法,2025 年 4 月登预印平台、2026 年 1 月被 ICLR 2026 接收,3 月 24 日经谷歌官方推广后爆火,声称能将 KV 缓存内存占用减至少 6 倍、速度提 8 倍且精度零损失。该技术直接冲击市场对内存芯片增长的预期,3 月 24 日美国内存股集体暴跌,闪迪、希捷科技等企业市值单日蒸发超 900 亿美元,谷歌相关宣传贴在 X 平台浏览量达上千万。

 

RaBitQ 是高健扬团队 2024 年发表的高维向量量化算法,核心为量化前对向量施加随机旋转/Johnson-Lindenstrauss 变换,相关成果发表于 SIGMOD 2024/2025 并获理论计算机顶级会议认可;而 TurboQuant 的核心方法同样是该变换,且 TurboQuant 第二作者曾在 2025 年 1 月主动联系高健扬,请求协助调试其复现的 RaBitQ 代码,说明其团队熟知该技术细节,但 TurboQuant 论文却刻意回避与 RaBitQ 的技术关联。

 

  • 系统性回避技术相似性:TurboQuant 将 RaBitQ 错误描述为基于网格的 PQ,忽略其核心的随机旋转步骤,即便审稿人要求充分讨论两者关联,团队仍将对 RaBitQ 的不完整描述移至附录,还以“随机旋转是领域标准技术”为由拒绝合理引用和讨论。

  • 错误描述理论结果:TurboQuant 无证据将 RaBitQ 的理论保证定性为“次优”,但实际 RaBitQ 已被严格证明达到渐近最优误差界,高健扬团队 2025 年 5 月已向其澄清该错误,对方也表示告知了全体作者,却始终未更正。

  • 制造不公平实验条件:测试 RaBitQ 速度时,未用其官方 C++实现,而是用自制 Python 版本,且将其限制在单核 CPU、关闭多线程运行,而 TurboQuant 自身则用 NVIDIA A100 GPU 测试,该不公平条件未在论文披露,还将由此得出的“RaBitQ 慢数个数量级”的结论呈现给读者。

 

据悉,高健扬团队从 2025 年 5 月起多次与 TurboQuant 团队邮件沟通指出问题,2025 年 11 月联系 ICLR 组委会未获回应;2026 年 3 月再次正式致函对方,仅获第一作者承诺在 ICLR 会议结束后修正理论和实验问题,却拒绝讨论技术相似性。目前高健扬已在 ICLR 平台发布公开评论、提交正式投诉,还将在 arXiv 发布详细技术报告,并保留进一步维权的权利。

 

高健扬的主张得到大量支持,包括 TurboQuant 的审稿人也表示曾要求作者对比讨论与 RaBitQ 的设计细节,但未被落实;还有业内人士指出谷歌这类学术不端行为并非首次,目前谷歌与 ICLR 官方尚未对此给出合理解释。

 

与 OpenAI 赛跑,Anthropic 被曝最快 10 月 IPO 上市

 

3 月 27 日消息,据 The Information,Claude 开发商 Anthropic PBC 正考虑最快于今年 10 月进行首次公开募股,与竞争对手 OpenAI 竞相推进上市进程。Anthropic 此次上市募资规模可能超过 600 亿美元(约合 4149.63 亿元人民币)。

 

知情人士称,Anthropic 已与华尔街投行潜在上市进行了初步讨论,高盛集团、摩根大通以及摩根士丹利预计将成为 Anthropic 和 OpenAI 上市承销关键角色的候选机构。

 

不过,相关审议仍在进行中,尚未作出最终决定。Anthropic 及高盛的代表均拒绝置评。OpenAI、摩根大通和摩根士丹利的发言人未立即回应置评请求。

 

今年 2 月,Anthropic 完成了一轮由 MGX 联合领投的 300 亿美元(约合 2074.82 亿元人民币)融资,当时估值达 3800 亿美元。该公司与 Alphabet 旗下的谷歌、亚马逊、微软及英伟达均建立了合作伙伴关系。这些成熟科技巨头已持有这家 AI 初创公司的股份,并通过价值数百亿美元的交易向 Anthropic 提供了专用芯片及其他技术支持。

 

今年早些时候,Anthropic 曾与五角大楼发生纠纷,美国政府一度将该公司认定为供应链风险实体。不过,该公司于本周四获法院支持,暂时解除了美国政府对使用其技术的限制。

 

马斯克旗下 AI 公司初创“11 罗汉”全部离职,SpaceX IPO 散户和粉丝先上桌

 

3 月 28 日消息,据《商业内幕》报道,埃隆 · 马斯克最初组建的 xAI 创始团队,现已全部离场。

 

据知情人士透露,11 名联合创始人之一的罗斯 · 诺丁已于当地时间 3 月 27 日正式离开 xAI。与此同时,诺丁在 X 平台上的 xAI 员工身份标识也已被移除,马斯克最初的创始班底已无人留任。

 

这一人事变动发生在 xAI 新一轮重组期间。与此同时,马斯克也正在为旗下火箭公司 SpaceX 筹备一场可能震动资本市场的首次公开募股,SpaceX 已于今年 2 月完成对 xAI 的收购。知情人士表示,现年 36 岁的诺丁一直是马斯克在 xAI 内部最核心的执行助手之一,直接向马斯克汇报,主要负责统筹公司优先级并推动关键项目执行。

 

而在 3 月 26 日时,xAI 联合创始人马努埃尔 · 克罗伊斯即将离职。此前,克罗伊斯曾效力于谷歌和 DeepMind,他在 xAI 主导模型预训练工作,直接向马斯克汇报,并致力于优化代码模型。

 

马斯克于本月早些时候公开承认,公司目前在代码生成能力上落后于同行,但团队正在全力追赶以超越竞争对手。为弥补技术短板,马斯克表示公司正在重新筛选过去被淘汰的候选人,试图挖掘曾被错过的优秀人才。报道指出马斯克正大刀阔斧地重组 xAI 内部架构,目前已亲自接管数十名员工的直接汇报,并跨部门调动了大量特斯拉和 SpaceX 的员工前来支援,同时解雇了数十名现有员工。

 

据悉,马斯克正亲自推进 SpaceX 启动 IPO,计划于未来几日秘密递交上市申请,目标在 6 月中旬其生日前后完成发行,拟募资 400 亿至 800 亿美元,有望超越沙特阿美成为全球史上最大规模 IPO。此次上市完全打破华尔街传统模式,马斯克摒弃常规路演,计划邀请机构投资者亲临火箭工厂与发射基地进行沉浸式体验,以打动其大额认购。

 

同时,SpaceX 在股权与交易结构上推出多项非常规设计:拟优待特斯拉股东及曾助力收购 Twitter 的投资者,计划将三分之一甚至更多新股分配给个人投资者,远高于行业通常 10%的比例;还考虑对早期股东实施差异化锁定期,部分股东可豁免常规限售,并推动公司尽快纳入纳斯达克 100 指数以获取被动资金。整场 IPO 被马斯克打造成极具个人风格的资本事件,深度绑定散户与忠实支持者,延续其一贯打破常规、强势主导的行事风格。

 

苹果 App Store 被海量“垃圾 AI 应用”冲击,导致审核周期延长

 

近期,苹果 App Store 遭大规模“AI 垃圾”应用冲击,平台审核机制拥堵,正常应用审核时间从 24-48 小时增至最长 45 天,引发开发者吐槽。“AI 垃圾”应用因 AI 生成工具普及而批量涌入,多套用模板,功能重复、质量低且可能含违规内容,加重审核团队工作负担。

 

美团客服回应安卓用户图片被删

 

3 月 24 日消息,有部分安卓用户近日反映,在使用美团 App 期间收到图片和视频被异常删除的提示。对此,美团官方客服回应称:“该问题主要是安卓系统在极少数情况下,App 自动缓存清理时遇到第三方 SDK 冲突导致异常。问题发生后至今,累计有 180 多位用户进线客服咨询,预计潜在波及用户范围约在数百人。我们在发现该问题后已第一时间进行紧急修复。”

 

美团客服称,此次问题仅发生在用户本地手机系统层面,美团 App 不会读取、存储或转移任何用户个人数据,用户隐私及账户信息均未受到影响。美团在发现问题后已迅速成立专项技术支持小组,联合专业安全技术团队协助受影响用户找回数据。目前,美团客服已向每一位受影响用户致歉,并将承担全部费用和赔偿相应损失。

 

OpenAI 关停 Sora,精简产品线为 IPO 铺路

 

3 月 25 日,OpenAI 在高调推出 Sora 独立应用程序六个月后,宣布将停止该视频生成服务,以简化其 AI 产品线。报道称,OpenAI CEO 萨姆 · 奥特曼在内部信中宣布:“Sora 视频平台将全面停运。不只是消费端 app,开发者 API、ChatGPT 里的视频生成功能,统统砍掉。干净利落,不留余地。”

 

据悉,这家 ChatGPT 开发商在计划年内冲刺 IPO 之前做出了这一决定,旨在将重心聚焦于企业级产品。OpenAI 首席财务官表示:我们必须打造一家具备上市条件的公司。OpenAI 于去年 9 月底推出 Sora 应用,承诺让用户更便捷地生成并分享逼真的 AI 视频。这款免费应用程序一度迅速登顶苹果 App Store 排行榜,但此后排名已回落。

 

随着 Sora 的关停,华特迪士尼公司已取消向 OpenAI 投资 10 亿美元的计划。此前洽谈的交易中包含一项许可协议,该协议将允许该应用使用超过 200 个迪士尼角色。外界认为,在迪士尼为其品牌寻找新的分发渠道之际,这笔交易将使 OpenAI 得以接触现有的娱乐知识产权。

 

杨植麟、罗福莉、夏立雪、张鹏、黄超同台,聊 AI 智能体与 Token 产业

 

2026 中关村论坛 OpenClaw 与 AI 开源圆桌中,杨植麟、张鹏、罗福莉等五位 AI 顶流围绕 OpenClaw(龙虾)、Token、算力、行业趋势的核心重磅结论,直击当前 AI 行业最关键的发展现状与未来方向,核心重点如下:

 

  1. OpenClaw 成智能体时代核心抓手。作为开源智能体框架,其打破技术垄断,让普通人也能通过对话调用顶尖模型能力,是堪比 “脚手架 / 轻量级操作系统” 的革命性产品;开源属性拉高国内中小模型上限,多数场景任务完成度接近 Claude 最新模型,还点燃了全行业对智能体层的想象,推动 AI 从 “聊天” 彻底转向 “干活”。

  2. Token 用量爆发式增长,定价逻辑重构。无问芯穹今年 1 月底至今 Token 用量每两周翻一番、累计涨 10 倍,增速堪比 3G 流量普及;复杂任务的 Token 消耗是简单问答的 10-100 倍,智谱等模型提价并非单纯涨价,而是推理成本提升后的商业价值回归,长期低价不利于行业良性发展已成行业共识。

  3. 现有基础设施并不适配 AI,算力成最大瓶颈。当下云计算架构为人类设计,接口需二次封装才能接入智能体,人类分钟级操作速度限制了智能体秒级 / 毫秒级的任务能力;短期需打造高效 “Token 工厂”,整合所有算力资源、提升转化效率,长期则要让基础设施成为可自我进化的智能体,实现 AI 与基建的双向耦合;而算力不足已成为行业最大制约,需求十倍百倍爆发但大量未被满足,“用得起算力” 是技术落地的核心前提。

  4. 算力限制倒逼国产模型架构核心创新。国内团队在算力受限背景下,逼出了混合稀疏架构、Kimi KSA 架构等区别于传统 transformer 的新结构,实现 “算力一定时最大化智能水平”;长上下文能力是 OpenClaw 发挥价值的关键,只有实现低成本、高速度的一兆 / 十兆级长上下文,才能让模型承接复杂生产力任务,这也是国产模型的核心攻坚方向。

  5. 智能体框架三大核心痛点待解。规划层面缺乏垂直领域隐性知识,复杂长任务规划能力不足;记忆层面信息压缩 / 检索精度低,多智能体协同将进一步加剧上下文压力;工具调用层面高质量 skill 稀缺,且存在恶意注入的安全风险,需社区共建并实现 skill 动态进化。

  6. 未来 12 个月 AI 行业四大核心趋势。五位嘉宾定调行业关键词:生态(向智能体原生转型,软件将面向 AI 设计)、自进化(模型可自主迭代优化,1-2 年内或实现,科研效率迎指数级提升)、可持续 Token(打造中国特色 Token 工厂,实现 “AI made in China” 向全球输出)、算力(全行业需共同解决算力不足问题,是所有技术落地的前提)。

 

扎克伯格收编 AI Agent 公司 Dreamer,秘密测试“AI 替身”来帮自己当 CEO

 

3 月 24 日,据报道,Meta 挖走了 AI 创业公司 Dreamer 背后的创始人及其团队。该公司在今年早些时候成立,旨在帮助用户创建自己的 AI Agent。根据 Meta 首席 AI 官亚历山大·王( Alexandr Wang)在周一早上发布的内部通知,Dreamer 团队将加入由其领导的 Meta 超级智能实验室,新入职员工将负责 Meta AI Agent 及相关项目的研发。

 

日前,据爆料,为了让 Meta 进一步提升效率,扎克伯格最近正在亲手主导并测试一个极为私密的项目,试图用 AI Agent 来辅助甚至替代自己的日常工作。报道称,该 AI Agent 的主要作用是帮助扎克伯格更快速地获取信息。以往需要通过多层级人员传递的问题,如今可以由系统直接检索并给出答案,从而显著提升决策效率。

 

除这一 CEO 专属工具外,Meta 内部另一款名为“Second Brain”的 AI 工具也在推进中。该工具能够对项目相关文档进行索引和查询,被视为企业内部知识管理的重要升级。报道还提到,Meta 员工已开始使用多种个人 AI Agent 工具,例如“My Claw”,这些工具可以访问聊天记录和工作文件,并在一定程度上代替用户与同事或其他 AI Agent 进行沟通。

 

首批“首席龙虾官”月薪 6 万,AI Agent 岗位批量上新

 

3 月 25 日,据报道,继“Prompt 工程师”“Vibe Coding 工程师”之后,AI 圈再添新职业——“龙虾官”。近期,国内招聘平台涌现大量“OpenClaw”标签岗位,覆盖北京、上海、厦门、成都等多地,横跨互联网、医疗、地产、旅游等行业。其中,“首席龙虾官”岗位备受关注,直接向 CEO 汇报,负责推动公司 AI Native 转型,要求具备 Agent 系统设计、技术架构搭建及跨团队协作能力,年薪最高可达百万,且明确偏好 00 后。

 

与此同时,“OpenClaw 开发工程师” 等岗位聚焦 Agent 私有化部署,强调开源社区贡献;“养虾达人”类运营岗则侧重 AI 工作流落地。业内认为,大模型与智能体技术正从“颠覆”转向“融合”,催生新型职场生态。AI Agent 已非一时热潮,而是重构工作方式的现实力量。

 

黄仁勋谈死亡:希望在工作中突然离世

 

近日,英伟达 CEO 黄仁勋做客一档科技播客节目,在长达 150 分钟的深度访谈中,罕见谈及对死亡的看法,表示希望未来能在工作中突然离世。当被主持人问及“你思考过生命的极限吗?害怕死亡吗”?黄仁勋坦言自己“真的不想死”;但因为没法长生不老,“我希望死在岗位上,希望是瞬间的,没有长时间的痛苦。”他说自己热爱生活与工作,“我的生活很美好,有很棒的家庭,有非常重要的工作。”黄仁勋认为英伟达是“人类历史上最重要的科技公司之一”“我们在做非常重要的工作,我非常认真地对待。”

 

“Token”中文名定了:词元

 

3 月 24 日消息,据央视新闻报道,在中国发展高层论坛 2026 年年会上,国家数据局局长刘烈宏表示,Token“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”,为商业模式的落地提供了可量化的可能。

 

这从官方角度给出了 Token 的中文翻译:“词元”。在人工智能系统中,词元是模型处理信息的最小单元。无论是用户输入的查询请求,还是系统生成的程序代码,均需拆解为词元进行运算处理。因此,词元调用量不仅反映模型的使用活跃度,更是评估人工智能产业实际价值创造能力的重要指标。

 

刘烈宏透露,截至 2026 年 3 月,我国日均词元调用量已攀升至 140 万亿次以上,这一数字较 2024 年初的 1000 亿次实现千倍跃升;即便与 2025 年底的 100 万亿次相比,短短三个月内增幅亦超过四成。刘烈宏指出,今年 1 月底以来,有的模型企业创下 20 天收入超越 2025 年全年总收入的业绩纪录。这组数字背后,是一套以 Token 计费为基础的新型商业逻辑正在加速演进。

 

非营利组织上线首个“AI 失业补助”:每月发 1000 美元,持续 1 年

 

3 月 26 日消息,美国非营利组织 AI Commons Project 携手 What We Will,为应对 AI 引发的失业潮,启动名为“AI 红利”(AI Dividend)的基本收入计划。该计划主要面向因 AI 技术普及而丧失工作机会或收入锐减的群体,项目已筹集 30 万美元(现汇率约合 207.2 万元人民币)初始资金,首批将资助 25 至 50 名劳动者,每人每月可领取 1000 美元,持续时间为一年。

 

大模型一周大事

 

重磅发布

 

Claude Code 推出“自动模式”,AI 可直接操控电脑

 

3 月 25 日,Anthropic 宣布在 Claude Code 中推出全新的“自动模式”(auto mode)权限管理功能,旨在为开发者提供介于默认保守配置与完全跳过权限之间的中间方案。该模式允许任务在减少人工干预的情况下长时间运行,同时通过内置分类器实时审查文件写入及命令行操作,自动拦截批量删除、数据窃取或恶意代码执行等高风险行为。

 

在“自动模式”下,被判定为安全的操作将自动执行,而潜在危险操作会被阻断并引导模型调整策略;若模型坚持高风险行为,系统将最终触发用户权限提示。Anthropic 强调,虽然该模式显著降低了相比“危险跳过权限”模式的风险,但仍建议在隔离环境中使用。目前,Claude Teams 用户可立即体验此研究预览版,企业及 API 客户将于近日获得访问权限。

 

3 月 24 日,Anthropic 对 Claude Code 与 Claude Cowork 推出重磅升级,AI 突破工具调用限制,可实现对电脑的直接操控。此次更新被业内视为 Claude 体系迄今最激进的能力跃迁,标志着 AI 从文本交互迈向真实执行,直接对标 OpenClaw 核心功能。升级后的 Claude 不再局限于 API 调用与插件工具,可模拟人类操作电脑,打开文件、操控浏览器等,无接口时也能自主完成点击、滚动等完整流程,使用门槛大幅降低。

 

该功能初期面向 macOS 的 Pro 与 Max 订阅用户开放,处于研究预览阶段,访问新应用需用户授权,且支持随时中断操作。配合此次升级,Anthropic 同步上线 Dispatch 跨设备功能,打通手机与电脑对话链路,用户可远程下达指令,让 Claude 自动处理邮件、数据汇总、代码调试等任务。不过该功能仍有局限,复杂任务需多次尝试,模拟操作速度不及 API 集成。

 

与此同时,OpenClaw 同日迎来架构大更新,包括插件系统彻底重构、模型升级、安全加固、沙箱架构升级、生态整合等方面。然而,这场以“安全与生态统一”为目标的激进重构,却直接演变成一次严重的 “升级事故”。由于 OpenClaw 此次强行将插件生态从公共 npm 迁移到官方 ClawHub,引发流量瞬间暴增,导致新版本全线报错,具体包括 dist/control-ui 目录缺失、插件系统崩溃、MiniMax 等国产模型配置失效、Windows 沙箱权限错误等问题。

 

针对 ClawHub 访问异常问题,OpenClaw 开发者皮特·斯坦伯格回应称:为了抵御频繁的网络攻击,限流规则设置得过于严格。后续会调整限流策略,放宽限制以恢复正常访问。这也揭开了本次升级“翻车”的原因:大量用户在升级后涌入 ClawHub 寻找新插件、修复旧插件问题,叠加可能的恶意流量攻击,触发了 ClawHub 的限流机制,进一步加剧了用户体验的崩溃:旧插件无法用,新插件下不了。

 

谷歌推出 Lyria 3 Pro 音乐生成模型、压缩算法 TurboQuant

 

3 月 25 日,谷歌发布 Lyria 3 Pro 音乐生成模型,将单次生成曲目上限从 30 秒大幅提升至 3 分钟,支持前奏、主歌、副歌等完整音乐结构定制。新模型已同步部署至 Gemini 付费版、视频创作工具 Google Vids、AI 音乐平台 ProducerAI,以及面向企业的 Vertex AI 和 Gemini API 等多个场景。谷歌上月刚完成对 ProducerAI 的收购,加速整合 AI 音乐能力。

 

在版权溯源方面,所有生成音频均嵌入 SynthID 水印,明确标识 AI 属性。训练数据来自合作伙伴授权及 YouTube 等平台公开内容,模型不会直接模仿特定艺术家风格,但可汲取“宽泛灵感”。此次升级距离上一代 Lyria 3 发布仅一个月,显示出谷歌正加速将 AI 音乐能力嵌入产品生态,并向企业市场寻求新增长点。

 

此外,谷歌推出一种可能降低人工智能系统内存需求的压缩算法 TurboQuant,这一技术旨在降低大语言模型和向量搜索引擎的内存占用。该算法主要针对 AI 系统中用于存储高频访问信息的键值缓存(key-value cache)瓶颈问题。随着上下文窗口变大,这些缓存正成为主要的内存瓶颈。TurboQuant 可在无需重新训练或微调模型的情况下,将键值缓存压缩至 3bit 精度,同时基本保持模型准确率不受影响。对包括 Gemma 等开源模型的测试显示,该技术可实现约 6 倍的键值缓存内存压缩效果。

 

飞猪发布首个全品类出行旅游 skill“flyai”

 

3 月 25 日,飞猪发布首个全品类出行旅游 skill“flyai”,并已在 ClawHub、GitHub 等平台上线。开发者和用户可以在 OpenClaw、悟空、Kimi Claw、QoderWork、QClaw、MaxClaw、ArkClaw 等数十个“龙虾”应用上即装即用。ClawHub 上的说明文档显示,“flyai”基于飞猪 MCP 作了标准化封装,提供覆盖机票、酒店、门票、用车、目的地玩乐以及机票次卡、酒店套餐等出行旅游商品的搜索、咨询、规划及预订等服务,横跨了导购到交易的完整链条。

 

阿里国际在海外落地首个企业级 Agent

 

3 月 24 日凌晨,阿里国际在海外正式上线了首个企业级 Agent:Accio Work。据介绍,阿里国际此次推出的 Accio Work,不仅具备“龙虾”的通用能力,还擅长生意经营、电商运营。相较于“龙虾”,AccioWork 更进一步实现了无需部署,下载即可使用,目前已面向全球用户开放。

 

涂鸦智能发布 TuyaClaw,为全网首批支持微信 ClawBot

 

3 月 23 日,涂鸦智能发布首个打通数字世界与物理世界的 AI 助理——TuyaClaw。它基于 OpenClaw 架构搭建,既能操作屏幕中的浏览器和桌面应用,又能主动调用智能家居设备、办公设备协同工作。同时,TuyaClaw 是全网首批支持微信 ClawBot,无需复杂安装程序,启用微信插件扫码即可体验。

 

企业应用

 

  • 3 月 27 日,谷歌宣布为 Gemini 增加一项新的“记忆导入”功能,旨在让用户更便捷地从其他 AI 服务切换至 Gemini AI。借助该功能,用户可将自己的喜好、人际关系以及背景信息直接导入 Gemini。后续,Gemini 便能理解用户此前在其他应用中分享的重要信息,例如兴趣爱好、家人的名字或故乡所在地。用户无需从零开始,即可让 Gemini 快速掌握对自己最重要的信息。

  • 3 月 25 日,阿里云宣布 JVSClaw 全面开放,所有用户无需邀请码,访问网址下载对应的客户端,即可获得一只云端“龙虾”。据介绍,新版 JVS Claw 也带来了多个核心功能升级:移动端语音输入、JVS 文件空间、Skill 调用优化、定时任务专用入口和 Clawbot 一键升级等。

  • 3 月 24 日,OpenAI 发布公告,宣布将于本周推出“智能体商业协议”(Agentic Commerce Protocol),用户直接在 ChatGPT 内直接比价并购买商品。该协议服务覆盖免费版、Go 版到 Plus 和 Pro 版的全量用户群体,让电商网站能够将自家库存数据直接无缝接入 ChatGPT 的底层接口。

  • 3 月 24 日,美图 AI 开放平台全新 Meitu CLI 工具发布,首批美图 AI Skills 登陆 ClawHub,接入 OpenClaw 龙虾生态,覆盖个人与企业场景,所有 OpenClaw 用户均可直接安装和使用。