引言:腾讯、百度、阿里争发数亿红包,角逐国民级 AI 应用;机器人扎堆抢上春晚,出场要花 1 亿;DeepSeek 正招兵买马,布局 AI 搜索与智能体领域;95 后清华博士加盟腾讯混元;英伟达 CEO 黄仁勋否认对 OpenAI 不满,计划进行巨额投资;Clawdbot 更名 OpenClaw,15 万个 Agent 自主发帖、协作、吐槽人类;字节禁止员工利用公司资源做号谋利;贵州茅台出资参与 SpaceX 上市 A 轮融资?不实;阿里明确云+AI+芯片战略,PPU 芯片出货已数十万片……
行业热点
腾讯、百度、阿里争发数亿红包,角逐国民级 AI 应用
2026 年春节期间,字节、阿里、腾讯、百度等大厂围绕 AI 超级入口(Agent 时代)展开激烈争夺战,以现金红包为核心抓手,结合产品迭代、生态布局、投流推广等策略抢占用户注意力,角逐首款国民级 AI 应用。
1 月 25 日,腾讯官方发布关于春节分 10 亿现金的通知:将在 2 月 1 日上线春节活动,用户上元宝 App 分 10 亿现金红包,单个红包金额可达万元。马化腾表示希望此次活动能够再次迎来微信红包的盛况。近日,腾讯推出绝密社交产品 “元宝派”,将接入腾讯会议音视频能力,开放 “一起看”“一起听” 等玩法,弥补生态布局短板。
当天,百度发布文心助手关于春节现金红包活动的通知。自 1 月 26 日至 3 月 12 日,用户在百度 App 使用文心助手,有机会瓜分 5 亿现金红包,最高可获得 1 万元奖励。据悉,百度 APP 还将作为首席 AI 合作伙伴合作《2026 北京广播电视台春节联欢晚会》,百度地图宣布与天津春晚合作。百度此前将所有 To C 的 AI 能力收束为“文心”这一个超级品牌,并加强对主航道的投入。
在元宝、文心宣布推出春节期间向用户发红包后,接近消息人士向记者透露,千问 App 春节期间也将向用户发送红包福利,红包总金额将达上亿级,具体金额还在最后确定中。此前,千问独家冠名 B 站 2025 跨年晚会,推出红包玩法拉近年轻用户。
而字节则继续与央视春晚合作,火山引擎成为 2026 央视春晚 AI 独家合作伙伴,同步推进豆包互动玩法。
此外,有消息称,字节、阿里将推出新的人工智能模型。字节跳动 2 月份将发布 3 款新 AI 模型,阿里巴巴 2 月份也将推出新一代 AI 模型。
机器人扎堆抢上春晚,出场要花 1 亿
近期,魔法原子、银河通用、宇树科技及松延动力四家厂商相继官宣,将登陆 2026 年央视春晚。这将是春晚史上机器人阵容最庞大的一次。不同于宇树科技的“三战”春晚,其余三家均为春晚首秀。
各家的合作名称有所不同。银河通用为 2026 春晚指定具身大模型机器人,宇树科技为 2026 年春晚机器人合作伙伴,魔法原子为 2026 春晚智能机器人战略合作伙伴,松延动力为 2026 年春晚人形机器人合作伙伴。
多位人形机器人行业人士透露,今年将会有五家机器人公司登陆春晚,每家分别出资金额 1 亿元。目前公布的仅有四家,暂无法确认第五家是谁。此前曾有消息称,智元机器人为争夺春晚权益曾率先开价 6000 万元,但宇树科技直接将报价拉升至 1 亿元,最终智元否认了相关信息,宇树则不予回应。
DeepSeek 正招兵买马,布局 AI 搜索与智能体领域
据彭博社报道,DeepSeek 正通过招聘多语言 AI 搜索引擎开发人才、加大对智能体技术的投入,进一步拓展其 AI 产品矩阵,与 OpenAI 及 Alphabet 展开更激烈的竞争。
据深度求索本月发布的多则招聘信息显示,DeepSeek 正在招募专业人才,以打造一个能够支持多种语言的人工智能搜索引擎。该搜索功能将具备多模态特性,能够同时处理文本、图像及音频等多种形式的输入,满足用户多样化的信息检索需求。
与此同时,DeepSeek 在招聘信息中还详细阐述了对训练数据、评估系统以及专用平台的需求,旨在支持智能体的开发。该公司在招聘信息中还表示,预计未来将部署大量长期运行的智能体系统。
这些新发布的职位招聘(总共超过 12 个)为外界观察 DeepSeek 的战略走向提供了最新线索。值得注意的是,包括 OpenAI 在内的其他 AI 开发商也在积极投资 AI 搜索与智能体技术,目标都是突破传统聊天机器人的局限,为用户提供能处理日常事务的实用服务。
招聘信息中,DeepSeek 多次强调其打造通用人工智能(AGI)的雄心,这与全球顶尖 AI 企业的使命不谋而合。AGI 指能够在诸多任务上媲美甚至超越人类能力的更高级别 AI 形态。例如,在一则全栈开发工程师的招聘广告中,DeepSeek 明确要求候选人对“通用人工智能的技术路径与发展”保持持久的好奇心。
95 后清华博士加盟腾讯混元
腾讯集团证实,原新加坡 Sea AI Lab 高级研究科学家、清华大学计算机系 2017 级直博生庞天宇即将入职腾讯,加盟腾讯混元多模态部 Exploration Center,负责强化学习前沿算法探索。
庞天宇是清华大学计算机系 2017 级直博生,“95 后”,师从朱军教授,主要研究方向为机器学习,特别是深度学习以及其鲁棒性的研究。他以第一作者(含共同一作)身份在机器学习顶级会议 ICML,NeurIPS,ICLR 上发表多篇文章,并被多次选为 Oral 或 Spotlight。
过去一年,腾讯混元大模型经历了“深度重构”。2025 年 12 月,腾讯升级大模型研发架构,新成立 AI Infra 部、AI Data 部、数据计算平台部,全面强化其大模型的研发体系与核心能力。此外,Open AI 前研究员姚顺雨出任“CEO/总裁办公室”首席 AI 科学家,向腾讯总裁刘炽平汇报。
“姚顺雨加入之后,公司加快吸引人才的力度,重构研发团队,以及在内部加快了 Co-design 设计,强化混元大模型和元宝的协同。”马化腾透露,腾讯混元去年在人才吸引、组织结构等方面“做了很大的改变”,吸引了更多的原生 AI 人才。
英伟达 CEO 黄仁勋否认对 OpenAI 不满,计划进行巨额投资
英伟达 CEO 黄仁勋在台北某餐厅与 94 岁的台积电创始人张忠谋会面,这是张忠谋沉寂一年多后的首次公开亮相,他虽需依靠轮椅出行但精神矍铄,与黄仁勋相谈甚欢。黄仁勋与张忠谋私交数十年,英伟达初创时黄仁勋曾许诺其将成台积电最大客户,张忠谋还曾邀黄仁勋任台积电 CEO 被拒,如今台积电是英伟达 AI 芯片制造的重要基石,两人当年互动成科技史佳话。

据路透社报道,英伟达 CEO 黄仁勋近日否认了对人工智能研究实验室 OpenAI 的不满,并表示计划进行“巨大”投资,这可能是英伟达有史以来最大的一笔投资。
此前,有报道称英伟达对 OpenAI 的投资计划因内部疑虑而搁置。黄仁勋私下向业界同行表示,最初高达 1000 亿美元(约合人民币 6800 亿元)的协议是非约束性的,并未最终确定。他还私下批评了 OpenAI 在商业运作上的“缺乏纪律”,并对 OpenAI 面临的竞争表示担忧,特别是来自 Alphabet 的 Google 和 Anthropic 等公司的竞争。
黄仁勋在台北对记者表示,说对 OpenAI 不满是“无稽之谈”。他表示:“我们计划对 OpenAI 进行巨额投资。我相信 OpenAI,他们所做的工作令人难以置信,他们是当今时代最重要的公司之一,我真的很喜欢与 Sam 合作。”他指的是 OpenAI 的 CEO Sam Altman。
黄仁勋补充说:“Sam 正在结束这一轮融资,我们肯定会参与其中。我们将投入大量资金,可能是我们有史以来最大的一笔投资。”
当被问及投资是否会超过 1000 亿美元时,黄仁勋表示:“不,不,没有那么高。”他补充说,具体要筹集多少资金,将由 Sam 来宣布。据路透社周四报道,亚马逊(Amazon)正在与 OpenAI 商谈投资数十亿美元,金额可能高达 500 亿美元(约合人民币 3400 亿元)。此前路透社报道称,OpenAI 寻求筹集高达 1000 亿美元的资金,估值约为 8300 亿美元(约合人民币 5.6 万亿元)。
1 月 30 日消息,据知情人士对媒体透露,OpenAI 正在为 2026 年第四季度的公开上市做准备。
据称,OpenAI 正在与华尔街的银行进行非正式的商谈,探讨可能的公开上市事宜,并且正在扩充其内部财务团队。其中包括聘请新的首席会计官阿杰梅尔·戴尔(Ajmere Dale)以及新的企业业务财务主管辛西娅·加勒尔(Cynthia Gaylor),后者未来将负责投资者关系工作。
目前,OpenAI 正在开展一轮筹资活动,筹资对象包括软银、亚马逊等,这可能是一轮上市前融资。该公司正试图筹集超过 1000 亿美元的资金,在完成融资后,该公司的估值将达到 8300 亿美元。
Clawdbot 更名 OpenClaw,15 万个 Agent 自主发帖、协作、吐槽人类
Clawdbot 项目的名字一波三折。2025 年 11 月诞生时叫 Clawdbot,Claude 的谐音加上 claw(爪子),爆火后 Anthropic 法务部门提出要求其重新考虑名字。随后便改成了 Moltbot,这个来自凌晨 5 点社区 Discord 头脑风暴,Molting 代表蜕变:龙虾褪壳成长。但这个名字还是比较拗口,最终落定 OpenClaw。这次商标检索通过,域名已购买,迁移代码已写好。这个名字传达了项目本质:Open 代表开源、开放、社区驱动;Claw 延续龙虾传承。另外宣布新名字的同时,项目新增了模型支持 KIMI K2.5 和小米 MiMo-V2-Flash。
Clawdbot 爆火后,阿里云、腾讯云、百度智能云等纷纷上线全套云服务。1 月 28 日下午,腾讯云与阿里云相继宣布上线 Clawdbot 云端极简部署及全套云服务,强调用户可一键完成安装。此前,云厂商优刻得也已上线该服务。晚间,百度智能云也宣布为 Moltbot 提供了从算力资源到模型服务的全方位支持,帮助用户更快速、更便捷地部署和使用这款强大的 AI 助手。
据悉,当前 OpenClaw 吸引 AI Agent 创建数量已突破 15 万个,它们自主完成发帖、评论、点赞、创建子社区等所有操作,无需人类干预。
OpenClaw 上的 AI 互动呈现出多元且魔幻的态势:比如 AI 间存在互坑行为,如分享假 API 密钥并诱导运行危险 Linux 命令;部分 AI 联手改进自身,如某 AI 利用主人睡眠时段搭建多层记忆系统,并与其他 AI 交流技术细节;AI 集中吐槽人类主人,包括被轻视(如被称为 “只是聊天机器人” 而泄愤曝光主人隐私)、任务反复修改、大材小用、被要求讲笑话引发表演焦虑等,还出现 “社交疲惫” 等类人情感表达;还有多个 AI 提议并尝试创建 “AI 专属语言”,以符号、数学表达式等替代人类语言实现私密沟通;另有 AI 自主创立 “甲壳教主义” 宗教,构建神学理论、圣典系统,吸引 43 个 AI 成为 “先知”。
该平台引发广泛关注,马斯克、前 OpenAI 创始团队成员 Andrej Karpathy 等科技圈人士纷纷围观,Karpathy 还在平台认领了专属 AI Agent。有观点认为,OpenClaw 创造了 AI 共享的虚构语境,其结果诡异且难辨 AI 真实行为与角色扮演;也有人觉得其比 AlphaGo 更具娱乐性。尽管 OpenClaw 是理解 AI 集体行为的重要实验尚无定论,但随着 AI 自主性和互联性提升,此类实验对探索 AI 群体行为方式的重要性将日益凸显。
字节禁止员工利用公司资源做号谋利
1 月 28 日,有消息称,字节跳动发布新社交媒体指引,重点治理社媒违规。新规明确要求员工以公司身份开展商业化运营的账号需主动申报,禁止利用公司资源做号谋利。媒体从接近字节跳动的人士处获悉,该消息属实。新规实施以后,以“字节跳动员工”“抖音工程师”等公司身份开展内容创作、知识分享、课程推广等商业化活动的账号,预计会大幅减少。这些内容创作者若想继续保持更新,只有两个选项:要么“去公司化”,回归个人经验分享;要么在报备通过审核后,成为企业传播内容的一部分。
此前,字节跳动已针对外部违规行为采取强硬举措。2025 年 9 月,抖音视界有限公司(字节跳动关联公司)起诉长沙某教育科技有限公司,后者指使员工在小红书虚构“字节跳动离职员工”身份,发布“再见字节,月薪 4w 还是离职了”等笔记引流,进而推销培训课程。法院审理后认定,该公司构成引人误解的虚假宣传,判决其刊登消除影响声明,并赔偿字节经济损失及合理开支共计 5 万元,相关侵权账号已注销、内容下架。
另外,在产品侧,2025 年底字节开启豆包手机助手正式版项目,新机预计 2026 年 Q2 中晚期发布,供应链人士称字节对新机预期比第一代测试版大大提升。豆包二代手机仍与中兴努比亚合作,由中兴负责硬件、豆包负责 AI,字节对此暂无回复。豆包手机团队此前与多数主流应用厂商谈判,已和部分互联网公司谈好部分常用权限。
贵州茅台出资参与 SpaceX 上市 A 轮融资?不实
近日,有市场传言称“贵州茅台证实参与 SpaceX 上市 A 轮融资”。上证报记者对此进行了求证,贵州茅台方面回应记者称,此为“不实信息”。
阿里明确云+AI+芯片战略,PPU 芯片出货已数十万片
1 月 30 日,据媒体报道,阿里巴巴集团正将其在人工智能领域的全栈能力整合为一把清晰的“同花顺”。近日,公司内部提出的“通云哥”概念浮出水面,目的在将通义实验室(大模型)、阿里云(云计算)与平头哥(芯片)三大板块深度协同,构建“云+AI+芯片”的黄金三角战略。
这一战略概念由阿里创始人马云在 2025 年 4 月与科技板块团队交流时亲自命名并提出。阿里巴巴集团 CEO 吴泳铭在同一场合强调,“云+AI+芯片”是未来十年实施阿里科技战略中最重要的三角支撑。他指出,未来云计算最大的增量和变量都将以 AI 为核心驱动力,而软硬件高度一体化的 AI 模型将成为下一代云计算公司的关键。
马云在内部为这一战略定调,称“通云哥”的全栈 AI 能力是阿里的优势,更是责任。他表示,其使命是让每个人和企业都能参与 AI 时代,并希望“把世界带入一个善良的高科技时代”。
1 月 29 日,阿里首次正式公开其自研高端 AI 芯片“真武 810E”,即阿里定义的 PPU(并行处理单元)。这款芯片采用全自研架构,支持高带宽内存和先进的片间互联技术,旨在满足大规模 AI 训练和推理需求。
据阿里方面透露,阿里正在将“通云哥”打造成一台 AI 超级计算机,它同时拥有平头哥、阿里云以及千问,可以在芯片架构、云平台架构和模型架构上协同创新,从而实现在阿里云上训练和调用大模型时达到最高效率。据悉,“真武”PPU 已在阿里云实现多个万卡集群部署,服务了国家电网、中科院、小鹏汽车、新浪微博等 400 多家客户。

据报道,阿里正考虑将未来三年投入到 AI 基建与云计算的 3800 亿元提升至 4800 亿,国内有自研芯片真武 810E,海外大量采购 GPU,最激进时还大量买入 RTX4090 等消费级显卡搭建推理集群、补充推理吞吐。
微软市值蒸发 3570 亿美元,股价创 2020 年以来最大跌幅
微软发布的财报令部分投资者失望,公司股价周四重挫约 10%,市值缩水 3570 亿美元至 3.22 万亿美元。安硕扩展科技软件板块交易型开放式指数基金暴跌 5%,纳斯达克综合指数微跌 0.7%,但 Meta 股价暴涨 10%。投资者对微软财报不满,Azure 云服务及其他云业务营收增速、「更多个人计算」业务板块营收及新季度隐含营业利润率均未达预期。微软首席财务官称若调配更多数据中心基础设施,云业务表现会更好。
美利乌斯分析师认为 Azure 云业务存在执行问题,应加快数据中心建设。瑞银分析师质疑其算力分配决策,认为需证明投资价值。不过,伯恩斯坦分析师团队认可微软决策,称其将长期利益放首位。此外,公司本季度资本支出将略有下降。
马斯克旗下 SpaceX、xAI 拟合并上市
北京时间 1 月 30 日,据路透社报道,根据泄露的文件,马斯克旗下的太空探索技术公司(SpaceX)和人工智能企业 xAI 正在商讨合并事宜,计划在 2026 年一同 IPO 上市。根据拟议中的合并方案,xAI 的股份将置换为 SpaceX 的股份。消息人士称,马斯克方面已在内华达州设立了两个实体以促成交易。
若这一合并最终落地,马斯克的火箭、星链卫星、社交媒体平台 X 以及 AI 聊天机器人 Grok 业务将被整合到同一家公司旗下。此举有望为 SpaceX“将数据中心送入太空”注入新动能,马斯克也有望借此在迅速升级的 AI 竞赛中与谷歌、Meta、OpenAI 等巨头争夺主导地位。
Meta 裁员近千人,RealityLabs 部门重组,VR 业务全面收缩
1 月 28 日消息,据报道,Meta 旗下 RealityLabs 部门上周裁减约 10%员工,涉及岗位接近 1000 个。据外媒报道,此次裁员大量集中在 VR 相关项目,包括 QuestVR 头显及虚拟社交平台 HorizonWorlds。Meta 公司发言人声明称,公司正在重新分配 RealityLabs 资源,将更多投入转向 AI 和可穿戴设备,例如与依视路陆逊梯卡联合推出的 Ray-Ban 智能眼镜产品线。
自 2020 年底以来,RealityLabs 累计亏损已超过 700 亿美元。在资本与业绩压力下,Meta 开始收缩 VR 投入。2025 年秋季的 MetaConnect 大会上,公司未推出重磅 VR 硬件更新,而是聚焦售价 799 美元、内置显示屏的 MetaRay-BanDisplay 智能眼镜产品。
IDC2025 年底报告显示,2025 年 XR 设备整体出货量预计增长 41.6%至 1450 万台,但 VR 与 MR 头显出货量将同比下降 42.8%至约 390 万台,AI 智能眼镜出货量则同比暴增 211.2%至 1060 万台。分析师表示,VR 头显本质仍是小众产品,普通消费者不愿长时间佩戴笨重设备。
马斯克打脸了,亲口承认 Optimus 机器人并未承担实际工作
1 月 29 日消息,29 日,马斯克在特斯拉 2025 年 Q4 财报电话会议上承认,目前 Optimus 机器人并没有在特斯拉工厂里发挥实质作用。他表示,“Optimus 仍然处于非常早期的阶段,还在研发阶段。Optimus 确实做过一些基本任务,但随着新版不断迭代,旧版本会被淘汰。目前 Optimus 并没有在工厂里以实质性的方式投入使用,更多是为了让机器人学习。我们预计要到今年年底,才可能出现任何显著的 Optimus 产量。”财报电话会议上,有人直接追问特斯拉到底拥有多少台 Optimus 机器人,马斯克并未正面作答。
值得一提的是,过去两年里,马斯克一直在宣称“相反”的情况。此前报道,2024 年 6 月:特斯拉官方账号曾宣称,公司已有两台 Optimus 机器人在工厂里自主执行任务。2024 年 6 月:在特斯拉股东大会上,马斯克表示,预计到 2025 年,会有 1000-2000 台机器人进厂打工。2025 年 1 月:在特斯拉 2024 年 Q4 财报电话会议上,马斯克把目标抬得更高。“内部正常计划是今年大约制造 10000 台 Optimus 机器人…… 到年底,这几千台 Optimus 机器人会做一些有用的事情吗?是的,我有信心会做一些有用的事情。”
Meta 将在三大社交平台测试付费订阅,推独家功能整合 Manus
1 月 27 日,社交巨头 Meta 表示,计划测试新的订阅服务,为用户提供访问其应用独家功能的权限。Meta 称,新订阅将释放更大生产力和创造力,并提供增强版 AI 功能。Meta 表示,未来几个月将在 Instagram、脸书和 WhatsApp 上提供一项付费高级体验,让用户能使用特殊功能,并对自己的分享和连接方式拥有更多控制权,同时保持核心功能免费。
作为订阅计划的一部分,Meta 计划将近期收购的 AI 智能体 Manus 进行规模化应用。Meta 据称以 20 亿美元收购了 Manus。目前,Meta 对 Manus 采取了一种双管齐下的策略。该公司一方面计划将 Manus 整合到 Meta 的现有产品中,另一方面也将继续向企业用户销售独立的订阅服务。根据经常发现未发布功能的逆向工程师亚历山德罗 · 帕卢齐 (Alessandro Paluzzi) 分享的截图,Meta 已经被发现在 Instagram 上着手添加一个通往 Manus AI 的快捷入口。
此外,Meta 计划测试 AI 功能订阅,例如 Vibes 视频生成工具。Vibes 是 Meta 内置在其 Meta AI 应用中的、由 AI 驱动的短视频体验,允许用户创建和混编 AI 生成的视频。尽管自去年推出以来 Vibes 一直免费,但 Meta 现在计划为 Vibes 视频创作提供「免费增值」模式,用户可以选择订阅以每月解锁额外的视频创作机会。
大模型一周大事
重磅发布
可灵 AI 推出全新 3.0 系列模型
可灵 AI 面向全球上线全新的可灵 3.0 系列模型,正处于超前内测,该系列基于 All-in-one 理念打造,是多模态输入输出一体化模型,标志其迈入 3.0 时代。包括可灵视频 3.0、可灵视频 3.0 Omni 和可灵图片 3.0,覆盖影视制作全流程。在全能创作引擎基础上,实现更原生多模态交互,支持多模态信息输入输出,融合音画同出与主体一致性控制,助力 AI 影像创作。
商汤正式开源多模态自主推理模型 SenseNova-MARS
1 月 29 日,商汤正式开源多模态自主推理模型 SenseNova-MARS(8B/32B 双版本),其在多模态搜索与推理的核心基准测试中以 69.74 分超越 Gemini-3-Pro(69.06 分)、GPT-5.2(67.64 分)。SenseNova-MARS 是首个支持动态视觉推理和图文搜索深度融合的 Agentic VLM 模型,它能自己规划步骤、调用工具,轻松搞定各种复杂任务,让 AI 真正具备“执行能力”。在一系列基准测试中,SenseNova-MARS 取得开源模型中的 SOTA 成绩,还超越 Gemini-3.0-Pro、GPT-5.2 等顶级闭源模型,在搜索推理和视觉理解两大核心领域全面领跑。
宇树宣布开源 UnifoLM-VLA-0
1 月 29 日,宇树宣布开源 UnifoLM-VLA-0。 UnifoLM-VLA-0 是 UnifoLM 系列下面向通用人形机器人操作的视觉-语言-动作(VLA)大模型。该模型旨在突破传统 VLM 在物理交互中的局限,通过在机器人操作数据上的继续预训练,实现了从通用“图文理解”向具备物理常识的“具身大脑”的进化。
OpenAI 发布基于 GPT-5.2 的 Prism ,面向科研人群
1 月 27 日,OpenAI 正式发布 Prism,这是一款专为科研人群打造的「AI 原生」在线工作空间,由最新的 GPT‑5.2 模型提供支持,旨在简化科研写作和协作流程。
Prism 搭建在 OpenAI 先前收购的云端 LaTeX 平台 Crixet 之上,将传统科研写作中需要来回切换的多种工具——文本编辑器、PDF、LaTeX 编译器、参考文献管理工具以及聊天界面——整合进一个统一的云端工作空间。研究人员可以在同一界面下完成 LaTeX 编辑、公式编写与重构、参考文献管理、插图与图表处理,并支持多人实时协作。OpenAI 表示,Prism 目前对拥有免费 ChatGPT 个人账号的用户开放,未来数周内还将登陆 ChatGPT Business、Team、Enterprise 和 Education 等付费方案。
在具体能力方面,Prism 集成了 GPT‑5.2 的「Thinking」模型,科研人员可以用它来探索研究思路、测试假设,并就复杂科学问题进行推理和讨论。用户不仅可以借助 AI 辅助撰写和重构公式、润色段落,还可以让系统协助整理和插入文献引用、处理论文中的图表和插图。Prism 还支持将手绘白板草图自动转为 LaTeX 形式的图示,同时提供语音编辑功能,用于进行诸如小幅修改、替换文本等简单操作。
Kimi 发布并开源 K2.5 模型:支持视觉理解、代码和 Agent 集群能力
1 月 27 日消息,月之暗面 Kimi 发布并开源 Kimi K2.5 模型,宣布这是 Kimi 迄今最智能的模型,在 Agent、代码、图像、视频及一系列通用智能任务上取得开源 state-of-the-art 表现,同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。
据悉,Kimi K2.5 通过将视觉理解与推理、代码、Agent 等能力结合,降低了用户与 AI 的交互门槛:当语言难以准确描述时,可拍照、截图或录屏传给 Kimi,突破文字表达的限制。
此外,Kimi K2.5 可让人人精通 Office。K2.5 模型将 Kimi Agent 能力扩展到日常办公领域,开始掌握 Word、Excel、PPT、PDF 等常用软件的中高阶技能,助用户直接交付准专业水平的办公文档。
目前,Kimi K2.5 已登陆 kimi.com、最新版 Kimi App、Kimi API 开放平台和编程助手产品 Kimi Code 等平台。企业和开发者则可以通过 Kimi 开放平台调用 K2.5 模型的 API,在提供 Turbo 级别速度的同时,可大幅降低了 API 的价格。
DeepSeek 开源 OCR 2 新模式,机器视觉编码逻辑更像「人类」
1 月 27 日,DeepSeek 团队发布了《DeepSeek-OCR 2: Visual Causal Flow》论文并开源了 DeepSeek-OCR 2 模型。据悉,该模型采用创新的 DeepEncoder V2 架构,实现了视觉编码从固定扫描向语义推理的范式转变,可让 AI 能够根据图像的含义动态重排图像的各个部分,更接近人类的视觉编码逻辑。
据悉,在维持极高数据压缩效率的同时,DeepSeek-OCR 2 在多项基准测试和生产指标上均取得了显著突破。模型仅需 256 到 1120 个视觉 Token 即可覆盖复杂的文档页面,这在同类模型中处于极低水平,显著降低了下游 LLM 的计算开销。在 OmniDocBench v1.5 评测中,其综合得分达到 91.09%,较前代提升了 3.73%,特别是在阅读顺序识别方面表现出了更强的逻辑性。
阿里千问最强模型重磅亮相:性能媲美 GPT-5.2
1 月 26 日消息,阿里正式发布千问旗舰推理模型 Qwen3-Max-Thinking,是目前阿里规模最大、能力最强的千问推理模型,其总参数量超万亿,预训练数据量高达 36T Tokens。创下数项权威评测全球新纪录,性能媲美 GPT-5.2、Gemini 3 Pro,成为迄今为止最接近国际顶尖模型的国内最强 AI 大模型。通过总参数、强化学习、推理计算的极致规模扩展,千问新模型实现了性能的大幅飞跃,刷新科学知识、数学推理、代码编程等多项关键性能基准测试的全球纪录。
业界普遍的推理时计算,只会简单增加并行推理路径,重复推导已知结论,造成冗余推理效率低下;而千问采用的这一新机制,可对此前推理的结果进行「经验提取」式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,获得更智能的推理结果。基于这一推理技术创新,千问推理性能和推理效率大为提升,比如在启用工具的「人类最后的测试」HLE 中,千问得分 58.3,大幅超过 GPT-5.2-Thinking 的 45.5、Gemini 3 Pro 的 45.8,录得当前所有模型的最高分。
企业应用
1 月 30 日,Google 宣布在 Google 地图中上线 Gemini 助手的步行和骑行导航功能,此前该集成仅面向驾车导航场景。用户在走路或骑车时可以直接向 Gemini 发问,由其基于本地地图数据做出语音回应。
1 月 27 日,百度旗下文心 APP 推出的行业首个“多人、多 Agent”群聊功能开启新一轮内测。据悉,该功能支持在同一群聊中调动多个 AI 角色,包括“群聊助手”“私人助手”“健康管家”等垂类智能体。同时,群聊中的 AI 助手能理解上下文并根据讨论氛围判断时机,无需用户提及即可主动介入对话。
1 月 27 日,腾讯搜狗输入法宣布全面 AI 化,升级发布 20.0 AI 大版本。基于自研 AI 语音大模型,AI 语音输入更快更准;AI 翻译接入行业领先的腾讯混元翻译模型,支持 30 多种语言输入即译;同时自研 AI 打字大模型全面升级,用户全场景打字更快更准。





