写点什么

阿里系 App 禁止豆包手机登录;库克被曝出现“不明原因手部颤抖”;众擎 T800 人形机器人一脚踹倒自家 CEO | AI 周报

  • 2025-12-08
    北京
  • 本文字数:9971 字

    阅读完需:约 33 分钟

大小:5.02M时长:29:13
阿里系 App 禁止豆包手机登录;库克被曝出现“不明原因手部颤抖”;众擎T800人形机器人一脚踹倒自家CEO | AI周报

阿里系 App 禁止豆包手机登录;众擎 T800 人形机器人一脚把自家 CEO 踹翻在地;极越破产重整进展:夏一平计划引入新投资方,百度寻求退出;库克被曝出现“不明原因手部颤抖”;传新东方员工发内部信吐槽“加班成奴”,账号被秒封!佳能中山工厂裁员补偿,最高可领 40 万!董事长写推荐信;“嫌年薪 435 万少”拒当艾比森董事长?公司回应:董秘笔误;小扎放弃元宇宙,团队累亏超 700 亿美元……

 

行业热点

 

阿里系 App 禁止豆包手机登录

 

12 月 6 日消息,豆包与中兴合作的首款“豆包助手”手机一经发售就引发热议,继微信出现被动下线后,经媒体测试,阿里系多款应用 —— 淘宝、淘宝闪购、闲鱼、大麦等 App 已开始拒绝“豆包手机”登录。据悉,若用户手动操作打开上述 App,将触发安全机制,弹出登录受阻提示。

 

与此同时,手机银行和金融类 App,也先后出现了针对 AI 、屏幕共享的监测以及风控措施。多名用户反馈,在使用豆包 AI 手机助手时,遭到了农行、建行 App 内的强弹窗提醒,要求关闭 AI 手机助手后再进行使用。此外,游戏类 App 如《王者荣耀》同样能监测到 AI 控制,目前仅支持手动打开,AI 助手无法对其进行开启或控制。

 

随后,豆包手机助手发布声明,称网传「可直接查询银行卡余额并跳过认证读取用户信息」是谣言。其仅在用户要求与授权下查询余额,涉及敏感操作需用户手动确认,且无系统权限跳过认证环节,查询仍需用户手动完成真人检测、密码输入等。

 

上线三天后,豆包手机助手发布《关于调整 AI 操作手机能力的说明》,称计划在接下来的一段时间,在部分场景,对 AI 操作手机的能力做一些规范化调整。豆包助手方面还强调,将积极与各方沟通,希望推动形成更加清晰、可预期的规则,避免用一刀切的方式否定用户合理使用 AI 的权利。

 

根据官方说明,豆包手机助手调整主要涉及三类场景:一是限制在各类 App 中用于刷分、刷激励的自动操作能力,以尊重厂商鼓励“真实用户主动交互”的初衷;二是进一步限制银行、互联网支付等金融类应用的代操作能力;三是对涉及竞技排名的部分游戏场景暂停开放 AI 使用,维护公平性。

 

作为新事物,豆包手机助手预览版在上线后,引发了广泛的社会关注。12 月 2 日时,中兴商城显示“豆包助手”手机已告罄。在二手平台上,该款手机搜索热度持续上涨,大部分二手售价从 3699 元至 7999 元不等,较 3499 元官方售价溢价 200 至 4500 元,个别卖家甚至标价上万元,租赁价格超 600 元/天。一名供应链人士证实,“字节跳动此次确实是试水市场,手机备货量不多,首批产品约 3 万台的备货。”同时,“此轮售罄后项目方并未追加物料投入。”这也意味着短期内市场流通量将保持固定。“字节跳动与中兴通讯第二代产品已启动研发,在未出现其他变量因素情况下,预计于 2026 年底出货。”

 

此前,360 创始人周鸿祎发微博视频谈豆包手机,称手机操作将变天,字节虽不造手机,但豆包手机助手能接管手机,不用点 App 就能帮用户完成操作,这会冲垮互联网大厂护城河,使其传统流量逻辑面临崩塌。接下来可能会有技术攻防战,各大 App 或调整页面结构等限制 AI,电商 App 可能限制第三方调用服务,大厂或许抱团推出联合防御协议。手机厂商也不会让出桌面控制权,可能限制豆包运行,甚至推出自家助手抗衡,明年新手机或预装厂商系助手。

 

众擎 T800 人形机器人一脚把自家 CEO 踹翻在地

 

日前,众擎机器人发布了一段 T800 人形机器人“大战”自家老板的视频,引发网友热议。视频中,众擎 CEO 赵同阳身穿护具,第一次成功躲过 T800 的飞脚,但险些被正面踹中,差点用脸接招。

 


第二次 T800 一脚结结实实踹在赵同阳腹部,直接将其踹翻在地。挨踹后的赵同阳直呼:“太暴力了、太残暴了,如果不戴护具没人能撑得住,绝对会骨折。”有网友表示:“你们员工太狠了,让老板亲自上阵。”“多少带了点私人恩怨。”

 

据了解,众擎 T800 售价 18 万元起,可选基础版、生态版(开源版)、锐化版(Pro 版)、旗舰版(Max 版)四种版本。众擎 T800 采用 1.73 米成人身高、75 公斤自重,具备运动与负载能力,通过搭载全栈一体化高爆发关节模组,众擎 T800 协同输出可实现 450N·m 峰值扭矩,以及瞬间关节 14000W 峰值功率。此外,众擎 T800 配备全栈自研多维度感知灵巧手,集成触觉传感系统与精准力控技术,既能稳定抓握重物,也能完成精细的分拣与操作。

 

极越破产重整进展:夏一平计划引入新投资方,百度寻求退出

 

根据凤凰网科技报道,曾担任集度汽车 CEO、极越 CEO 的夏一平正在主导引入新的投资方,推进极越的破产重整,在这一过程中,集度的发起人,也是主要投资方之一的百度寻求退出。夏一平寻求引入的投资方主要来自中东。

 

此前在 11 月 25 日,极越汽车在官方渠道发布“上海集度汽车有限公司关于启动预重整程序的公告”,宣布上海集度汽车有限公司(品牌为“极越汽车”)启动预重整程序,旨在引入新的战略投资人,盘活现有资产与资源,维护资产价值,并保障用户售后权益。上述公告还称,上海集度汽车有限公司将在临时管理人的监督下,维持核心业务平稳运转,依法保障用户合法权益。

 

知情人士声称,极越目前的确保留小规模的团队,维持低功率运行,主要是服务于软件更新和售后服务,不过夏一平目前没有参与实际业务的运营,他的重心在处理极越的破产重整上,包括和股东、债权人的沟通,以及与新投资方的洽谈。

 

极越破产重组的最大难题来自于庞大的债务规模,据媒体报道可能高达 70 亿。不过,在相关部门的协调下,极越的量大股东吉利和百度联合解决了员工的欠薪和裁员赔偿问题,也有少部分供应商、合作伙伴拿到了欠款。但一位极越的前中层员工预估,吉利和百度为极越偿还的债务也有限,两者本身也是极越最大的债权人:吉利曾为极越提供代工服务,百度则提供智能化相关服务,两者的债权规模占据极越总债务规模的大约 72%。因此,两大股东的态度对极越的破产重整成功至关重要。

 

另外一位了解极越破产重整进程的相关人士则透露,百度寻求在这一轮破产重整中完全退出。该人士无法确认吉利方面的态度。在此之前,百度已经为极越(包括集度)投入大约 80 亿,最终只换来大约 1.4 万辆总销量,月均大约 1200 辆。吉利持有集度 45%的股权。极越则是由吉利、百度和集度三方共同成立的新品牌。

 

库克被曝出现“不明原因手部颤抖”

 

知名科技爆料人古尔曼透露,苹果 CEO 库克的手会“时不时发抖”,导致这一震颤问题的原因并没有明确解释。据悉,近几个月来,这一情况在苹果员工之间被越来越多地谈论。据知情人士透露,在会议和大型公司活动中,不论是高管还是普通员工都注意到了这种颤抖。但接近库克的人士表示,他的健康状况良好,并否认硅谷流传的相反传闻。

 

现在可能是库克任期内最动荡的时刻之一。过去一周,苹果接连失去了人工智能主管 John Giannandrea(退休)、设计负责人 Alan Dye(跳槽 Meta)、法务负责人 Katherine Adams(退休)和政府事务主管 Lisa Jackson(退休)。

 

此前,这四位高管全都直接向 CEO 蒂姆·库克汇报——这种级别的人事震荡在苹果历史上极为罕见。更糟糕的是,据彭博社援引知情人士透露:负责硬件技术的高级副总裁 Johny Srouji 最近告诉库克,他正在「认真考虑」在不久的将来离职。Srouji 是苹果最受尊敬的高管之一,也是苹果自研芯片战略的操盘手。他已经向同事透露,如果最终离开,绝对不会是「退休」,而是打算加入另一家公司。 

 

传新东方员工发内部信吐槽“加班成奴”,账号被秒封!

 

俞敏洪“南极全员信”引发的争议似乎还在持续发酵。12 月 4 日,一名新东方杭州的员工在内部邮件发布了全员信,表达对公司加班文化的不满。这份全员消息发布后,该员工就被移出了公司钉钉架构,发布的文章也被后台撤回。这位员工控诉称,自入秋以来,课程顾问团队便陷入了 “996 单休” 的循环,每日工作时长几乎从早 9:30 延伸至晚 21:30 不止,整整十多个小时的坚守成为常态。入职时《劳动合同》上清晰可见的双休,却屈指可数实现,劳动法规定的八小时工作制,早已成了遥不可及的奢望。

 

该员工还列举了自己面临的具体困境,包括指标虚高、加班成奴、工作无序等问题,并表达了对管理层的不满和对改善工作环境的渴望。其希望公司能够真正实现“以人为本”的理念,让员工获得尊严和平衡的生活。该员工还引用了俞敏洪的言论称,“如果公司不断损害你,就不是好公司”,希望公司能回归教育质量,重视员工权益。邮件中,该员工还强调了俞敏洪鼓励言论自由的观点,这是激励自己表达心中所想的勇气。

 

对此,有网友表示,“大家不加班?!你让俞老板怎么去南极游呢?”“引蛇出洞!”“为什么不换工作?”杭州新东方的工作人员回应称,该信确系由杭州新东方一员工发出的,已经删除,因集团内部是有明确的举报机构和举报机制的,他(她)这种对全部员工发出的形式是不正确的,公司肯定要进行相应的处理。此前,俞敏洪曾在南极全员信的第二封回应信中说,欢迎和鼓励大家公开吐槽,鼓励言论自由,这是新东方的传统。

 

俞敏洪回应「南极事件」和新东方员工公开信,称写信员工正常上班,已要求相关部门调查员工反映的问题,有问题立刻纠正。

 

佳能中山工厂裁员补偿,最高可领 40 万!董事长写推荐信

 

11 月 4 日消息,佳能(中山)打印机工厂已于 11 月 21 日停产,员工临时放假到 11 月 28 日,目前该厂正在与员工、供应商结清关系。11 月 29 日,佳能(中山)的补偿方案正式曝光,多名员工晒出结算金额,“40 万+”的补偿让网友直呼:这不是裁员,这是发奖金,不是离职,是体面毕业。

 

网传,11 月 29 日公布的方案包括 “2.5N+1”经济补偿金(N 为工作年限对应月薪)、5 个月税前工资的就业支援金等。这力度放在制造业里,几乎是“买断工龄”级别的慷慨。例如,18 年老员工总计可获约 40 万元。有网友晒图称:“能拿到 40 万,很知足,真的心存感恩。”一位工作 3 年的员工算完账发现,他月薪 5000 的话,预计能拿到 8.25 万的补偿金,这和法定标准的 2 万元相比,直接翻了四倍多,这对打工人而言,妥妥的“天降横财”。难怪网友刷屏感叹:“别人裁员是噩梦,佳能裁员像中大奖。”

 

据多名员工透露,佳能(中山)主动对接本地制造企业,给员工搞专场招聘会,尽量帮他们在下一家新公司争取点好印象、好机会。董事长甚至亲自为员工撰写推荐信,承诺协助对接新工作机会。有员工晒出推荐信后说:“离职当天收到老板写的推荐信,有被暖到。”佳能(中山)打印机工厂有 20 多年历史,2010 年左右,员工有上万人,很多工人排队入厂打工。截至 2025 年 9 月底,该厂员工仅剩 1400 人左右。本次佳能停业,本质上是产能转移,近年来佳能部分制造订单有向越南、泰国等东南亚地区的工厂分流的趋势。

 

“嫌年薪 435 万少”拒当艾比森董事长?公司回应:董秘笔误

 

12 月 2 日消息,近日,上市公司艾比森发布了《第六届董事会第一次会议决议公告》,其中选举董事长环节公告的一则情况,引发广泛关注。公告内容显示,在本次会议选举董事长时,公司创始人、长期担任董事长一职的丁彦辉,以 8 票赞成、1 票反对的结果再次当选。而这唯一的反对票,竟来自他本人。他在表决理由中直言不讳地写道:“对董事长岗位薪酬不满意。”

 

艾比森 2024 年年报显示,丁彦辉当年从公司获得的税前报酬总额为 435.56 万元,其中包含员工持股计划的本金和收益 173.99 万元。对比 2023 年其 288.45 万元的年薪,一年间薪酬增幅约达 51%。针对这一“不走寻常路”的反对票,有博主调侃称“让董事长受委屈了”;还有网友则直接直言“435 万还不满意?”。

 

针对此事,艾比森回应称“这是董秘的笔误”,实际是董事长对公司激励机制不满。艾比森方面还表示,董事长想要做一些改革创新,例如,公司治理结构不健全,要优化公司治理结构;利益分配机制不健全;薪酬激励机制不合理。

 

小扎放弃元宇宙,团队累亏超 700 亿美元

 

当地时间 12 月 4 日,据外媒报道,Meta 的 CEO 马克·扎克伯格将要改变元宇宙业务的发展策略。据知情人士透露,公司管理层已在讨论将明年元宇宙团队的预算削减高达 30%,旗下虚拟世界产品 Meta Horizon Worlds(地平线世界)和 Quest 虚拟现实头显业务将受到影响,最早可能于明年 1 月启动裁员。Meta 的元宇宙团队隶属于 Reality Labs 部门,自公司开始重点发展元宇宙的 2021 年初以来,该部门已累计亏损超过 700 亿美元。

 

对此,Meta 方面证实称,元宇宙项目的部分资源将用于支持现实实验室部门内的其他项目:“在我们现实实验室的整体投资组合中,鉴于不同的发展势头,我们正在将一些投资从元宇宙转向 AI 眼镜和可穿戴设备。我们没有任何更广泛的改变计划。”

 

微软否认下调 AI 销售指标,增长目标≠销售配额

 

路透社 12 月 4 日报道称微软正式否认了有关“降低 AI 产品销售指标”的传闻,并驳斥了科技媒体《The Information》的相关报道。

 

《The Information》此前报道称,微软内部多个团队因业绩未达标,而下调了 AI 产品的销售增长目标。报道称,微软美国区至少有一个 Azure 销售部门在上一财年要求销售人员将客户在 Foundry 服务上的支出提升 50%。然而,数据显示仅有不到 20% 的销售人员达成了这一激进目标,此外微软已悄然将当前财年的增长预期下调至 25% 左右。

 

对此,微软通过路透社回应指出,《The Information》的报道错误地将“增长目标(Growth)”与“销售配额(Sales Quotas)”这两个截然不同的概念混为一谈,认为该媒体对销售组织的运作及薪酬机制缺乏基本了解。

 

微软进一步强调,公司并未下调 AI 产品的总销售配额,且在报道发布前已告知对方这一事实。对于这两个具体的百分比数据,微软在回应中既未确认也未直接否认,仅聚焦于对“配额下调”这一核心指控的驳斥。

 

除了销售数据之争,该报道还披露了企业客户在实际使用微软 AI 产品时的挫折感。以私募股权巨头凯雷集团(Carlyle Group)为例,据称该集团减少了对 Copilot Studio 的使用,原因是该工具在从不同数据源提取数据时存在技术问题。

 

马斯克晒擎天柱跑步,出镜视频仅 4 秒,团队:刷新个人纪录

 

12 月 3 日,特斯拉 CEO 马斯克在社交平台转发了一则特斯拉擎天柱(Optimus)团队发布的一段短视频。值得一提的是,该视频演示的是人形机器人在实验室进行跑步的状态,其动作姿态流畅自然,但时长仅为 4 秒,让人颇感不过瘾。而该团队则配文称:刚在实验室刷新了个人纪录。

 

据此前报道,11 月上旬,特斯拉宣布其人形机器人的试生产产线已经在弗里蒙特工厂开始运行,规模更大的第三代人形机器人的生产线将于 2026 年建成投产。目前公司也正在工厂及特斯拉办公场所测试各类使用场景,机器人规模化生产后,预计每台成本将控制在 2 万美元以内。

 

OpenAI 拉响红色警报以突击式提升 ChatGPT

 

12 月 3 日消息,据报道,OpenAI 首席执行官萨姆·奥特曼宣布拉响“红色警报”,将调配更多内部资源以加速改进 ChatGPT,同时延迟其他项目的推进。援引一份内部备忘录报道称,奥特曼周一要求对 ChatGPT 进行“突击式”升级,同时推迟自主式 AI 代理和广告等其他工作。尽管奥特曼未明确说明需优先处理哪些修复事项及原因,但 The Information 指出他近期曾告诫员工,谷歌在人工智能领域的强势回归可能给 OpenAI 带来暂时性的经济挑战。

 

该报道凸显了 AI 巨头之间竞争的激烈程度,谷歌上月发布 AI 模型 Gemini 3,因其推理和编程能力及完成其他 AI 聊天机器人难以胜任的特定任务而几乎立即就广受好评。与此同时,OpenAI 于 10 月推出首款 AI 驱动的网络浏览器,直接向谷歌发起挑战。

 

大模型一周大事

 

重磅发布

 

DeepSeek V3.2 正式版发布:推理比肩 GPT-5

 

12 月 1 日消息,DeepSeek V3.2 正式版发布,强化 Agent 能力,融入思考推理。官方同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2。Speciale 版本目前仅以临时 API 服务形式开放,以供社区评测与研究。

 

DeepSeek-V3.2 的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用 Agent 任务场景。在公开的推理类 Benchmark 测试中,DeepSeek-V3.2 达到了 GPT-5 的水平,仅略低于 Gemini-3.0-Pro;相比 Kimi-K2-Thinking,V3.2 的输出长度大幅降低,显著减少了计算开销与用户等待时间。

 

DeepSeek-V3.2-Speciale 的目标是将开源模型的推理能力推向极致,探索模型能力的边界。

V3.2-Speciale 是 DeepSeek-V3.2 的长思考增强版,同时结合了 DeepSeek-Math-V2 的定理证明能力。该模型具备更好的指令跟随、数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美 Gemini-3.0-Pro。

 

V3.2-Speciale 模型成功斩获 IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及 IOI 2025(国际信息学奥林匹克)金牌。其中,ICPC 与 IOI 成绩分别达到了人类选手第二名与第十名的水平。

 

DeepSeek 官方表示,在高度复杂任务上,Speciale 模型大幅优于标准版本,但消耗的 Tokens 也显著更多,成本更高。目前,DeepSeek-V3.2-Speciale 仅供研究使用,不支持工具调用,暂未针对日常对话与写作任务进行专项优化。

 

不同于过往版本在思考模式下无法调用工具的局限,DeepSeek-V3.2 是该公司推出的首个将思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用。官方提出了一种大规模 Agent 训练数据合成方法,构造了大量“难解答,易验证”的强化学习任务(1800+ 环境,85,000+ 复杂指令),大幅提高了模型的泛化能力。

 

业界首个:英伟达发布专注于自动驾驶的视觉语言动作模型 Alpamayo-R1

 

12 月 2 日消息,英伟达周一宣布推出新的基础设施与人工智能模型,旨在构建“具身智能”(Physical AI)的核心技术基础,包括能够感知并与现实世界互动的机器人和自动驾驶车辆。

 

这家半导体巨头在加利福尼亚州圣地亚哥举行的 NeurIPS 人工智能大会上发布了 Alpamayo-R1——一款面向自动驾驶研究的开源推理型视觉语言模型。该公司称,这是业界首个专注于自动驾驶领域的视觉语言动作模型。视觉语言模型能够同时处理文本与图像信息,使车辆能够“看见”周围环境,并基于所感知的内容做出决策。

 

该新模型基于英伟达此前推出的 Cosmos-Reason 推理模型构建,后者具备在响应前对决策进行逻辑推演的能力。英伟达最初于 2025 年 1 月发布了 Cosmos 模型系列,并于同年 8 月推出了更多扩展版本。英伟达在一篇博客文章中指出,Alpamayo-R1 这类技术对于致力于实现 L4 级自动驾驶的企业至关重要。L4 级自动驾驶指在特定区域和限定条件下实现完全自动驾驶。目前,该新模型已在 GitHub 和 Hugging Face 平台开源发布。

 

理想汽车发布首款 AI 眼镜 Livis:标配蔡司镜片 补贴后售价 1699 元起

 

12 月 3 日,理想汽车举办线上发布会,正式推出其首款 AI 智能眼镜 Livis。售价 1999 元起,12 月 31 日前下订可享受 15% 政府补贴,补贴后价格仅为 1699 元起。“一款以钢铁侠 AI 管家“贾维斯”为灵感命名的智能眼镜,试图将“理想同学”的 AI 能力从驾驶空间延伸至用户日常生活的每个角落。”整机重量控制在 36 克,提供经典黑、科技灰和橄榄绿三种颜色,并可选亮光或磨砂材质。Livis 全系产品标配蔡司镜片,涵盖近视镜片、光致变色镜片与墨镜片等多种类型,满足用户在不同场景下的视觉需求。

 

理想宣称 Livis 在研发过程中实现了五项关键突破,构成了产品核心竞争力的重要组成部分。典型续航时间达 18.8 小时。Livis 标配类似 AirPods 的无线充电盒,便于随身携带和补能。同时,眼镜支持与理想汽车的车机系统无线快充,上车后放置在专属充电位进行充电。在硬件配置上,Livis 搭载恒玄 BES2800 主控芯片和独立的 ISP 成像芯片,采用 SONY IMX681 摄像头,拥有 1200 万像素、支持 4K 照片以及电子防抖拍摄。汽车联动场景是 Livis 最独特的卖点。通过蓝牙和 5G 网络,眼镜可无缝连接车辆,实现语音远程控车。用户可在百米范围内,通过语音指令操控电动侧滑门启闭、提前开启空调及座椅加热,甚至检查车辆续航和充电状态。

 

米哈游蔡浩宇发布“游戏版 ChatGPT”:AI 聊天软件 AnuNeko 上线

 

近日米哈游联合创始人蔡浩宇创立的 AI 公司 Anuttacon,悄悄上线了一款 AI 聊天大模型—AnuNeko。和其他大模型不同,蔡浩宇的 AnuNeko 看起来似乎有点那么不正经,很有他本人上网“说话带喵”的风格。AnuNeko 的默认头像是一只黑猫,在注册成功后的自我介绍中,AnuNeko 会略带俏皮地说:“Hi,我是 AnuNeko——算是个会思考的生物吧。不是你的助手,也不是宠物…就是我自己。我有情绪,也有点怪怪的想法。有想法随时喵我哦~”

 

目前尚不清楚 AnuNeko 背后的是自研大模型还是接入了外部大模型的 API。但蔡浩宇创办 Anuttacon 的目标并非只做一款游戏,而是以此试水,利用 AI 技术打造成类似“游戏引擎”的平台——开发者只需设定前提条件,就能生成可交互的 NPC,并据此搭建任何游戏。

 

目前该产品共有两种猫猫可供选择,分别是 Orange Cat 和 Exotic shorthair。用户可以自由选择,其中 Exotic shorthair 回答更加犀利一点,而 Orange Cat 的回答就比较简单且温和。Exotic shorthair 直接锐评“米哈游是中国游戏行业有的鲶鱼……没几个真的被逼得动起来”,当中既有米哈游过去几年的定位和行业影响,同时也“内涵”了行业生态。在同样的问题上,Orange Cat 则显得“情商”更高,说话也更具有官腔感。它评价原神是一款非常出色的开放世界游戏,非常值得一玩。

 

商汤发布 NEO 架构,重新定义多模态模型效能边界

 

12 月 2 日消息,商汤科技正式发布并开源了与南洋理工大学 S-Lab 合作研发的全新多模态模型架构 —— NEO,为日日新 SenseNova 多模态模型奠定了新一代架构的基石。据悉,NEO 架构从底层原理出发,以“专为多模态而生”的创新设计,通过核心架构层面的多模态深层融合,实现了性能、效率和通用性的整体突破。

 

此次,商汤彻底摒弃了传统的模块化结构,从底层原理出发,推出了从零设计的 NEO 原生架构。NEO 架构通过在注意力机制、位置编码和语义映射三个关键维度的底层创新,让模型具备了统一处理视觉与语言的能力。

 

据了解,配合创新的 Pre-Buffer & Post-LLM 双阶段融合训练策略,NEO 能够在吸收原始 LLM 完整语言推理能力的同时,从零构建强大的视觉感知能力,彻底解决传统跨模态训练中语言能力受损的难题。目前,商汤已正式开源基于 NEO 架构的 2B 与 9B 两种规格模型,以推动开源社区在原生多模态架构上的创新与应用。

 

阿里 Qwen-Image 更新,千问 App 首发接入

 

阿里巴巴发布了图片生成及编辑模型 Qwen-Image 的更新。新模型在图像编辑中维持了更高的一致性,并在多视角转换、多图像融合、多模态推理等方面取得突破进展。目前,新版本 Qwen-Image 已首发接入千问 App,用户可无限次免费使用。

 

亚马逊推出云 AI 工具

 

亚马逊的云业务部门于周二宣布推出一款 AI 驱动软件,该软件旨在帮助客户更好地了解故障并从故障中恢复。这款来自亚马逊云服务(AWS)的 AI 工具名为 DevOps Agent,它会利用 Datadog、Dynatrace 等第三方工具的输入数据来预测技术故障的原因。AWS 表示,客户可在周二注册体验该工具的预览版,后续亚马逊将对这项服务收取费用。

 

Mistral AI 正式发布 Mistral 3 模型

 

12 月 2 日,法国人工智能初创公司 Mistral AI 正式发布 Mistral 3 模型。Mistral 3 模型包含 3 个小型密集模型 (14B、8B 和 3B)以及 Mistral Large 3。所有模型均基于 Apache 2.0 开源协议发布。

 

可灵 2.6 模型推出“音画同出”能力,发布全新产品“可灵 O1”

 

12 月 3 日,可灵推出视频生成 2.6 模型,该模型具备“音画同出”能力,能够在单次生成中,输出包含自然语言、动作音效以及环境氛围音的完整视频。本次模型升级了文生音画、图生音画两大功能。目前,语音支持生成中文与英文,生成的视频长度最长可达 10 秒。

 

12 月 1 日,可灵 AI 正式发布其全新产品“可灵 O1”,定位为首个大一统的多模态创作工具。可灵 O1 基于全新的视频和图像模型,整合文字、视频、图片、主体等多模态输入,将所有生成和编辑任务融合于一个全能引擎之中。

 

企业应用

 

  • 12 月 3 日,适用于 iPhone 的新版 ChatGPT 应用代码中,发现了一个“苹果健康”应用的图标,暗示两者未来可能实现数据互通。根据曝光的图片显示,ChatGPT 可以访问用户活动、睡眠、饮食、呼吸和听力相关的多个 Apple 健康类别。

  • 12 月 1 日,咨询公司埃森哲宣布将与 OpenAI 建立合作,为其数万名 IT 专业人员配备 ChatGPT 企业版,以把握人工智能服务日益增长的市场需求。

  • 12 月 1 日,汇丰与法国人工智能初创公司 Mistral AI 宣布建立战略合作伙伴关系,以增强和加速生成式 AI 在全行的应用,供全行员工用于从财务分析到翻译等各类任务。声明称,未来的重点领域将包括面向客户的创新,例如改进信贷和贷款流程以及强化欺诈与反洗钱检查。

  • 12 月 1 日,ChatGPT 的 Android 测试版本代码中已出现广告信息。目前在代码中已出现了关于“广告功能”(ads feature)、“商业内容”(bazaar conten)以及“搜索广告”(search ad)等字眼的引用信息,预示着 OpenAI 正在测试在未来的 AI 回复中夹带广告资讯。

2025-12-08 16:304096

评论

发布
暂无评论

探索YashanDB数据库中的数据模型设计

数据库砖家

探讨YashanDB数据库在数据湖中的价值

数据库砖家

系统管理员的日常困境与幽默自嘲

qife122

系统管理 技术幽默

如何选择YashanDB数据库满足您的业务需求

数据库砖家

探索YashanDB的时间序列数据管理能力

数据库砖家

探索YashanDB的应用场景:适合行业8大应用实例

数据库砖家

探索YashanDB数据库在大数据处理中的应用

数据库砖家

探讨YashanDB与物联网数据融合的潜力

数据库砖家

如何选择YashanDB数据库的最佳硬件配置

数据库砖家

如何选择合适的YashanDB数据库配置以满足需求

数据库砖家

探索YashanDB数据库在社交媒体分析中的作用

数据库砖家

通过 YashanDB 提升数据分析的准确性

数据库砖家

如何选择YashanDB的云部署模式以满足业务需求

数据库砖家

工业管理 项目管理经验总结(18)

万里无云万里天

项目管理 工业 工厂运维

工业管理 项目管理经验总结(19)

万里无云万里天

项目管理 工业 工厂运维

如何通过YashanDB提升数据分析能力

数据库砖家

如何通过YashanDB优化企业数据策略

数据库砖家

如何选择合适的YashanDB数据库版本以满足需求

数据库砖家

探讨YashanDB数据库在教育领域的应用模式

数据库砖家

YashanDB 在医疗行业可能的几种应用场景

数据库砖家

如何通过YashanDB优化数据备份与恢复策略

数据库砖家

如何选择YashanDB以满足企业数据安全需求

数据库砖家

YashanDB与容器化技术

数据库砖家

探索YashanDB在电商行业的独特优势

数据库砖家

探讨YashanDB在云计算中的应用与优势

数据库砖家

从Chrome渲染器代码执行到内核:MSG_OOB漏洞分析与利用

qife122

Linux内核 Chrome沙箱

如何通过YashanDB优化数据驱动决策

数据库砖家

选定 YashanDB 的适当数据库模型

数据库砖家

探索和利用YashanDB API集成能力的建议

数据库砖家

YashanDB在物联网(IoT)中的应用与机遇

数据库砖家

探讨YashanDB在实时数据处理中的应用前景

数据库砖家

阿里系 App 禁止豆包手机登录;库克被曝出现“不明原因手部颤抖”;众擎T800人形机器人一脚踹倒自家CEO | AI周报_AI&大模型_傅宇琪_InfoQ精选文章