AICon 深圳站 Keynote 嘉宾官宣!共探AI价值转化的实践路径 了解详情
写点什么

苹果分享 iOS 26 即将推出的 AI 基础模型的细节

  • 2025-08-04
    北京
  • 本文字数:1184 字

    阅读完需:约 4 分钟

大小:618.51K时长:03:31
苹果分享iOS 26即将推出的AI基础模型的细节

在最近的技术报告中,苹果公司提供了更多关于 iOS 26 新的苹果人工智能基础模型(Apple Intelligence Foundation Models)的性能和特性的详细信息,该模型是在最近的 2025 年全球开发者大会(WWDC)上宣布的。

 

苹果基础模型包括一个 3B 参数版本,优化后可在苹果 Silicon 设备上运行,另外,还有一个更大的模型,设计用来在苹果私有云计算平台上运行。苹果强调,这两个模型都是使用可信任的网络爬虫、授权语料库和合成数据进行训练的。进一步的训练阶段包括监管式微调和强化学习。

 

据苹果公司称,3B 参数模型旨在实现高效率、低延迟和最小化资源使用。相比之下,更大的模型旨在提供高准确性和可扩展性。苹果指出,鉴于其较小的规模,在设备上的模型不打算实现世界知识聊天,但可以支持高级功能,如文本提取、摘要、图像理解和仅用数行代码进行的推理。

 

在架构方面,3B 参数模型使用 KV 缓存共享,这是一种减少首次令牌时间(time-to-first-token)的技术,并通过 2 位量化感知训练(2-bit quantization-aware)进行压缩。苹果表示,模型被划分为两个块,它们之间共享键值缓存,这可以减少 37.5%的内存使用。量化感知训练是一种允许通过在训练时模拟 2 位量化的效果来恢复质量的技术:

与从权重 W 派生比例的传统量化方案不同,我们引入了一个可学习的缩放因子 f,它可以自适应地微调每个权重张量的量化范围。

 

对于服务器端模型,苹果使用了一种新颖的并行轨道混合专家(Parallel-Track Mixture-of-Experts,PT-MoE) transformer,结合了轨道并行性、稀疏计算和交叉的全局-局部注意力。它包括多个独立处理令牌的 transformer,每个都有自己的一套 MoE 层。苹果表示,并行令牌处理与 MoE 方法的结合可以减少同步开销,并允许模型更有效地扩展。

 

为了评估其基础模型,苹果研究人员依赖人类评分员来评估每个模型产生自然回应的能力。结果显示,设备上的模型在所有支持的语言中与相比 Qwen-2.5-3B 表现良好,并且在英语中与更大的模型如 Qwen-3-4B 和 Gemma-3-4B 相比,能够保持竞争力。更大的服务器端模型在与 Llama-4-Scout 相比中表现良好,但与更大的模型如 Qwen-3-235B 和 GPT-4o 相比则稍显不足。

 

对于图像理解,苹果采取了相同的方法,要求人类评估图像-问题对,包括文本丰富的图像,如信息图表:

我们发现苹果的设备模型在与更大的 InternVL 和 Qwen 相比时表现良好,能够与 Gemma 竞争,我们的服务器模型在推理 FLOPS 不到一半的情况下超越了 Qwen-2.5-VL,但落后于 Llama-4-Scout 和 GPT-4o。

 

最后,苹果研究人员强调了他们实现可信赖 AI 的方法,包括执行安全基线和护栏,以减轻有害模型输入和输出。这些保障措施也通过人类评估和自动评分的组合进行了评估。苹果还为开发者发布了应用负责任人工智能原则的教育资源

 

如前所述,苹果的人工智能基础模型需要 XCode 26 和 iOS 26,目前已经作为测试版软件提供。

 

原文链接:

Apple Shares Details on Upcoming AI Foundation Models for iOS 26

2025-08-04 12:001

评论

发布
暂无评论

【活动报名】11月19日 | AI GC 的技术与应用构建

亚马逊云科技 (Amazon Web Services)

人工智能 机器学习

Git 分支管理策略汇总

AlwaysBeta

git GitHub gitlab 分支管理

聚焦银行APP用户体验,易观千帆GX指数即将独家首发

易观分析

易观

1.6k Star!可以优雅的使用Git了。。。

Jackpop

Go-MySQL-Driver,让Go语言拥抱MySQL

闫同学

Go MySQL 11月月更

【愚公系列】2022年11月 微信小程序-app.json配置属性之networkTimeout

愚公搬代码

11月月更

定了,2022双11 技术进化开启新未来

阿里技术

双11

计算机网络:随机访问介质访问控制之令牌传递协议

timerring

令牌桶 11月月更

网址访问速度免费加速教程:又拍云cdn

程序员余白

网页加速 CDN加速 11月月更

Zebec Chain有望成为公链赛道新兴生力军,地平线计划持续进击

小哈区块

2022-11-11:设计一个最大栈数据结构,既支持栈操作,又支持查找栈中最大元素。 实现 MaxStack 类: MaxStack() 初始化栈对象 void push(int x) 将元素 x 压

福大大架构师每日一题

Java 算法 福大大

【LeetCode】分割数组Java题解

Albert

算法 LeetCode 11月月更

opensd开源啦 !这套自动化部署OpenStack工具你值得拥有

openEuler

开源 操作系统 openEuler OpenStack

涨姿势了,这 4 个场景可用 CSS 完全取代 JS ~

掘金安东尼

前端 11月月更

一款超好用的Json编辑工具

Jackpop

深入Redis数据结构和底层原理

闫同学

redis 缓存 11月月更

Zebec Chain有望成为公链赛道新兴生力军,地平线计划持续进击

西柚子

Java实现List中集合的元素进行排序

共饮一杯无

Java List 11月月更

Java Web(五)Web

浅辄

tomcat javaWeb 11月月更

初探Apollo远程服务配置中心

闫同学

阿波罗 11月月更 apllo 远程配置中心

类继承

Maybe_fl

SAP UI5 数据绑定中的工厂函数

汪子熙

SAP Fiori SAP UI5 ui5 11月月更

Vivado安装和使用

芯动大师

Verilog FPGA系统 vivado 11月月更

CSS的学习笔记(五)

lxmoe

CSS 前端 学习笔记 11月月更

汽车产业“芯事”何解?

易观分析

汽车芯片

Vue基础学习(五)

Studying_swz

Vue 11月月更

HTML零基础入门教程(一)

异星球的小怪同志

前端 HTML5, CSS3 DW 零基础 11月月更

算法题学习---链表中环的入口结点

桑榆

算法题 11月月更

部署和体验Helm(2.16.1版本)

程序员欣宸

Kubernetes Helm 11月月更

运维进阶训练营 -W03H

b1a2e1u1u

运维

Vue基础学习(四)

Studying_swz

Vue 11月月更

苹果分享iOS 26即将推出的AI基础模型的细节_AI&大模型_Sergio De Simone_InfoQ精选文章