“AI 技术+人才”如何成为企业增长新引擎?戳此了解>>> 了解详情
写点什么

苹果发布革命性的操作系统 visionOS:这是从“sudo”到“Siri”的改变

  • 2023-06-06
    北京
  • 本文字数:3052 字

    阅读完需:约 10 分钟

苹果发布革命性的操作系统visionOS:这是从“sudo”到“Siri”的改变

今天,在一年一度的 WWDC 全球开发者大会上,苹果发布了一款名为 Vision Pro 的头显产品,这是 Tim Cook 自 2011 年上任以来,继 Apple Watch 之后的第二个主要产品线扩展。

 

Tim Cook 告诉听众:“这一天我们期待已久。” “我相信增强现实是一项深奥的技术。将数字内容与现实世界融合可以解锁前所未有的体验。”

 

“Vision Pro 是一种新型计算机。这标志着计算新时代的开始。”“Mac 带来了个人计算,iPhone 带来了移动计算,而 Apple Vision Pro 为我们带来了空间计算。”

 


Apple Vision Pro 足够轻薄,外形酷似滑雪护目镜,还具有一个外向显示屏,可以通过 EyeSight 系统显示眼球运动和面部表情。当用户正在通过 Vision Pro 查看内容时,显示屏会出现光环闪烁,向其他人表明这位用户正沉浸在 AR 世界中。但当任何人或物体进入视线之内,Vision Pro 会将其聚焦。 

 


苹果表示, Vision Pro 是苹果数十年高性能、移动和可穿戴设备设计经验的结晶,最终造就了 苹果有史以来最雄心勃勃的这一产品,它可以改变沟通、写作、工作、娱乐等场景。

 

Vision Pro 售价 3499 美元(约 24860 元人民币),将于明年上市。

 

革命性的操作系统

 

正如 iPhone、iPad、Mac 和 Apple Watch 一样,Apple 硬件性能的好坏取决于它所基于的操作系统。为了匹配 Vison Pro,苹果今天也发布了与之相配的操作系统 VisonOS,称之为“世界上第一个空间操作系统”。

 

visionOS 建立在 macOS、iOS 和 iPadOS 的基础上,包括了 iOS 和空间框架、多应用 3D 引擎、音频引擎、专用渲染器子系统和实时子系统。在架构层面,visionOS 与 MacOS 和 iOS 共享核心模块,新增加的“实时子系统”,用于处理 Apple Vision Pro 上的交互式视觉效果。

 


visionOS 具有全新的三维界面,让用户在物理世界中看到并感受数字内容。新的三维界面将应用程序从传统显示器的边界中解放出来,让它们可以以不同的比例并排显示,通过动态响应自然光和投射阴影,它可以帮助用户了解比例和距离。

 

与其他 AR/VR 操作系统不同,visionOS 真正改变了用户操作 Vision Pro 的方式。苹果无控制器输入系统消除了对任何额外硬件组件的需求。要与 UI、应用程序或其他操作系统组件进行交互,你可以通过简单地注视、轻敲手指或使用语音指令来浏览应用程序。

 

具体来说,首先你只需要看向虚拟空间中的应用程序或按钮。然后将手指悬停在空中,Vision Pro 将毫无延迟地响应你的手势。

 


为此,苹果在机身上放置了 12 部摄像头、5 个传感器和 6 个麦克风组成的传感器阵列,捕捉动作,让用户无需遥控器或者手柄,就可以通过眼神的挪动,手指的开合以及语音指令与 Apple Vision Pro 进行交互。

 

visionOS 还包含两个 4K 分辨率的微型 OLED 屏幕(每只眼睛 5120x4096?每只眼睛的像素比 4K 电视还多!)将 12 个摄像头、三块屏幕(加上外向显示屏)集中在同一个设备上,实际上是一个前所未闻的产品设计方式。Apple Vision Pro 还用了一颗 R1 芯片,解决画面的延迟和抖动问题,R1 可在 12 毫秒内将新影像串流至显示器,比眨眼还要快 8 倍。

 

而要让这么多硬件联动起来发挥出作用,让计算变得无处不在,背后的操作系统必须同样优秀。Apple 技术开发副总裁 Mike Rockwell 说,“通过硬件和软件的紧密集成,我们设计了一款紧凑型可穿戴外形的独立空间计算机,这是有史以来最先进的个人电子设备。”

 

更为夸张的是,苹果还将机器学习融入到了产品中。根据苹果的一位前设计师发布的推文,我们还可以看出 Vision Pro 并不是简单地响应,它还会进行“预测”:

 

“最酷的结果之一是会用户实际行动之前预测用户会点击某些东西。这是一项艰巨的工作,也是我引以为豪的事情。你的瞳孔在你点击之前会做出反应,部分原因是你自己会预测在你点击之后发生的事情。因此,苹果可以通过监视用户的眼睛行为,并实时重新设计 UI 以创建更多这种预期的瞳孔反应,从而创建用户大脑的生物反馈。这是一个通过眼睛进行的粗糙的脑机接口,但非常酷。”

 



截图来源:https://twitter.com/sterlingcrispin/status/1665792422914453506

 

同时,该操作系统也一样注重安全和隐私,系统中融入了一种新的安全身份验证系统 Optic ID,可在各种不可见的 LED 光照射下分析用户的虹膜,然后将其与受 Secure Enclave 保护的注册 Optic ID 数据进行比较,以立即解锁 Apple Vision Pro。用户的 Optic ID 数据已完全加密,应用程序无法访问,眼动追踪信息也不会与 Apple、第三方应用程序或网站共享。

 

换句话说,来自摄像头和传感器的数据在系统级别进行处理,应用程序无法使用,这意味着它们无法秘密捕捉用户的周围环境。

 

就像 Tim Cook 所说的,Vision Pro 定位是一台全功能“新型计算机”,这个和 Quest 等产品“头戴显示器”本质不同,所以会有前置摄像头拍 3D 视频这样的惊艳应用,也才有虹膜识别这样的安全需求。

 

为开发者培育新市场

 

新操作系统的发布对 Apple 和开发者来说都是一个重要时刻。随着 Apple 发布这款新耳机,我们几乎肯定会看到大量开发人员开发应用程序,尝试利用新平台,希望成为下一个热门产品。

 

苹果表示,visionOS 将拥有一个全新的 App Store,人们可以在其中下载 Vision Pro 应用程序,而 Vision Pro 将能够运行“数十万熟悉的 iPhone 和 iPad 应用程序”。visionOS 支持第三方开发人员重新设计的 Apple 应用程序套件和体验,iPad 应用程序可以相对轻松地被移植到该平台上。

 

Apple 已经与多家媒体公司合作,将他们的产品和内容带入新的 Vision Pro 生态系统。迪士尼首席执行​​官 Bob Iger 宣布 Disney+ 从第一天起就可以在 Vision Pro 上使用。鉴于这款头戴式耳机从首次发布到上市之间的时间很长,我们预计会有更多的开发人员加入。

 

在发布时,visionOS 将提供来自 Adob​​e(特别是 Lightroom)、微软(Teams 和 Office)、思科(WebEx)Zoom 和其他主要开发商的应用程序——包括在 Vision Pro 上本地运行的 Unity 应用程序。

 

此外,该操作系统还能运行特定的教育应用程序。给我们印象最深的是一款用于查看人体渲染图的医疗软件。公告视频显示了人体心脏的分解图,包括心室和肺动脉。有一个工程应用程序可以帮助人们形象化某些物理现象,例如空气是如何流过赛车的。 

 


Apple 肯定希望它的新操作系统有朝一日成为 iOS 级别的主宰,成为一款未来的金钱“虫洞”。

 

这个能够同时运行多个应用程序,拥有 3D 引擎,让每只眼睛都拥有 5120x4096 高分辨率屏幕的全新软件平台,无疑能成功地吸引到开发者的关注。为这个平台重新设计现有的 iOS 应用程序将是开发者竞相尝试的下一件大事。一位 Linux 开发者对此激动评价道:“我迫不及待地想看看这会带来什么可能性。现在我需要收拾下震撼的心情并开始为这项未来技术做些储备。谁知道会不会在不久的将来,我只用小声说‘Siri’,而不再输入‘sudo’。”

 

参考链接:

https://www.apple.com/sg/newsroom/2023/06/introducing-apple-vision-pro/

https://twitter.com/edleonklinger/status/1665802712875769860

https://www.theregister.com/2023/06/05/apple_vision_pro/

https://escapebigtech.info/posts/wwdc2023/

https://www.theverge.com/2023/6/5/23749156/apple-wwdc-hey-siri-wake-word-voice-assistant

https://www.theverge.com/2023/6/5/23733874/apple-vision-pro-visionOS-augmented-reality-os-specs-wwdc-2023

https://developer.apple.com/visionOS/


延伸阅读:

开发者的好日子要来了?苹果即将在 iOS 17 迎来大变化

恐怖的挥霍速度,每年烧掉上百亿美元,元宇宙大梦“压垮”Meta,苹果出手能否改写颓局?

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2023-06-06 14:3412960

评论 3 条评论

发布
用户头像
最大问题是太贵了,不过没钱是我们的缺点。如果能1w多出头,那么真的是杀手锏
2023-06-12 13:21 · 广东
回复
用户头像
这个渲染是靠什么技术 ,前端有用武之地吗

2023-06-07 10:54 · 北京
回复
unity 3d 相关。肯定不是Web技术栈
2023-06-12 18:04 · 上海
回复
没有更多了
发现更多内容

Leetcode 题目解析:230. 二叉搜索树中第K小的元素

程序员架构进阶

算法 LeetCode Top K问题 10月月更

【Flutter 专题】26 易忽略的【小而巧】的技术点汇总 (四)

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 10月月更

爱奇艺ZoomAI获CCF科学技术奖科技进步杰出奖,技术创新焕新老片,助力经典传承

爱奇艺技术产品团队

as-if-serial &happens-before详解

Fox

happens-before JMM as-if-serial

智慧城市的成人礼:城市智能体带来的变革与机遇

脑极体

Android SDK设计规范与心得

轻口味

android sdk 10月月更

【架构实战营】模块九作业

Abner S.

#架构实战营

关于ToB产品与服务的一些思考

石云升

产品思维 职场经验 tob产品 10月月更

面试必备!2021金九银十阿里最新Java面试手册(全彩版)出炉

Java 程序员 架构 面试

人物访谈|扎根社区的工程师,月影的前端人生

字节跳动终端技术

字节跳动 大前端

IPFS矿机分币系统开发模板(现成)

趣讲快速排序的两种方法

Regan Yue

快速排序 10月月更

Go Switch - Go 中使用 Switch 的六种方式

baiyutang

golang 10月月更

项目开发中 9 个实用的JavaScript函数

devpoint

JavaScript 函数式 随机数 10月月更

【设计模式】第五篇 - 工厂方法模式

Brave

设计模式 工厂方法模式 10月月更

使用 Apache APISIX 进行集中式身份认证及进阶玩法

API7.ai 技术团队

开源 身份认证 API网关 Apache APISIX

鉴释人物丨专访解决方案负责人卜祥敏:直击业务痛点,赋能客户高效业务逻辑

鉴释

解决方案 业务逻辑 静态代码分析

多媒体应用设计师软考备考日记(一)

Changing Lin

10月月更

Android Studio IDE 插件开发

字节跳动终端技术

android 字节跳动 客户端开发 火山引擎

GK架构2 模6作业

Ping

APISIX 成为 Apache 项目两周年!

API7.ai 技术团队

开源社区 API网关 Apache APISIX

区块链是数字治理的平台

CECBC

模块(六)如何设计业务的微服务架构?

我是一只小小鸟

在线数字转大写金额工具

入门小站

工具

Prometheus 查询操作符(一) 二进制操作符

耳东@Erdong

Prometheus 10月月更

你真的会使用数据库的索引吗?

华为云开发者联盟

索引 查询 聚集索引

019云原生之Kubernetes主要功能

穿过生命散发芬芳

云原生 10月月更

Vue进阶(幺肆贰):elementUI 中 el-switch、el-radio 使用注意事项

No Silver Bullet

Vue 10月月更

linux之crontab使用技巧

入门小站

Linux

云原生训练营 20211017- docker作业

好吃不贵

那些值得称赞的 python 小亮点,断言,with 语句,格式化字符串,听我道来

梦想橡皮擦

10月月更

苹果发布革命性的操作系统visionOS:这是从“sudo”到“Siri”的改变_AI&大模型_Tina_InfoQ精选文章