从机器学习框架Core ML的发布,反观苹果的人工智能之路

2017 年 6 月 07 日

苹果全球开发者大会周一低调宣布将推出 Core ML,移动设备上的机器学习编程框架,可应用于 Apple 的如 Siri,Camera 和 QuickType 等产品上。它允许开发人员将训练好的机器学习模型加载到 iPhone 或 iPad 上,具有轻松集成机器学习模型的能力,使开发者能够使用几行代码构建具有智能功能的应用程序,涵盖从文本分析到面部识别的一切。同时苹果表示,iPhone 上的图像识别速度将比 Google Pixel 快六倍。

Core ML 有一个重要特性是在本地处理机器学习数据,而不会将用户信息发送到云端。在本地处理数据也会带来不少好处,如不需要网络连接,无需等待网络来回传递消息;因为数据不必离开设备,用户也因此能更好的获得隐私权益。但是这对内存和功耗的要求也就更高了。Core ML 建立在 Metal 和 Accelerate 底层技术之上,所以能无缝利用 CPU 和 GPU 来提供最高的性能和效率。

苹果不是唯一一家致力于将机器学习带入移动设备的公司。 Google 在几周前的 I / O 开发者大会上宣布推出新的 TensorFlow Lite 编程框架,让开发人员更轻松地构建运行在低功耗的 Android 设备模型。

使用该机器学习框架,开发人员必须将训练好的模型转换为兼容 Core ML 的特殊格式。然后将模型加载到 Apple 的 Xcode 开发环境中,并部署到 iOS 设备上。苹果发布了基于流行开源项目的四个预训练机器学习模型,并且还提供了一个转换器,以便开发人员自己移植。该转换器可用于 Caffe,Keras,scikit-learning,XGBoost 和 LibSVM 等框架。

Machine learning 这次 WWDC 年度开发者大会上,苹果一再提及机器学习(machine learning)以及相关 AI 术语。

苹果技术主管 Kevin Lynch 说,通过机器学习,个人助理软件 Siri 会更积极主动。

软件技术主管 Craig Federighi 强调 Safari 使用机器学习来智能阻止浏览器跟踪,还谈到先进的卷积神经网络改善了照片中的面部识别,并使 Siri 更加智能化,深度学习使 Siri 的声音更加自然。

硬件工程师 John Ternus 讲解了 Radeon Vega GPU 有助于机器学习功能,提高了苹果即将推出的 iMac Pro 的计算能力。

这次大会中,苹果的高管反复强调他们应用了机器学习,是想告诉我们什么?

Siri:苹果的人工智能之路 早在 2011 年,苹果作为首批面对消费者的人工智能公司,由联合创始人史蒂夫·乔布斯(Steve Jobs)宣布在 iPhone 上推出语音助手 Siri。直到现在,苹果才再次在 AI 领域上再次发出自己的有力声音。这几年来发生了一些什么事情?

苹果自 2011 年以来一直在培养 Siri,但直到去年 10 月才聘请卡内基·梅隆大学教授深度学习知名人物 Ruslan Salakhutdinov 为其首席 AI 研究主管。

苹果一度以严格的保密制度闻名,苹果的安全政策甚至延伸到博客、演讲安排甚至与配偶的对话等。一直以来,苹果都不对外公布自己的人工智能发展情况,“保密”的文化传统让苹果的人工智能研究进展变得神秘,但同时也给自己带来了麻烦:难以从学术圈招到人才。想要在学术圈获得知名度和认可,公开研究成果与大家进行交流是关键。在人工智能的浪潮下,一些巨头公司如 Google、Facebook 都有自己机器学习研究小组,并可发布论文。这些也造成了苹果在人工智能等方面的专利申请数量已被其主要竞争对手超越。

去年 NIPS 大会上,苹果新聘请的这位首席 AI 研究主管 Russ Salakhutdinov 才宣布允许其人工智能和机器学习研究员公开发布和分享他们的最新研究成果。并在 12 月,发布了第一篇人工智能研究论文:模拟 + 无监督方法改善合成图像质量(《Learning from Simulated and Unsupervised Images through Adversarial Training》)。

众所周知,AI 的发展需要收集和挖掘大量的数据,但苹果隐私保护文化让他们花费了相当多的资源在建立额外的隐私层级保护上。苹果一度高调宣称他们不像其他公司那样收集大量用户数据来进行用户画像。比如优化 Siri,必须收集和解读应用程序的数据,例如日历,餐厅预订,以及浏览。这个立场无疑使苹果在人工智能的赛跑中处于落后地位。

去年的 WWDC 大会上,苹果还特地讲解了他们的差异隐私项目(differential privacy)。软件技术主管 Craig Federighi 曾说:“需要明确的是,对于这些照片本身,其架构集以加密方式存储在云端,而元数据——包括用户创建的元数据以及我们深度学习后分类得出的元数据——同样经过加密,苹果无法进行读取“。

差异隐私基本思路是,如果大量用户输入某个实际上并不存在的单词,那么我们将不再将其视为拼写错误,甚至可能将其纳入拼写补全推荐。在这种情况下,我们希望全部客户都能够理解该单词,但我们又不希望知晓具体是哪位用户输入了该词。我们刻意回避这种将习惯与个人挂钩的信息。

但只要样本量充足,这种不相符的问题将自行得到解决。因此如果我们希望学习新出现的单词,我们会对其进行哈希处理,并从哈希中提取单一 bit,例如将其称为 1。与此同时,手机设备会对数据内容进行混淆,意味着即使其读取到的数据为 1,其也可能通过随机算法将其表达为 0。

苹果公司获得的数据正是这类混淆处理后的结果。但由于拥有充足的数据量,苹果方面仍然能够建立起宏观视角,并了解大规模群体表现出的真实倾向。具体来讲,苹果公司能够借此了解广泛用户的思维方式,但却无法具体将其与个人联系起来。

涉及个性化信息时,苹果公司的政策限制要求其只能在设备内部进行模型训练。数据匮乏问题也限制了基于个人的深度学习。根据 Jeff Dean 的说法,整套神经网络是由成千上万的参数构成,而非单纯参考设备内运行的信息。这种个性化能力的缺失是否致命?至少对谷歌而言是如此。谷歌在 2016 年 I/O 大会上发布了全面普及机器学习的战略,其中的典型方案就是 Google Assistant 个人 AI 服务。谷歌公司似乎希望将深度学习本身作为主要目标,而苹果则更倾向于利用这项技术打造更出色的产品。每支人工智能团队都需要决定其是否需要构建深度学习系统。这不仅是一项技术方案,更会带来道德层面的拷问。直到现在,苹果公司的思路显然提供了不同的实现模式

今年的 Siri 这次 WWDC 大会发布 11 款硬件升级,智能音箱 Homepod 作为库克隆重介绍的最后一款压轴产品,当为最大看点。除了播放音乐,Homepod 还是一个很好的家庭助理,可播报交通信息、新闻、天气、股票、发送信息等。而且,HomePod 与 HomeKit 高度集成,可以语音操控 Siri 控制整个智能家居设备。Siri 还会识别用户声音是否与 ID 相符,严格的保密隐私。

同时新版的 Siri 利用语音合成,听起来更自然。Siri 现在有了翻译功能,可以将对话直接进行翻译(口译),目前支持英语翻译中文、法语、德语、意大利语和西班牙语。 看起来苹果想将 Siri 放到所有的设备中,并希望 Siri 能更好的理解用户习惯,带来智能体验。

那么最后,苹果所做的这一切,将成为后发制人的人工智能企业吗?

2017 年 6 月 07 日 19:001480
用户头像
Tina InfoQ高级编辑

发布了 356 篇内容, 共 186.7 次阅读, 收获喜欢 853 次。

关注

评论

发布
暂无评论
发现更多内容

阿里聚划算5轮面试题:GC收集器、多线程锁、海量数据技术考核

Java架构之路

Java 程序员 架构 面试 编程语言

Java开发者必读的〈Java开发手册(嵩山版)〉灵魂15问,深究Java规约背后的原理。

Java成神之路

Java 程序员 架构 面试 编程语言

玛雅公约软件系统开发|玛雅公约APP开发

开發I852946OIIO

系统开发

架构师训练营 2 期 - 第八周总结

Geek_no_one

极客大学架构师训练营

一只支持凡尔赛文学创作的摄影手机

脑极体

FFmpeg使用基础(音视频开发入门)

赖猫

架构之书:雄心与《C++语言的设计与演化》

lidaobing

c++ 架构

刚参加完阿里P6面试归来(Offer已斩获),6点面试经验总结

Java架构之路

Java 程序员 架构 面试 编程语言

陪你手撕源码系列之 STL set 相关算法

herongwei

c++ 算法 set stl

架构师训练营 2 期 - 第 8 周命题作业

Geek_no_one

极客大学架构师训练营

Github上标星30K+的SpringBoot实战电商项目,简直不要太牛!

Java成神之路

Java 程序员 架构 面试 编程语言

什么?还不知道该如何学习微服务?这份Github上星标55.9k的微服务神仙笔记真的太香了!

Java成神之路

Java 程序员 架构 面试 编程语言

LeetCode题解:22. 括号生成,BFS,JavaScript,详细注释

Lee Chen

算法 LeetCode 前端进阶训练营

架构师系列9: 找出单向链表合并节点

桃花原记

2020的另一面:5G的斯普特尼克之年

脑极体

可能会重塑未来移动支付市场的格局

CECBC区块链专委会

货币

推进工业互联网和区块链创新发展

CECBC区块链专委会

区块链 互联网

架构师训练营 1 期第 12 周:数据应用(一)- 作业

piercebn

极客大学架构师训练营

架构师训练营 第八周作业

文江

《社会中的数据可视化》PDF免费下载

计算机与AI

数据可视化

架构师训练营第 12 周作业

netspecial

极客大学架构师训练营

2020年高频Java面试题集锦(含答案),让你的面试之路畅通无阻!

Java成神之路

Java 程序员 架构 面试 编程语言

架构师训练营第八周作业

丁乐洪

数字人民币红包迎战“双十二” 六大行钱包全接入

CECBC区块链专委会

数字人民币

Java内存模型JMM详细解析

云流

程序员 并发编程 架构师 java面试

真的爱了!这份阿里P8整理的《Java核心技术整理》新版手抄本,简直把所有Java知识操作都写出来了

Java成神之路

Java 程序员 架构 面试 编程语言

命令行搜索神器fzf

Rayjun

Linux

网络篇:朋友面试之TCP/IP,回去等通知吧

Crud的程序员

TCP 网络协议 IP

架构师训练营第三周”代码重构“作业

随秋

极客大学架构师训练营

架构师训练营第 1 期第 12 周学习总结

好吃不贵

极客大学架构师训练营

【第十二周】课后作业

云龙

从机器学习框架Core ML的发布,反观苹果的人工智能之路-InfoQ