【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

陆坚:海归博士的技术和苹果缘

  • 2012-03-22
  • 本文字数:6608 字

    阅读完需:约 22 分钟

【编者按】从对陆坚博士的采访开始,InfoQ 推出高端技术人系列访谈,这个访谈的目的是:

  • 发现高端技术人的驱动因素
  • 讲述高端技术人背后的故事
  • 展望高端技术人的希望未来

这个访谈的对象定位是:

  • 从事技术工作十年以上
  • 担任高级技术或管理职位
  • 对技术发展有深入的理解
  • 参与过重要软件产品或项目开发

对于该系列访谈,您有什么意见、建议,可以发送邮件到: editors@cn.infoq.com


陆坚,盛大多媒体创新院院长,酷 6 传媒首席多媒体科学家,拥有美国达特茅斯学院电子工程博士学位。陆坚曾就职苹果公司,在 8 年多的苹果职业生涯中,先后担任交互多媒体部资深研究员及专业视频工程部编解码技术主任工程师,领导了大型跨平台多媒体软件 QuickTime 中图像及视频压缩、流媒体、多媒体互动等技术的设计和开发,并被广泛用于苹果的多媒体软件,包括 Final Cut Pro、DVD Studio Pro、iMovie、iDVD、iPhoto 及 iTunes 。他还代表苹果公司参加国际标准化组织的影像编码专家组( JPEG )及运动图像编码专家组( MPEG ),开发制订图像和视频编码的国际标准。

他还是美国 Vobile 公司联合创始人,于 2005~2010 年任公司 CTO 。他发明并领导开发的 Vobile VideoDNA(影视基因)技术及相关产品是世界领先的媒体内容识别和管理系统,被美国好莱坞所有的电影电视制作厂商及中国的 CCTV 所采用。

除了在苹果公司工作多年的经历之外,他还是一个人所共知的老“果粉”,苹果所有的数码产品,他一应俱全,包括苹果当年推出的个人数字助理——“牛顿”。此外,他还收藏了很多珍贵的原版苹果产品海报。

图片说明:这是陆坚博士2011 年11 月在全球互动娱乐专家讲坛(GIEEF) 上的照片,背景板下方的照片,来自陆坚博士个人收藏的Think Different 系列苹果产品海报。(by:陆坚博士)

不久前,InfoQ 中文站专访了陆坚博士,请他讲述自己这些年来的技术成长之路。

1980 年入学的大学生

陆坚出生于上世纪 60 年代,在他上大学,选择人生未来走哪条路的时候,其实选择不多。80 年代初上大学,学习好的多半去学理工科,只有学习不好的才去学文科。陆坚还记得:“在统考或者模拟考试的时候,分数稍微偏低一些的同学,老师会安排他们去文科班。不像现在,非常多精英都是去学文科,去学法律,学经济。”

在陆坚看来,自己选择学工程技术方向,有几个原因。

首先是父母鼓励他学理工科。陆坚的父母并没有技术背景,都是文科出身。他们这一代人经历了文革等多次政治运动,对于意识形态方面的东西,比如文学艺术什么的,觉得都跟政治绑得比较紧,所以鼓励孩子去做相对比较单纯的技术工作。“在那个年代里头,不管是经济,还是法律,更多的还是跟政治的意识形态绑在一起。不像现在,有很多的定量经济学,现在去学经济的人,其实好多都是学数学出身,数学根底特别强的人。那会儿我觉得是不一样的,那会儿讲社会主义经济理论,还是跟现在很不一样”,陆坚说。

其次,当时在 80 年代,社会上有一种“科技救国”的思潮,“2000 年要实现四个现代化”就是当时的说法。一篇以陈景润为主角的报告文学——《哥德巴赫猜想》——为代表,鼓励社会上顶尖的人都去学理工,而且连工科都是稍微被人看轻的,最顶尖的人实际上都去学了理科,比如物理系、数学系、生物系,纯科学比工程技术更受推崇,在陆坚看来,这是那个时代的一个特点。他自己因为比较喜欢动手,所以就走上了学工科的道路,进入了浙江大学的机械工程系精密机械专业。

在浙大的几年时间里,陆坚受到很多工程方面的训练。到了大三之后,陆坚对计算机和编程产生了浓厚的兴趣,自己还主动上一些选修课。当时联合国教科文组织捐献给国内高校一批电脑,其中包括浙大。陆坚记得:那时候上机还要穿白大褂,还要预订上机时间。当时他使用的主要是 PDP-11 主机及其终端,用它们来做一些仿真实验,还会用 FORTRAN 和 Basic 语言开发与毕业设计相关的程序。也正是在这个时候,他与苹果电脑发生了缘分。

初识苹果电脑

“我最早认识苹果,就是苹果二型机(Apple II)。当时它作为微机,是没有放在机房里头的,就放在一般实验室里。杭州那地方很热,到了夏天,有些微机热得自己就停下来、不工作了,或者出很怪的现象。小的苹果机,放在实验室里,给我印象很深,在上面玩游戏特别好,也花了好多时间在上面玩儿。

“不过最终我还是回到编程上来了。那时的编程语言还是Basic。我当时对计算机确实是很感兴趣。我觉得从工业角度来说,计算机肯定是新兴的,而机械行业相对已经非常成熟。实际上我在做的时候,即使在机械行业里,像什么数控机床都是由计算机控制。后来浙大的机械系和计算机系联合提供CAD、就是计算机辅助设计这种课程等等。但是我对计算机本身,像算法和数据结构、操作系统这些基础的课,我特别感兴趣,对像什么堆栈处理、列表处理这些有非常强的兴趣”,陆坚博士回忆道。

1984 年大学毕业之后,陆坚尝试考取计算机专业的研究生,但是因为没有学过编译器一些专业性很强的课程,所以未被录取,转而考取了中国铁道科学研究院的电子工程专业研究生,从事控制系统设计。陆坚这样评价自己当时的经历:“在那个时代,想转行、转系是很难的事情。我转了一点,没有一下子跳到特别想去的计算机专业。不过我到后来还是很喜欢电子工程,其中也要用到不少计算机知识。我后来做的图象处理、视频处理,并不是完全就是计算机的事情,包括很多算法设计,跟计算机没有特别密不可分的关系。”

留学海外,进入美国国家实验室

1988 年,陆坚考取了美国常青藤联盟名校之一——达特茅斯学院的电子工程研究生,此后又读了信号和图像处理的博士学位。当时他研究的小波(wavelet)是很新的技术,早期的应用与雷达和声纳信号处理很密切,主要推动者是美国军方,研究基金也来自军方。此外,这种技术在MRI 和CT 等医疗成像方面也得到了应用。1993 年陆坚博士毕业后,美国宾夕法尼亚州大学医疗图像处理研究所为他提供了博士后的研究工作机会。不过,陆坚还是选择去加州大学戴维斯分校的图像处理中心做博士后研究。那时,他的很多工作还是与高精尖的国防项目有关。1995 年,陆坚进入了美国的 Lawrence Livermore 国家实验室,继续自己的研究生涯。

Lawrence Livermore 国家实验室属于美国能源部,与新墨西哥州的洛斯·阿拉莫斯实验室(Los Alamos)享有同等声誉。后者大家知道的更多,因为美国的核武器项目在里面。这些国家实验室,对保密性和安全性的要求非常高。陆坚这样介绍自己当时的经历:

“我当时进去的时候,刚毕业,而且是中国人,所以安全级别特别低。里面的工牌是分颜色的,我们戏称它跟交通信号灯一样,就是红、绿和黄,红的是停,绿的是通行,黄的是慢行。拿绿色工牌的人有最高的安全等级,每一个实验室、每一个楼他都能进去。而我进去的时候,拿的是红牌,就是大部分地方都是进不去的。这实际上也是我一年后离开的主要原因。

“这个国家实验室里面藏龙卧虎,有很多很牛的人和很多很有意思的项目。但是作为一个外国人,我当时能够接触的非常有限。比方说有的区域,它的规定是:如果你没有这个安全等级,有些地方你可以去,但是必须得有一个有绿牌的人陪着你才可能进去。以至于去听一个讲座,其实是非保密的讲座,而它又在保密区域里的会议室开,这就很麻烦。我要去,就还得找一个人问他能不能陪我过去。

“做了一年以后,我就觉得那不是一个特别舒畅的环境。当时是1995 年, Netscape 和雅虎上市,正是第一轮Internet 浪潮起来的时候,工业界的机会特别特别多,当时有很多面试机会。95 年底,苹果给了我一个Offer,96 年初,我就离开了那个国家实验室,去苹果工作。”

图片说明:这是一张在苹果成立30 周年时的照片,图中有两个Mac,一个是陆坚在达特茅斯学院上学时买的第一台电脑——Mac Classic,另一个是2006 年出的第一款使用英特尔处理器的Mac Mini。前者CPU 是摩托罗拉68000,主频8MHz,后者CPU 是英特尔双核T2300,主频1.66GHz,性能相差200 倍。(by:陆坚博士)

流连Mac 王国,让他选择了苹果

陆坚当时的电子工程专业,其实并不是苹果公司招聘的主要专业方向,以信号和图像处理作为博士研究的主要方向,也不是像苹果这样的电脑公司的主要产品方向。之所以选择苹果公司,而不是其他互联网公司,这还要从陆坚上的达特茅斯学院说起。

“在我80 年代末进去的时候,它实际上是一个苹果王国,学校内的Macintosh 占有率达到95%。当时要求每一个入学的新生一定要有个人电脑。学校里有AppleShare Network,可以做文件分享。那时候,老师留作业,分享讲义什么的,都放在文件服务器上。学生就可以去AppleShare 服务器上下载,那还是80 年代末90 年代初。这个学校几乎没有人用PC,也没有相关支持,如果要用PC,就像是个异类。当然80 年代末90 年代初的时候PC 还不太行,Mac 上已经有了成熟的图形操作系统,Windows 好像还是三点几的版本。

“其实我在中国的时候是只会IBM PC 的,但是到那儿以后一看,学校里只有几台孤零零的PC,然后都是Mac。而且Mac 也比较容易上手,没花多长时间自己玩儿玩儿,也不需要手册什么的,就会了。我在达特茅斯念书的时候,四五年都是用Mac。当时的主流计算设备是小型工作站,加上Mac 作为个人电脑。工作站提供大量运算,比方说当时的Sun、DEC、IBM 都有很多。那四五年里头,PC 完全就忘掉了,因为那是个Mac 王国。你要写个报告、画个图肯定都在Mac 上头。等于说我四、五年都在一个苹果的环境里面。有了苹果的这个Offer,觉得有一种亲切感。

“当然还有一个因素:苹果一向对教育市场很重视,对学生打折幅度很大。苹果的产品一般零售是不打折的,但是对学生可以打八折。”

进入苹果,完成职业转变

进入苹果工作,对陆坚来说, 是职业上的转变,让他从一个研究型的人,变成一个工程技术型的人。

“我个人把研究和技术还是分开来的。在进苹果之前,我基本上是一个研究员,做研究,写论文,开会是我的主要工作。进了苹果以后呢,开始也还做了一些这样的工作。但是越来越少,越来越少,最后纯粹就是产品和技术这部分,然后工程。”

在陆坚看来,很多读到了博士的人,以前出路多一些,因为以前还有很多大公司提供研究职位,比如贝尔实验室、IBM 研究中心,能在工业界让人去潜心去做研究,现在非常少,只有微软、Google 可能还有一些。其他的,比如惠普实验室等等,都更偏向于产品。

陆坚刚进苹果时,加入的部门是交互多媒体事业部(Interactive Media Group),该事业部是从苹果的更偏研究的部门——前沿技术事业部(Advanced Technology Group)分离出来的,。当时李开复担任该部门副总裁,不过在陆坚加入3 个月后,李开复就离开了。

加入苹果后的几年,陆坚的主要工作都与视频相关。首先是QuickTime。1991 年,QuickTime 第一版实现了在Mac 上的视频播放,是业界第一个不用硬件加速在桌面电脑上实现视频播放的软件,当时由于CPU 和硬盘的性能有限,最早的QuickTime 只能播放像邮票画面大小的视频。此后,QuickTime 一直就是苹果所有多媒体产品的底层技术和平台,包括现在的iTunes、iMovie、iPhoto 等等,多媒体的处理都是在其基础上。陆坚当时负责了视频和图片的编码压缩。后来,由于工作出色,陆坚代表苹果参加了几个国际标准的制订,包括JPEG 2000,和现在大家耳熟能详的MPEG-4。

2000 年时,陆坚离开苹果参加了一个与视频相关的创业公司。当时是 2000 年 3 月,互联网泡沫开始破灭,那会儿大家还不觉得那么困难。美国经济真正的困难在 9·11 以后。陆坚当时所在的公司资金断链,也融不到钱。恰逢他在苹果原来主管要组建一个新的产品组,所以陆坚在 2002 年又回到了苹果,进入专业视频工程部,更偏重产品,就是苹果的视频非线性编辑软件——FinalCut Pro,以及其他配套的专业视频软件,如 Motion、DVD Studio Pro。此外,苹果专业视频工程部的产品还包括做 3D 动画的 Shake。“好莱坞得奖的特技效果,十个里面十个都是用 Shake 做的。在这个专业设计领域,苹果在好莱坞也有很大的市场”,陆坚提到。

第二次在苹果,陆坚又待了 4 年多,到 2006 年,陆坚离开苹果,创办了 Vobile。

图片说明:在苹果公司工作的最后一天,陆坚博士在公司著名的门牌号前留影。

Vobile 创业,视频指纹技术令他自豪

Vobile 主要开发视频指纹和视频内容识别技术。他们的技术现在几乎被美国所有的视频内容出品方采纳,用以追踪盗版内容。这是让陆坚作为技术人非常自豪的一点。

在 Vobile 技术出现之前,从技术上说,对内容的识别和保护,主要是使用水印。当 Youtube 2005 年起来了之后,大家发现水印技术其实用处不大,因为可以被抹掉。这还不是最大的问题,最大的问题是很多内容在发行的时候,版权人没有在内容上打水印。比如,视频内容盗版有些是从 DVD 上 Rip 出来,有些是从电视上录下来。然后把内容上传到互联网上,整个这个过程,如果发行时内容上没有水印,盗版上传的内容也没有水印,后面根本没有办法靠水印来追踪。

“我们开发的指纹技术,不依赖往内容上加东西。我们从内容里面提取一些特征值作为指纹,所以只要有内容,内容本身就是它的符号。如果这个内容跟其他内容不一样,提出来的特征值就不一样,所以可以依赖指纹来识别内容。“当时美国电影协会 MPAA,公开在技术界寻找解决方案,各个公司可以提交技术解决方案,他们去做评测。我们正好抓住了这个机会,开发了指纹技术,把整个系统送到 MPAA 去做评测。参加评测的总共有 13 个公司,包括飞利浦、汤姆逊等大公司。结果,我们 Vobile 的技术被评为第一,是最好的。这从业务上就打开了大门,包括后来迪斯尼的投资。

“很多有名的电影工作室都用我们。MPAA 的评测报告相当于广电总局做了一个评测,盖了一个章说这是最好的技术,那么下面的自然会去用。华纳、迪斯尼、环球、维亚康姆,所有好莱坞的大公司,最后都是我们的客户。到今天,好莱坞已经完全采用这个指纹技术,现在美国出的每一部电视剧,每一个新电影,都会用我们的指纹系统去取一个指纹,把它存在库里,作为日后来识别这个内容的技术手段。

“从这点说,作为一个技术人来说,真正的满足:就是看到自己做的东西事实上真正变成了产品,被整个产业所采用。”

在 Vobile,陆坚潜心做到 2010 年,然后接受盛大邀请,回国展开新的故事。

回到盛大,比在硅谷做创业公司还忙

说到为什么要加盟盛大,陆坚解释道:

“有两个因素。第一,陈天桥、陈大年,他们这些中国民营企业家的个人魅力,是很重要的因素。他们有一些战略设想,跟他们谈过了以后,我很振奋。另外,从创业的角度上来说,在 2009 年底、2010 年初的时候,我也是想尝试一些新的移动互联网的东西。那时候跟有些朋友在一起讨论,觉得这个新的机会有点像 1995 年互联网刚起来的时候,机会非常非常好。

“我自己经历过一次创业以后,认为真正的创业是这样:一开始筛选的时候可能有十个项目,但最后,肯定就是全心去做一个项目,而且准备要做个三五年,要非常专注。你的投资人也希望你专注。等于所有的精力押宝在你认为最有可能成功的地方。每个去创业的人都认为自己最有可能成功,其实成功率很低。VC 选的时候,肯定也是选他觉得非常有希望成功的项目,他才给钱。但即使这样,成功率可能不到一成,投十个里头九个可能最后都是要失败的。

“我之所以觉得盛大这个机会好,是因为它给了我一个机会,可以在比较多的项目上尝试,孵化不只一个产品。因为我比较喜欢做开拓型的事情,如果有机会和资源去试好几种事情,对我是非常有吸引力的。

“如果还有第三个考虑,就是整个中国经济发展的吸引力。美国那边,在硅谷,移动互联网还是非常热的,也有非常多机会,但整体经济发展潜力肯定不如中国。”

图片说明:来到盛大创新院,陆坚博士有了实现自己开拓创业梦想的机会。

来到盛大还不到两年时间,陆坚认为当时公司给他的承诺还是兑现了。

“公司给了我自由度,尝试多方面的东西,现在确实也有一支团队能够来做。我一个人是不可能够同时尝试很多事情的,现在我的工作基本上是我确实想做的东西。不过一个人要同时做好几件事情肯定是很辛苦,我的感觉比在美国做一个创业公司还要更累。基本上晚上没有一点钟以前睡过觉,一直都在工作。”


陆坚博士如何看待苹果公司的项目管理和产品管理?苹果公司内部是否真的有那么多天才工程师?InfoQ 针对上述问题对陆坚博士进行了专访,不久后即将发布,敬请期待。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2012-03-22 22:174027
用户头像

发布了 479 篇内容, 共 152.4 次阅读, 收获喜欢 47 次。

关注

评论

发布
暂无评论
发现更多内容

C++ 中的 Pipeable 编程

hedzr

c++ pipeable

ndk-build 脚本

Changing Lin

8月日更

前端基础六之jQuery效果

ベ布小禅

8月日更

硬盘空间免费扩容了2TB!!!

Jackpop

从0开始的TypeScriptの十二:装饰器

空城机

JavaScript typescript 大前端 8月日更

网络攻防学习笔记 Day112

穿过生命散发芬芳

网络安全 8月日更

质量基础设施一站式服务平台搭建,NQI平台搭建

上游思维:谁来为没有发生的事情买单?

石云升

读书笔记 8月日更 上游思维

【Vue2.x 源码学习】第四十二篇 - 组件部分 - 组件挂载流程简述

Brave

源码 vue2 8月日更

架构训练营第 1 期 模块五作业

高远

服务发现机制SPI居然是破坏者!

4ye

Java 源码 后端 sping 8月日更

你可能不知道的css动画性能

云小梦

CSS layout requestAnimationFrame 重排和重绘 will-change

万企明道成立八周年,邀你书写留言!

明道云

MySQL 系列教程之(十)索引原理:B+ 树与索引

若尘

MySQL 数据库 8月日更

☕【Java技术指南】「并发原理专题」AQS的技术体系之CLH、MCS锁的原理及实现

洛神灬殇

AQS 8月日更 MCS锁 CLH锁

Python代码阅读(第15篇):列表求交集

Felix

Python 编程 Code Programing 阅读代码

帮小姐姐打分系统的模型创建,滚雪球学 Python 第三轮第 11 篇

梦想橡皮擦

8月日更

elasticsearch7.13.4 ik中文分词器安装

Rubble

8月日更

Go,一文搞懂 string 实现原理

微客鸟窝

Go 语言 8月日更

博客升级之在线代码编辑器

devpoint

vscode 编辑器 8月日更

仿TP钱包开发,去中心化钱包源码开发

批量SQL优化实战

码农参上

sql SQL优化 8月日更

腾讯良心了?!!!

Jackpop

程序员必备!5款小众高效的开发神器

Jackpop

Linux 虚拟文件系统(VFS)分析

赖猫

Linux 文件系统

先「干」,就对了

非著名程序员

个人成长 职场 认知提升 8月日更

fil币怎么挖矿?fil挖矿怎么挖?

fil挖矿怎么挖 fil币怎么挖矿

【Flutter 专题】61 图解基本 Button 按钮小结 (一)

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 8月日更

Go字符串拼接最佳实践

Rayjun

Go 语言

人工智能下的音频还能这样玩!!!!

Python研究者

8月日更

为什么要选择filecoin矿机挖矿?为什么不直接购买filecoin?

分布式存储 IPFS Filecoin fil挖矿 fil矿机

陆坚:海归博士的技术和苹果缘_Apple_郑柯_InfoQ精选文章