写点什么

硅谷华人技术大神:流行框架创始人、AWS 首席科学家,开源深度学习中文教材 | 二叉树视频

2019 年 10 月 10 日

硅谷华人技术大神:流行框架创始人、AWS首席科学家,开源深度学习中文教材 | 二叉树视频

他是硅谷华人技术大神,深度学习框架 MXNet 创始人之一;他在江湖人称“沐神",甚至被称作深度学习界的“米其林”。面对被冠以的这些称号,他却谦虚地表示:“比我厉害的人多的是,我不是大神。”他叫李沐,现任 AWS AI 首席科学家,近期在李沐回国的短短几天中,InfoQ 有幸对他进行了一次专访,了解李沐从学术界到工业界的精彩故事。


00:00 / 00:00
    1.0x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.5x
    网页全屏
    全屏
    00:00


    名校学艺

    上海交通大学 ACM 班,取名源于国际科学教育计算机组织——美国计算机学会(Association of Computing Machinery),ACM 是世界上第一个、也是最有影响的计算机组织,计算机领域最高奖——图灵奖是由该组织设立和颁发的。这寓意 ACM 班旨在培养计算机科学家。


    李沐的大学本科,就是在这样一个被寄予厚望的“特色班”里度过的。


    有意思的是,他当时只是对数学很感兴趣,高中的时候虽然参加过一些数学竞赛,可几乎没有接触过计算机。进到了这么一个培养计算机科学家的班里,他自己也有些拿不准:到底能不能搞定这个复杂的机器?


    ACM 班最大的特点在于注重实践,即使是在本科阶段,学生也需要手写大量的代码来练习,至少也是其他院校同院系实践量的四五倍。此外,ACM 班非常注重数学能力,这也给了李沐发挥所长的机会。


    不过,可不要觉得李沐的生活就此陷入了无边无际的“代码海洋”之中,“学霸”的生活并不枯燥,反而还充满了不少乐趣。据李沐的室友透露:那时的李沐不仅学习成绩好,还是篮球场上的一把好手,更是电竞场上的“大神级”人物。


    然而不久之后,戏剧性的一幕出现了:虽然踌躇满志进入了 ACM 班,并且报名参加了计算机竞赛,但是李沐最终因为训练的成绩不合格被刷了下来。


    这个时候,李沐遇到了他的导师:吕宝粮教授,也正是从那时起,李沐正式推开了人工智能的大门。


    AI 初探

    吕宝粮,上海交通大学计算机系教授、博士生导师,IEEE 高级会员。主要研究方向有:仿脑计算机理论与模型;机器学习理论与应用;神经网络理论与应用;生物特征识别;自然语言处理;脑与计算机界面。


    李沐第一次接触人工智能,就是被吕宝粮教授的一个案例震撼到了。


    “当时教授展示了一张他们实验室人员的合照,并用人脸识别系统把每一个人的名字都对应显示了出来,当时我们就被这个 demo 吸引住了,也就这样选择加入了这个实验室。”


    李沐的人工智能之路也就由此正式开始了。“本科阶段还有时间打球、打游戏,后来真的是一年比一年累,回想起来,在 ACM 班的经历就像是一个过渡期。”


    “过渡期”之后,李沐没有去找工作,而是选择到香港科技大学继续深造。李沐的选择是受到了 ACM 班定位的影响——培养计算机科学家,ACM 班也更鼓励人才去从事学术研究。


    “除此之外,当时的大环境也是影响我选择的一个原因。那是大概 2008 年左右,虽然当时计算机已经成了热门专业,但是当时的 IT 公司并没有那么厉害,尤其在 AI 方面的技术并没有那么强。”


    在港科大又修炼了一年多的内功之后,李沐开始了“初入江湖”的旅程。


    初入江湖

    在正式进入工业界之前,李沐已经在微软亚洲研究院“小试牛刀”了三个月左右。


    微软亚洲研究院被称为中国 IT 界的“黄埔军校”,这短短的三个月里,李沐也学到了很多东西:“最直接的感受就是接触了公司文化,比如公司的生活什么样、大家谈论什么话题、跟什么样的人打交道等等。”


    李沐真正开始与工业界亲密接触,是加入百度的那一年。


    那一年,本来已经拿到了美国的几个 offer,但是家人的身体情况让他选择留在国内,于是在师兄戴文渊的鼓励下,李沐进入了百度。


    在百度,李沐的主要工作是广告预测,利用广告数据有效地训练一个模型,使得该模型能够准确的预测用户会不会点某个广告。


    在百度的一年时间里,李沐积累了大量的经验,他也坦言,这些经验是在学校里学不到的:“学校的实验环境里,也许只能用到几块 GPU,跑几个 G 的数据。而在企业里,你面对的是几个 T 的数据量和上百台机器,在这种情况下,你不得不去考虑如何做分布式,或者如何让代码和系统变得更快、更简洁。”


    再读博士

    一年后,李沐再次踏上了求学之路。“在百度的经历让我学到了很多,也更清楚地发现了自己的短板。但是当时国内做系统方向的人比较少,所以我还是选择了去美国继续攻读博士。”


    “不过,这只是一个原因。”


    另一个原因是:李沐在香港学习期间,遇到了现在的妻子,她被 MIT 录取,为了不忍受异地恋的辛苦,李沐毅然决然选择同去美国。


    “其实她才是真学霸。”李沐笑道。


    那么问题来了,既然要去美国,选择哪所学校呢?李沐当时很坚定的选择了两所学校:一个是妻子所在的 MIT,另一所是离 MIT 最近的 CMU(卡内基梅隆大学)。


    他最后被 CMU 录取,在美国开始了事业爱情两开花的生活。


    在这段时间里,他在国内的好友们,如戴文渊、余凯等人纷纷创业,受到他们的影响,李沐在博士期间与导师、同学一共五个人,也体验了一把创业。


    当时的创业项目是与社交媒体相关的,幸运的是,在公司成立后不久就得到了不少大客户的青睐,其中一位大客户看中了他们的项目,就一口气把整个公司买了下来。不过后来由于经营理念的不同,李沐等人选择了退出,这场创业之旅就这么短暂结束了,但是创业带来的经验却可以受用一生。


    从学术界到工业界,再到创业,李沐总结了这样的经验:“在学术界,当你有一个想法,马上就可以开始操作,并且只需要把想法实现,大概完成 90% 的工作就好;而在工业界,想法不是最重要的,重要的是要把想法落地,剩下的那 10% 的工作才是最重要的,甚至可能会花费你 90% 的精力。”


    而创业,需要考虑的事情就更复杂了,除了要思考如何把想法落地,还需要考虑团队的合作、人员的调配,要决定团队的发展方向,分析整个工业环境的发展趋势等等。


    在 CMU 又度过了 5 年的博士时光,李沐再次走上了求职路,而他与亚马逊的缘分也就此开始了。


    重出江湖

    李沐初到亚马逊时,人工智能部门刚刚成立,正是需要深度学习框架来支持的时候,李沐的经验正好派上了用场。


    除了 MXNet,李沐也参与了一些别的项目。“框架只是一个工具,更重要的是要知道如何用好工具来服务客户。”分布式系统出身的李沐感慨道:“分布式系统最难的不是如何让每个机器计算的多快,而是机器之间的通讯问题,如何减少通讯提升交互效率,这对系统来说也是至关重要的。”


    重出江湖的李沐早已不再是之前稚嫩的模样,在面对项目的时候,他也需要考虑项目组之间的交互问题,如他所言:亚马逊也像是一个巨大的分布式系统,部门与部门之间的交互就像机器之间的通讯一样。但是人之间的联系并不像机器那么好优化,一旦协作不畅,很容易使项目陷入瓶颈。这些都是李沐之前不曾考虑过的问题,也是李沐不断进步的动力。


    授人以渔在学术界和工业界来来往往多年之后,李沐把目光看向了国内:中国的人工智能开始初发萌芽。问题也随之而来:AI 虽然火,但是门槛太高,不少企业与个人想学习而不得法,层出不穷的培训班也良莠不齐,一些培训课程虽然能够让学生快速上手,但是却也只能解决短期的问题,并不能有益于长远发展。


    于是,李沐为自己重新规划了使命:授业解惑,让更多的用户了解 AI、学习 AI、使用 AI,让人工智能的生态圈在国内扩大。


    2017 年,他在国内开办了线上深度学习培训班,零基础入学,引发了狂热的报名浪潮。“当时非常令我们受触动的一点是:除了在校的学生、IT 从业者之外,还有很多非 IT 行业的人来学习,并且真的收获了不少知识。”


    授人以渔,这似乎成为了李沐的新目标,他随后出版的交互式书籍《动手学深度学习》也是为了实现这一目标而撰写的。


    面对国内网友给他冠以的“AI 大神”称号,李沐淡然一笑:“比我厉害的大神多的是,我不是大神。”李沐说,中国人工智能领域还有很多真的“大神”级别人物正在研读论文、默默实践,他们的很多成就其实并不为人所知,中国在世界各地读书的学生们也都发表过不少优秀的论文。


    “大神之虚名非我所愿,授人以渔乃是初心”。


    00:00 / 00:00
      1.0x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.5x
      网页全屏
      全屏
      00:00


      2019 年 10 月 10 日 15:471807
      用户头像
      二叉树视频 InfoQ旗下短视频品牌

      发布了 98 篇内容, 共 22.7 次阅读, 收获喜欢 160 次。

      关注

      欲了解 AWS 的更多信息,请访问【AWS 技术专区】

      评论

      发布
      暂无评论
      发现更多内容

      盘点2020| 开启小马哥的新未来

      小马哥

      盘点2020

      跨越全场景统一架构三大挑战,MindSpore亮出“四招”

      华为云开发者社区

      深度学习 联邦学习 mindspore 算子 ai框架

      研发管理101军规#003 实战规模化敏捷:从8人到百人的敏捷之路

      PingCode

      程序人生 Scrum 敏捷开发

      Java 异常处理

      学个球

      Java java异常处理

      Serverless 在 SaaS 领域的最佳实践

      Serverless Devs

      Serverless 云原生 SaaS

      科技赋能传统产业:工业绿色可视化—核电站工艺流程组态仿真

      一只数据鲸鱼

      物联网 数据可视化 组态软件 绿色工业 核电站

      APICloud的发展和应用

      anyRTC开发者

      ios android 跨平台 sdk APICloud

      我以为自己够牛逼了,直到看到了Alibaba专家的面试笔记,我学习了三个月,却入职京东,税前36K

      Java架构之路

      Java 程序员 架构 面试 编程语言

      electron实战练习-三个文件实现一个命令行终端

      OBKoro1

      node.js Electron electron实战 命令行终端 electron学习

      看图学NumPy:掌握n维数组基础知识点,看这一篇就够了

      华为云开发者社区

      Python 机器学习 数组 Numpy

      林昊获中国计算机学会杰出工程师奖,阿里中间件再获高度肯定,“三位一体”推动技术普惠

      阿里巴巴云原生

      阿里巴巴 阿里云 开发者 云原生 中间件

      新鲜出炉!阿里内部开源SpringCloud Alibaba全解(全彩版)全网首发

      Java架构追梦

      Java 架构 面试 学习笔记 SpringCloud Alibaba

      如何对AD和Exchange进行安全加固满足护网需要?

      嘉为蓝鲸

      安全 asm AD 邮件系统 权限

      毕业3年,月薪从10K到30K,万分感慨 “数据结构与算法真实太TM重要了!”

      Java成神之路

      Java 程序员 架构 面试 编程语言

      太牛了,Alibaba出品的这份《Java并发编程实践》文档,每一步操作都直击你的内心!

      Java成神之路

      Java 程序员 架构 面试 编程语言

      快速入门案例实战:电商网站商品管理(一)

      escray

      elasticsearch elastic 28天写作 死磕Elasticsearch 60天通过Elastic认证考试

      快抛弃你错误的坚持

      石君

      生活随想 28天写作

      从美国《拜杜法案》到中国供应链体系形成的内在逻辑

      JiangX

      供应链 28天写作 制造

      重学JS | 异步编程 Generator()

      梁龙先森

      前端 编程语言 面试题 28天写作

      高频量化交易机器人系统开发|高频量化交易机器人APP软件开发

      开發I852946OIIO

      系统开发

      再造淘宝电商项目落地,从零开始搭建亿级系统架构笔记,直接让你拥有高并发设计经验!

      Java成神之路

      Java 程序员 架构 面试 编程语言

      工业传感器:工业互联网的第一道门

      浪潮云

      工业互联网

      mysql字符串字段索引优化

      瞌睡的李先生

      MySQL 索引

      软件测试--selenium安装使用

      测试人生路

      软件测试

      宝藏!Github上标星45K+的《Java核心神技笔记整理》,吃透消化,面试跳槽不心慌!

      Java成神之路

      Java 程序员 架构 面试 编程语言

      太牛了!Alibaba架构师耗时72天总结整理的700页Java进阶架构师宝典。

      Java成神之路

      Java 程序员 架构 面试 编程语言

      阿里P8内部架构核心学习知识笔记在各大互联网上流传,限时开放下载

      Java架构之路

      Java 程序员 架构 面试 编程语言

      2020DevOps状态报告——变更管理

      禅道项目管理

      DevOps 运维 开发 趋势 自动化测试

      顶级!13位专家力荐Spring5为企业级开发提供一站式方案

      996小迁

      Java spring 编程 架构 面试

      阿里中间件团队技术官手撸笔记,全新演绎“Kafka部署实战”,已开源

      Java架构之路

      Java 程序员 架构 面试 编程语言

      Java 程序经验小结:用私有构造器或者枚举类型强化Singleton属性

      后台技术汇

      28天写作

      演讲经验交流会|ArchSummit 上海站

      演讲经验交流会|ArchSummit 上海站

      硅谷华人技术大神:流行框架创始人、AWS首席科学家,开源深度学习中文教材 | 二叉树视频-InfoQ