【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

亚马逊首席架构师的 AI 实践之路

  • 2018-01-04
  • 本文字数:2530 字

    阅读完需:约 8 分钟

导读:本次全球人工智能与机器学习技术大会(AICon)上,蔡超将带来题为《工程师的 AI 实践之路》的主题演讲,为全球技术人带来他本人在 AI 学习之路上的一些实践经验。在大会之前,AI 前线记者对蔡超进行了专访。

实践历练出的技能

蔡超自言从小对数学和计算机比较感兴趣,走上技术这条路也算得上是顺理成章。研究生时代,他选择了网络安全和密码学,也都是和数学相关。在国有银行、民营企业、外企都有过丰富工作经验的他,一直都没有离开过软件开发的岗位。从最普通的软件工程师一直做到今天的首席架构师。

机器学习是现在 AI 的主要内容,在蔡超看来,机器学习的本质就是从数据中找出 pattern(模式)。虽然蔡超在进入 AI 领域之前从事的多是移动设备管理系统以及安全系统的软件架构师等职位,但其实在工作中,他曾参与或主持做过的很多项目都和机器学习相关。只不过在之前,这一概念没有今天这般普及的时候,那些项目都没有被冠上“机器学习”这样的名字罢了,蔡超说:“在以前很多时候我们也用线性回归等去拟合,预测数据或是进行聚类,关联规则挖掘,不过那时大家并不十分强调自己使用了机器学习或 AI 技术,更多的是说数据挖掘 (Data Mining)。”

可以这么理解:他的专业技能是在实践中不断历炼出来的。这个实战中摸爬滚打出来的过来人,有一些小建议想要分享。

过来人的一点小建议和实践成果

人工智能在技术人当中的火爆程度已经很难用一般的词语来形容了,一项技术的火爆势必会带起相关产业的发展。为了帮助其他领域的技术人转型,各类人工智能网课、培训班拔地而起。有不少技术人都准备乘着 AI 的浪潮进行一番技术转型,但是条条大路通罗马,面对各种选择的分岔路,有些技术人犯了难,到底该选择什么样的路径进行 AI 转型?培训班?网课?或者如果时间允许就干脆考研?

转型方式花样繁多,蔡超本人最推荐的转型方式是 :首先自己学习一些基础知识,然后在真实项目中和这方面专家一起工作。 具体来说:通过书籍或是培训课程,可以学到基本原理。但是通常为了便于理解,书中的示例都是往往经过了简化和抽象的,所以你不会知道实际问题的分析和处理方式,以及 最重要的是如何甄别出那些可以用机器学习优化的问题。

蔡超告诉我们:“亚马逊更看中的是具有扎实基本工和快速学习能力的人才。”他认为,对于技术人员来说深入研究技术的本质及勇于实践不怕失败,并且善于从失败中学习是非常可贵的特质。

在成为一名 AI 实践者之后,除了自己的专业技能得到了提升,蔡超本人及其团队也取得了一些不错的成就。

近几年,蔡超带领亚马逊工程团队应用机器学习、深度学习技术在全球客服系统智能化,推荐系统本地化及合规性检测自动化等多个方面实现了大量的成功创新。

  1. 针对后端的客服人员,智能化客服系统可针对不同的客服问题进行分类,同时推荐相关资料、分析客户反馈信息,极大程度提高了客服人员的工作效率。
  2. 而针对亚马逊美国市场和中国市场的亚马逊客户的特点及亚马逊全球选品的优势,蔡超的技术团队对商品的推荐系统进行了优化。如大量的亚马逊用户都是图书消费者,通过推荐系统鼓励图书消费者的跨品类购买,帮助本地消费者在全球选品中找到心仪的产品。
  3. 对于网站所售商品,团队利用自然语言处理(Natural Language Processing)、计算机视觉(Computer Vision)、深度学习等技术实现对网站内容及所售商品的合规,合法性检查(如,广告法)的自动化。

蔡超介绍,以上系统在进行一些早期开发的过程当中,使用了 Keras+Tensorflow,新的项目基本使用 MXNet。

关于深度学习框架,蔡超也有自己的使用心得愿意分享给读者:“如何选择要根据你的实际情况,如果你是个初学者 Tensorflow 是比较好的选择,很容易找到大量的学习资料。而 MXNet 则有着较好的并行计算性能。当然如果你是 AWS 用户,那么最好使用 MXNet,AWS 官方支持了 MXNet,你可以在 AWS 的服务中方便的使用它,如 AWS Lambda。”

一点前瞻性想法

人工智能发展至今已经 60 个年头,在 2017 年迎来了它发展的第一个高峰,作为一个拥有多年实战经验的技术老兵,蔡超对于人工智能的未来也有一些自己的想法:

虽然近年 AI 取得很多令人振奋的成果,但我们也应该清楚的看到很多被人们津津乐道的成果都是在图像和语音领域,或者是一些相对封闭空间的问题(如:棋类对弈)。这些问题的定义相对简单,拥有大量数据,可以充分利用硬件计算能力取得的进步而获得进展。尤其在 AI 的很多本质性问题(可形式化,可计算性,认知与学习的关系等)上还需要有真正突破性进展。

在 AI 领域不断突破的过程里,总能看到亚马逊的身影。作为全球知名的技术大厂,亚马逊一直以 “Earth’s Most Customer-Centric Company(地球上最以用户为中心的企业)” 作为目标,据蔡超介绍,未来亚马逊将引领使用 AI 技术提升和创新用户线上及线下的体验。许多像蔡超这样,在实践中成长的 AI 技术人,必将成为 AI 大时代里的中流砥柱,我们期待越来越多的技术人加入 AI 实践者的队伍,用科技让世界更加美好。

作者介绍

蔡超,亚马逊中国研发中心首席架构师,拥有 15 年的软件开发经验,其中 9 年任世界级 IT 公司软件架构师 / 首席软件架构师。2010 年加入 亚马逊,曾领导开发了亚马逊全球的新外部直运(External Fulfillment)平台,亚马逊物流 + 系统及基于机器学习的亚马逊全球客服系统智能化项目。现做为亚马逊(中国)技术团队的首席架构师,领导中国团队通过机器学习,大数据及云计算新技术不断创新为中国客户打造更好的体验。

一个彩蛋

在文章开头我们说过,蔡超老师将参加全球人工智能与机器学习技术大会(AICon),届时,蔡超老师会带来更多精彩分享,可到现场与他面对面交流探讨。大会将于2018 年1 月13-14 在北京盛大开幕,来自Google、Snap、Etsy、BAT、360、小米、京东等40+ 公司AI 技术负责人也将前来分享他们的机器学习落地实践经验,希望对你有所帮助。

更多大会精彩内容,欢迎点击官网详细了解!

目前大会倒计时4 天报名进行中,如在报名中遇到任何问题,敬请咨询票务经理豆包,电话:18514549229,微信:18514549229,QQ:209463896


感谢陈思对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-01-04 18:003523

评论

发布
暂无评论
发现更多内容

【LeetCode】合并两个有序链表Java题解

Albert

算法 LeetCode 10月月更

资源成本降低80%!Serverless云函数的弹性架构实践

Geek_2d6073

Python进阶(二十)Python爬虫实例讲解

No Silver Bullet

Python 数据分析 10月月更

Java对象的使用和对象内存图解

共饮一杯无

Java 对象 10月月更

为什么编程第一课都要学Hello World?

博文视点Broadview

C++使用protobuf嵌套结构体总结

中国好公民st

c++ protobuf 10月月更

给 SAP BTP 创建的 Java 应用添加 Custom Event Handler 支持创建功能

Jerry Wang

spring 云原生 Cloud SAP 10月月更

「Hive进阶篇」二、万字长文超详述hive企业级优化

大数据阶梯之路

大数据 hive 面试 hive优化

【一Go到底】第十四天---break快速入门

指剑

Go golang 10月月更

PriorityQueue源码-成员变量解析

知识浅谈

Priority Queue 10月月更

深度解析:智能合约DAPP(bsc)币安链系统项目开发解决方案

I8O28578624

数据中台选型前必读:数据中台与大数据平台有什么区别

雨果

数据中台 大数据平台

国产分布式数据库发展趋势与难点

亚信AntDB数据库

AntDB 国产数据库 AntDB数据库 企业号十月PK榜 企业号十月 PK 榜

大数据ELK(二十四):安装Kibana

Lansonli

10月月更 安装Kibana

不同的子序列 II

掘金安东尼

算法 10月月更

Python进阶(十九)Python3安装第三方爬虫库BeautifulSoup4

No Silver Bullet

Python 字符串 10月月更 BeautifulSoup4

腾讯云继续加码布局云原生,将披露全新产品战略

科技热闻

开源无国界,从openEuler Maintainer到Spark Committer的贡献开源之路

openEuler

spark 开源 openEuler

带你认识JDK8中超nice的Native Memory Tracking

华为云开发者联盟

开发 华为云

金九银十前端面试题总结(附答案)

loveX001

JavaScript

22道js输出顺序问题,你能做出几道

loveX001

JavaScript

React循环DOM时为什么需要添加key

beifeng1996

React

流程引擎的架构设计

京东科技开发者

架构设计 报表 workflow BPM 流程引擎

聚焦六大典型应用场景,博云金融行业容器解决方案更新发布!

BoCloud博云

云计算 云原生 容器云

JVM诊断工具中的深堆、浅堆、支配树,你都明白吗

JAVA旭阳

Java JVM 10月月更

React组件之间的通信方式总结(下)

beifeng1996

React

react高频面试题自测

beifeng1996

React

SAST + SCA: 结合使用安全升级

SEAL安全

SCA 安全测试 攻击 SAST 应用安全测试

Jib使用小结(Maven插件版)

程序员欣宸

Docker 10月月更 Jib

80%的前端开发都答不上来的js异步面试题

loveX001

JavaScript

面向对象思想和Java中类的定义

共饮一杯无

Java 面向对象 10月月更

亚马逊首席架构师的AI实践之路_语言 & 开发_蔡超_InfoQ精选文章