写点什么

亚马逊首席架构师的 AI 实践之路

  • 2018-01-04
  • 本文字数:2530 字

    阅读完需:约 8 分钟

导读:本次全球人工智能与机器学习技术大会(AICon)上,蔡超将带来题为《工程师的 AI 实践之路》的主题演讲,为全球技术人带来他本人在 AI 学习之路上的一些实践经验。在大会之前,AI 前线记者对蔡超进行了专访。

实践历练出的技能

蔡超自言从小对数学和计算机比较感兴趣,走上技术这条路也算得上是顺理成章。研究生时代,他选择了网络安全和密码学,也都是和数学相关。在国有银行、民营企业、外企都有过丰富工作经验的他,一直都没有离开过软件开发的岗位。从最普通的软件工程师一直做到今天的首席架构师。

机器学习是现在 AI 的主要内容,在蔡超看来,机器学习的本质就是从数据中找出 pattern(模式)。虽然蔡超在进入 AI 领域之前从事的多是移动设备管理系统以及安全系统的软件架构师等职位,但其实在工作中,他曾参与或主持做过的很多项目都和机器学习相关。只不过在之前,这一概念没有今天这般普及的时候,那些项目都没有被冠上“机器学习”这样的名字罢了,蔡超说:“在以前很多时候我们也用线性回归等去拟合,预测数据或是进行聚类,关联规则挖掘,不过那时大家并不十分强调自己使用了机器学习或 AI 技术,更多的是说数据挖掘 (Data Mining)。”

可以这么理解:他的专业技能是在实践中不断历炼出来的。这个实战中摸爬滚打出来的过来人,有一些小建议想要分享。

过来人的一点小建议和实践成果

人工智能在技术人当中的火爆程度已经很难用一般的词语来形容了,一项技术的火爆势必会带起相关产业的发展。为了帮助其他领域的技术人转型,各类人工智能网课、培训班拔地而起。有不少技术人都准备乘着 AI 的浪潮进行一番技术转型,但是条条大路通罗马,面对各种选择的分岔路,有些技术人犯了难,到底该选择什么样的路径进行 AI 转型?培训班?网课?或者如果时间允许就干脆考研?

转型方式花样繁多,蔡超本人最推荐的转型方式是 :首先自己学习一些基础知识,然后在真实项目中和这方面专家一起工作。 具体来说:通过书籍或是培训课程,可以学到基本原理。但是通常为了便于理解,书中的示例都是往往经过了简化和抽象的,所以你不会知道实际问题的分析和处理方式,以及 最重要的是如何甄别出那些可以用机器学习优化的问题。

蔡超告诉我们:“亚马逊更看中的是具有扎实基本工和快速学习能力的人才。”他认为,对于技术人员来说深入研究技术的本质及勇于实践不怕失败,并且善于从失败中学习是非常可贵的特质。

在成为一名 AI 实践者之后,除了自己的专业技能得到了提升,蔡超本人及其团队也取得了一些不错的成就。

近几年,蔡超带领亚马逊工程团队应用机器学习、深度学习技术在全球客服系统智能化,推荐系统本地化及合规性检测自动化等多个方面实现了大量的成功创新。

  1. 针对后端的客服人员,智能化客服系统可针对不同的客服问题进行分类,同时推荐相关资料、分析客户反馈信息,极大程度提高了客服人员的工作效率。
  2. 而针对亚马逊美国市场和中国市场的亚马逊客户的特点及亚马逊全球选品的优势,蔡超的技术团队对商品的推荐系统进行了优化。如大量的亚马逊用户都是图书消费者,通过推荐系统鼓励图书消费者的跨品类购买,帮助本地消费者在全球选品中找到心仪的产品。
  3. 对于网站所售商品,团队利用自然语言处理(Natural Language Processing)、计算机视觉(Computer Vision)、深度学习等技术实现对网站内容及所售商品的合规,合法性检查(如,广告法)的自动化。

蔡超介绍,以上系统在进行一些早期开发的过程当中,使用了 Keras+Tensorflow,新的项目基本使用 MXNet。

关于深度学习框架,蔡超也有自己的使用心得愿意分享给读者:“如何选择要根据你的实际情况,如果你是个初学者 Tensorflow 是比较好的选择,很容易找到大量的学习资料。而 MXNet 则有着较好的并行计算性能。当然如果你是 AWS 用户,那么最好使用 MXNet,AWS 官方支持了 MXNet,你可以在 AWS 的服务中方便的使用它,如 AWS Lambda。”

一点前瞻性想法

人工智能发展至今已经 60 个年头,在 2017 年迎来了它发展的第一个高峰,作为一个拥有多年实战经验的技术老兵,蔡超对于人工智能的未来也有一些自己的想法:

虽然近年 AI 取得很多令人振奋的成果,但我们也应该清楚的看到很多被人们津津乐道的成果都是在图像和语音领域,或者是一些相对封闭空间的问题(如:棋类对弈)。这些问题的定义相对简单,拥有大量数据,可以充分利用硬件计算能力取得的进步而获得进展。尤其在 AI 的很多本质性问题(可形式化,可计算性,认知与学习的关系等)上还需要有真正突破性进展。

在 AI 领域不断突破的过程里,总能看到亚马逊的身影。作为全球知名的技术大厂,亚马逊一直以 “Earth’s Most Customer-Centric Company(地球上最以用户为中心的企业)” 作为目标,据蔡超介绍,未来亚马逊将引领使用 AI 技术提升和创新用户线上及线下的体验。许多像蔡超这样,在实践中成长的 AI 技术人,必将成为 AI 大时代里的中流砥柱,我们期待越来越多的技术人加入 AI 实践者的队伍,用科技让世界更加美好。

作者介绍

蔡超,亚马逊中国研发中心首席架构师,拥有 15 年的软件开发经验,其中 9 年任世界级 IT 公司软件架构师 / 首席软件架构师。2010 年加入 亚马逊,曾领导开发了亚马逊全球的新外部直运(External Fulfillment)平台,亚马逊物流 + 系统及基于机器学习的亚马逊全球客服系统智能化项目。现做为亚马逊(中国)技术团队的首席架构师,领导中国团队通过机器学习,大数据及云计算新技术不断创新为中国客户打造更好的体验。

一个彩蛋

在文章开头我们说过,蔡超老师将参加全球人工智能与机器学习技术大会(AICon),届时,蔡超老师会带来更多精彩分享,可到现场与他面对面交流探讨。大会将于2018 年1 月13-14 在北京盛大开幕,来自Google、Snap、Etsy、BAT、360、小米、京东等40+ 公司AI 技术负责人也将前来分享他们的机器学习落地实践经验,希望对你有所帮助。

更多大会精彩内容,欢迎点击官网详细了解!

目前大会倒计时4 天报名进行中,如在报名中遇到任何问题,敬请咨询票务经理豆包,电话:18514549229,微信:18514549229,QQ:209463896


感谢陈思对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2018-01-04 18:004187

评论

发布
暂无评论
发现更多内容

【5.12-5.19】写作社区优秀技术博文一览

InfoQ写作社区官方

热门活动 优质创作周报

500行代码手写docker开篇-goland远程编译环境配置

蓝胖子的编程梦

Docker 容器 云原生 k8s 命名空间

完整版来了!阿里Dubbo技术负责人准备的源码教程,很有大厂风格

Java你猿哥

Java 架构 dubbo ssm

如何进行测试分析与设计-HTSM启发式测试策略模型 | 京东云技术团队

京东科技开发者

测试 测试策略 企业号 5 月 PK 榜 HTSM

上海丨阿里云 Serverless 技术实战营邀你来玩!

Serverless Devs

阿里云 Serverless 中间件

旭阳数字郗维宝:数智化转型助力焦化企业打破行业困境

用友BIP

升级企业数智化底座 2023用友技术大会

用好kafka,你不得不知的那些工具

JAVA旭阳

Java kafka

【GPT-4理论篇-1】GPT-4核心技术探秘 | 京东云技术团队

京东科技开发者

人工智能 openai GPT-4 企业号 5 月 PK 榜

浅谈基于Shapley值的数据融合反欺骗数据判断相关

天翼云开发者社区

数据 Shapley

Java性能分析工具JProfiler注册码下载

Rose

JProfiler激活码 JProfiler Mac永久激活版 Java 分析器 JProfiler中文版 JProfiler下载

Photoshop 2023 如何切换语言?

Rose

Photoshop 2023下载 如何切换PS语言 PS 2023破解

什么是研发 Lead Time?我悟了!

LigaAI

DevOps 敏捷开发 研发速率 研发效能管理 企业号 5 月 PK 榜

LED显示屏技术升级方向介绍

Dylan

技术 升级 LED显示屏

VM虚拟机 v13.0.2激活版 for Mac许可秘钥

Rose

VMware Fusion Pro 13 VM虚拟机破解版 Mac虚拟机 VMware Fusion激活秘钥

「聊天机器人构建、智能文档问答」大模型应用开发实操课程来了

飞桨PaddlePaddle

AIGC Prompt

龙蜥开发者说:构建软件包?不,是构建开源每一个角落!| 第 20 期

OpenAnolis小助手

开源 操作系统 龙蜥社区 开发者说 优秀贡献奖

原型设计Axure RP 9中文授权码【Mac/win】

Rose

Axure RP 9汉化 Axure RP 9授权码 产品原型设计工具 axure rp9下载 axure rp9安装教程

打造绿色低碳存储方案,助推数据中心绿色长“存”

天翼云开发者社区

CIO

MobTech 秒验|助力预热618

MobTech袤博科技

CDN网关超大range计算方法

天翼云开发者社区

CDN

RocketMQ你不得不了解的 Rebalance机制源码分析

Java你猿哥

Java 源码 RocketMQ ssm client

全靠这份阿里大佬的“Java进阶面试手册”收获蚂蚁offer

Java你猿哥

Java kafka Spring Boot Netty java面试

常用的表格检测识别方法 - 表格区域检测方法(下)

合合技术团队

人工智能 文字识别 表格识别 表格检测

深入浅出 OkHttp 源码解析及应用实践

vivo互联网技术

okhttp 拦截器 源代码

苹果系统更新:MacOS 11-13.x(PKG系统安装包及IPSW固件)

Rose

mac系统 macOS 13 Ventura 苹果最新系统 苹果系统下载

【实践篇】教你玩转JWT认证---从一个优惠券聊起 | 京东云技术团队

京东科技开发者

分布式 JWT 企业号 5 月 PK 榜

DevEco Studio 3.1 Release | 动态共享包开发,编译更快,包更小

HarmonyOS开发者

HarmonyOS

中央企业数字化转型专业委员会正式揭牌!

用友BIP

财务管理

亚马逊首席架构师的AI实践之路_语言 & 开发_蔡超_InfoQ精选文章