架构师(2019年6月)

本期推荐文章:为什么高级程序员写的代码都是傻瓜式的?
用户头像
作者: InfoQ 中文站
下载此书
架构师(2019年6月)

卷首语:人工智能的成功取决于数据

作者:MongoDB 中文社区主席 唐建法

最近,清华大学教授、中国科学院张钹院士在接受经济观察报的时候提到:“基于深度学习的人工智能在技术上已经触及天花板, AI 奇迹短期难以再现。”这无疑为许许多多仍然以 AI 为主要业务亮点的创业公司敲响了警钟。

当下,人工智能已经成为一个流行语。从语音识别到自动客服,从人脸图像识别到自动驾驶,不可否认,AI 已经实实在在出现在我们的生活中了。AI 创业公司更是热情甚高, 动辄即称 AI 驱动,就连世界级大牌公司 Oracle 也不例外,前段时间的 Oracle Autonomous Database,按照 Larry 的说法,通过 AI 和 ML 技术,做到了“Totally Automated,Self-Driving”(全部自动,自运行), 不再需要人类来管理或者调优。我觉得要么是 Larry 在骗我,要么最近作为数据库顾问加入 Oracle 的朋友在骗我——如果 Larry 说实话的话,为什么 Oracle 还要继续大量招聘为客户做数据库维护性能调优的顾问?

像大数据一样,对人工智能的炒作也导致了一种趋势,即每个供应商都声称在技术、解决方案或产品中利用了它,都说要改变、替代人类, 从而造成了一个良莠不齐、极度混淆的技术怪圈。

事实上,就像大数据技术不能解决所有的企业数据问题一样,AI 也不能用来解决所有问题。如果想了解 AI 最应该用在何处,并且最容易成功,我们必须先了解 AI 的真正含义。

AI 或机器学习是指一组广泛的算法,如果训练得当,它们可以解决一组特定的问题。把机器学习算法集成到产品中其实是微不足道的——有大量公开的算法可以用,但有效地使用数据来训练算法并执行任务却并非那么简单。事实上,一个 AI 项目从开始施行到初有成效,多达 80% 的精力都是用在数据准备上的。

当有大量丰富的数据可用时,AI 效果是最佳的。数据量越大,覆盖维度越多,算法学习和调整预测分析的速度就越快。根据行业预测,在 2018 年,人工智能的最大限制——高质量数据,将变得更加明显。成功的机器学习取决于大型和广泛的数据集,以及对这些数据的有效管理。

谁能够获得最优质最全面的原始数据,谁掌握最成熟的数据处理与加工技术,才是未来真正 AI 项目的核心能力。 所以,对很多不明真相的技术人来说,与其盲目的追捧 AI,不如实实在在地掌握精通数据处理的技术,这才是一条不会受到泡沫破裂而影响的务实之路。

目录

热点 | Hot

谷歌中止与华为业务往来,华为自研手机 OS 也要一夜“转正”?

产业互联网起风了:这一次,腾讯又站上了风口

理论派 | Theory

阿里将 Transformer 用于淘宝电商推荐,效果优于 DIN 和谷歌 WDL

推荐文章 | Article

一张主流编程语言的变迁图,讲清程序员迁移模式

为什么高级程序员写的代码都是傻瓜式的?

观点 | Opinion

W3C Web 技术总负责人:拓展 Web 核心能力,W3C 关注哪些技术?

人人都是 API 设计师:我对 RESTful API、GraphQL、RPC API 的思考

免费下载此书(PDF)
免费下载此书(ePub)
免费下载此书(MOBI)

评论

发布