写点什么

TensorFlow 企业版来了,商业 AI 平台:“这日子没法过了”

  • 2019-11-19
  • 本文字数:3552 字

    阅读完需:约 12 分钟

TensorFlow企业版来了,商业AI平台:“这日子没法过了”

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

谷歌于今年 10 月份推出 TensorFlow 企业版,补足企业市场短板。谷歌的 TensorFlow 机器学习框架于 2015 年开源,并迅速成为最受欢迎的机器学习平台之一。到目前为止,已经被下载 4600 万次。


TensorFlow Enterprise 最重要功能之一是它将提供长期的技术支持。针对某些版本,谷歌将提供长达三年的补丁程序,所有补丁和错误修复将在 TensorFlow 主线代码存储库中提供。另外,谷歌还将向正在构建 AI 模型的公司提供来自 Google Cloud 和 TensorFlow 团队的工程协助。


由于目前市场上的商业通用 AI 平台(软件即服务,下简称商业 AI 平台)跟 AI 云服务在功能上高度重合,且商业模式不及云服务,谷歌提供企业版之后,这些 AI 平台初创企业压力倍增。

大数据和云企业的施压

从 2018 年到现在,AI 行业就频繁传出 AI 公司倒闭潮的预测。业内不断的有声音认为“90%的 AI 企业面临倒闭”,“会有一波大的洗牌”。


谷歌的 DeepMind 在过去三年里,亏损 10 亿美元,但未来还有 10 亿的预算投入。AI 创业企业,没有谷歌之于 DeepMind 的背景,就得有自我造血功能,方能活下去。比如当初做“三维视觉感知”的强 AI 企业,也得朝主流的“深度学习+人脸识别”转移,进入安防行业落地。


而商业 AI 平台通常的落地场景是金融领域,如银行业的风控、精准营销;零售行业,如智能推荐、销售预测…


如今,大多数企业都在谈数字化转型,为了保持企业的营收持续增长。风控、精准推荐也是主流大数据企业的关键业务。而 AI 平台型初创企业跟主流大数据企业相比起来优势并不明显。



机器学习流程原型是首先清理数据,然后提取特征,最后经过转换的输入通过一个机器学习模型以创建预测结果。


机器学习算法只是其中一环。数据是机器学习应用的重中之重,数据准备占据了 60%以上人天成本。传统大数据企业在数据治理上积累了多年的经验,数据治理能力、数据存储集群管理能力也是一些大数据企业的天然技术壁垒。当商业 AI 平台落地业务时,还是要面对各种脏数据,需要投入大量人力时间解决数据问题。


挣到钱,有自我造血能力才能活下去,才能进化得更好。与大数据企业同食一块蛋糕,在这些落地场景里,AI 平台即服务的优势并不明显,那么盈利能力堪忧。


另外不可忽视的是机器学习平台同样需要管理和维护工具。云服务的优势恰恰是维护容易,且形式灵活,可支持私有云部署。


另外类似谷歌这类的主流云服务功能上不仅提供了精准推荐、预测,还有强 AI 功能如语音识别和图像处理等功能,这些强 AI 能力通常也有大厂的 AI 实验室予以保证。并且云服务可按需付费,商业模式清晰且受过验证。对于谷歌和国内的 BAT 云服务来说,是在云服务应用广泛的基础上叠加 AI 能力,比起平台即服务,AI 销售压力较小,可有更多的力量投入到长期性的技术研发中。

开源的逼迫力量

2015 年 11 月,谷歌第二代深度学习框架 TensorFlow 横空出世。


2015 年注定成为开源的分水岭。谁也不曾料到,后面几年在人工智能领域里,涌起的开源浪潮有多猛烈。


与 TensorFlow 同一时期,微软亚洲研究院开源机器学习工具包 DMTK。


2016 年 9 月百度发布“Paddle”,腾讯也在当年发布 Angel。


2016 年 11 月亚马逊宣布将 MXNet 作为官方深度学习平台。


2017 年 1 月,Facebook 推出机器学习框架 PyTorch。


2017 年,Uber 开源了 Horovod。


AI 框架上承应用、下接芯片,是 AI 产业的软件支柱,包含几个层次,比如底层的芯片、含数据存储的大数据集群;再一层是计算框架,类似 Spark 这样的 ML 框架、TensorFlow 这样的 DL 框架;再往上一层是高级 API 和分布式调度框架,如 Angel;最上一层,是 AI 业务应用,如推荐系统、智能问答、人脸识别…每个层次均有对应的开源软件可组合使用。


这些开源平台背后技术力量雄厚,且各有优点。


比如 TensorFlow 基于 Python,写的很快并且具有可读性;在多 GPU 系统上的运行更为顺畅;代码编译效率较高;提供 API 的支持,可直接解决各种机器学习任务。在工业界,TensorFlow 使用率达到最高。


比如 Uber 开源参数服务器 Horovod 通过 AllReduce 来实现机器间模型同步,由于底层使用 MPI、支持 RDMA 等高性能网络,可以利用带宽并行。同时与主流深度学习打通,Tensorflow,PyTorch 等,有良好生态方便上手。


利用开源的项目,开发人员就能完成基本的任务,在开源的推动下,中国出现了近千家 AI 创业公司,仅次于排名第一的美国。


商用 AI 平台需要在多个主要环节强于开源软件,才能叫好并叫座。目前开源还是商业化 AI 平台即服务的强有力的对手,并且这次提供的 TensorFlow 企业版服务提供了高达 3 倍的数据读取改进(TensorFlow 读取和缓存文件方式更改的结果)。并且已针对 Nvidia GPU 和 Google Cloud TPU 优化了企业版。TensorFlow 企业版针对实际使用的硬件和平台都做了优化,更好的提升了企业 AI 平台的性能。

AutoML

使用 AutoML 是目前比较主流的机器学习平民化方法,被一些 AI 平台当作杀手锏。同时 AutoML 被认为是解决十万 AI 人才缺口的救星。


2018 年 1 月,当时的谷歌云首席科学家李飞飞和谷歌云研发负责人李佳宣告 Cloud AutoML 的问世。


机器学习涉及到数据预处理、特征工程、模型调参等环节。还需要人工选择参数,设计模型,验证调整,如此反复。AutoML 让这些自动完成,相当于让 AI 来设计 AI。与专业调参建模相比,AutoML 的优势在于使用门槛低,解决一些重复性劳动。


在真实世界里,技术是流动的,永远不会静止,永远不会完结,永远不会完美。

–《技术的本质》


目前的 AutoML 的缺点也是很明显的,首先是一个黑盒的模块,大量的数据预处理、特征或者模型的尝试,专家没有办法干预,因此可能会带来一些效率低下的问题,消耗大量算力,其次是 AutoML 只能解决确定性的可量化的目标,对于实际情况,需要在多个不同的业务目标(比如准确率和线上延迟)之间进行权衡,以及可能需要涉及到一些不可以明确量化的目标,比如可解释性,这些情况下目前的 AutoML 是无法有效工作的,甚至有些时候,人也没有办法一下子给出目标,需要不断地探索。


深度学习专家 François Chollet 也曾置评这项技术:“不久之后,AutoML 就会发现他们将面临和强化学习一样的问题:人们会用非常具体的(有缺陷的)方法来解决许多宽泛的问题。”


有些企业的解决方式是引入人机交互的方式,但同样需要专业的人士参与,也不能根本上解决人才缺口的问题。目前的 AutoML 还达不到理想效果,还需多年的努力。

下一个趋势是什么

2016 年,小米的创办人雷军说过:“站在风口上,猪都会飞”。


2016 年初,Alpha Go 击败了代表人类出战的李世石。BAT 在这一年纷纷开始了 AI 布局,给予了大量的人力和财力。


中国互联网在过去的 15 年中,经历过五六个周期,每个周期主题都不太一样。最开始的门户网站,出现了如新浪、网易、搜狐等企业;然后是增值电信业务,腾讯当年靠电信业务上市;再后面是视频网站和社交网站;然后是电商和互联网金融企业,如阿里巴巴、京东。不严格划分,就是三年一个周期。


最近三年,也可以说是 AI 企业涌起的周期,这条赛道同样出现了几百家甚至上千家创业企业。这三年,有开始的创立浪潮,也有最后的寒冬衰退。


商用 AI 平台经历了数年发展,如果现在还没建起明显的技术护城河,没有令人信服的技术优势,对比云服务,功能重合,盈利模式堪忧,靠加强宣传的方式照样解决不了问题。


更不曾想到,在 2019 年底,谷歌在 TensorFlow 市场占有率无敌的背景条件下再次推出企业版,强占企业市场。


趁时势可以起大事,但也要在“风口”中炼出真功夫,“风口”过后才是真较量。


在与技术专家的交谈中,对比商业 AI 平台,专业人士也都表示更看好谷歌的 TensorFlow 企业版策略。


回头去看,这是商业 AI 平台的创建者缺乏远思吗?其实,除商业 AI 平台之外还有很多 AI 落地都经过了战略性收缩。


2018 年 10 月 21 日,特斯拉已经从公司官网的预订页面下架了长期以来提供的“全自动驾驶”选项。马斯克曾在三年前声称,2017 年之前特斯拉将实现全自动驾驶,如今这个目标的实现已无定期。


2015 年 4 月,IBM 成立了独立的 Watson Health 部门;到 2016 年,IBM 第四次转型,Watson 被寄予担纲厚望。2019 年 4 月,投资 50 亿的 IBM 医疗裁员 70%。


微软最初于 2015 年 12 月推出了针对 iOS 和 Android 的语音助手 Cortana(微软小冰)。2019 年 11 月,微软宣布其语音助手 Cortana 战略性收缩,将在 2020 年 1 月 31 日退出 iOS 和 Android 平台(美国除外)。


通用 AI 一直是顶级 AI 专家的梦想,也是谷歌 DeepMind 终极目标。就像前面所说,DeepMind 在未来还有 10 亿的预算投入,这样的投入,对于一般企业来说,是望而却步的存在。


这些 AI 的小败局,不过就是告诉今天的你,有哪些技术已能见效,有哪些技术目前还不稳定还不理想;有哪些行业属于刚需,有哪些行业还需继续探索。未来还有什么行业值得投入,这将决定 AI 企业的成败。


公众号推荐:

AIGC 技术正以惊人的速度重塑着创新的边界,InfoQ 首期《大模型领航者AIGC实践案例集锦》电子书,深度对话 30 位国内顶尖大模型专家,洞悉大模型技术前沿与未来趋势,精选 10 余个行业一线实践案例,全面展示大模型在多个垂直行业的应用成果,同时,揭秘全球热门大模型效果,为创业者、开发者提供决策支持和选型参考。关注「AI前线」,回复「领航者」免费获取电子书。

2019-11-19 08:288746

评论

发布
暂无评论
发现更多内容

Linux Lab 进阶: Qemu 模拟器 & Toolchain 工具链

贾献华

Linux Tool Linux Kenel qemu Toolchain

产品训练营第四章作业(一)

Arnold

2 期架构师训练营 - 大作业(一)

云飞扬

架构师训练营第2期

机器学习笔记之:

Nydia

架构师训练营大作业(二)

花果山

架构师训练营第2期

第6周课后练习-技术选型二

潘涛

架构师训练营 4 期

日记 2021年2月6日(周六)

Changing Lin

个人感悟 2月春节不断更

架构师训练营第2期大作业(二)

月下独酌

架构师训练营第2期

Ebean ORM框架介绍-1.增强注解

Barry的异想世界

Spring Boot jpa ORM Ebean

中国移动工程师浅析:KubeEdge在国家工业互联网大数据中心的架构设计与应用

华为云开发者联盟

大数据 数据采集 工业智能体 边缘数据中心管理 EDCM

【LeetCode】可获得的最大点数

Albert

算法 LeetCode 2月春节不断更

做事情时,脑袋中一次只装一件事

熊斌

读书笔记 2月春节不断更

LeetCode题解:33. 搜索旋转排序数组,二分查找,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

上古神器 sed 教程详解,小白也能看得懂

鞋子特大号

Linux sed

MyBatis专栏 - 一级缓存

小马哥

Java mybatis 七日更 2月春节不断更

架构师训练营-架构大作业(一)

花果山

架构师训练营第2期

week11-conclusion

J

民办二本程序员阿里、百度、平安等五厂面经,5份offer(含真题)

Java 编程 面试

WiFi 空口抓包工具 --- OmniPeek

week11-homework

J

《王阳明一切心法》读书随笔

BigYoung

读书笔记 28天写作 2月春节不断更 王阳明

翻译:《实用的Python编程》01_01_Python

codists

Python

Android 完全符合规则但很头疼的Json映射成一个树结构且可折叠的列表?

第三女神程忆难

Java android kotlin 安卓

大作业二-请用思维导图画出架构师训练营所有技术知识点

未来已来

第十一周命题作业

cc

并发编程系列:并发编程基础

程序员架构进阶

架构 JVM 七日更 28天写作 2月春节不断更

从云数据迁移服务看MySQL大表抽取模式

华为云开发者联盟

MySQL JVM JDBC 数据迁移

第十一周学习心得

cc

VoltDB让Kafka支持复杂数据流驱动的实时业务决策

VoltDB

数据库 kafka 分布式系统 VoltDB

Elasticsearch 分页搜索以及 deep paging 性能问题

escray

elastic 七日更 死磕Elasticsearch 60天通过Elastic认证考试 2月春节不断更

架构师训练营第2期 大作业 (一)

月下独酌

架构师训练营第2期

TensorFlow企业版来了,商业AI平台:“这日子没法过了”_AI&大模型_Tina_InfoQ精选文章