写点什么

寻路者华为云:在产业 AI 迷宫里走直线

  • 2020-02-26
  • 本文字数:4552 字

    阅读完需:约 15 分钟

寻路者华为云:在产业AI迷宫里走直线

在很多学者的自传中,他们都会将科学描述成一座“迷宫”,而自己则是在迷宫中寻路的孩童。实际上迷宫不仅仅存在于科研之中,产业、文化、艺术的发展也是一样。寻路者们总是在无数限制与困局中,找到抵达目的地的出路。人类这一物种对于发展与探索的天然向往,驱使着我们不断向前行走。



正如同今天的 AI,同样也像是一座迷宫,我们在技术的起点,渴望走出迷宫到达产业升级的出口。在过去几年中,我们见证了无数人踏上了迷宫寻路之旅。其中提出了“全栈全场景”的华为云,就是一个典型的“寻路者”。


在过去一年中,华为云用昇腾系列处理器搭建的底盘,融汇输出的 AI、计算、存储能力,以及针对开发者打造的一站式 AI 开发与管理平台 ModeArts 和 AI 开发应用平台 HiLens。似乎正在从混乱的迷墙与拐角中寻找到一条通向产业未来的通路。如今在华为开发者大会 2020(Cloud)即将召开之际,我们可以再次审视华为云在这座巨大迷宫中画出的线路,以及产业参与者如何在其中找到出口。

入口背后的岔口:产业 AI 迷宫拔地而起

一座迷宫是如何建成的?


那些供人欣赏玩乐的迷宫,是被规划、被设计、被建造而成。但阻挡在我们与产业升级之前的“产业迷宫”,确实经由无数现实因素累积而成。想要真正实现产业 AI 化,首先要弄清楚的问题的是,究竟是什么困住了我们?


AI 技术的诞生,存在于一个个被规划好的数据集中。可我们最终的目的,是让 AI 在工厂、机场、火车站、教室等等现实场景中发挥作用,真实地改变人类生活的轨迹。说起 AI 应用的条件,相信很多朋友都能像背课文一样说出那“老三样”:算力、大数据、算法。可真正着手对产业进行改造时,却发现口号式的解决逻辑并没有带来切实的解决方案。实验室外的真实世界,往往能在每一条应用基础上分化出无数岔路,这些岔路又彼此交集,最终构成了一座迷宫。


整理过往的产业 AI 化案例,我们可以看到这座迷宫中各种曲折的路线。比如有团队想制作一款识别航空器的 AI 产品,用来防止飞机跑道被入侵,却发现面对这一小众化的需求,必须从头开始在开源社区里寻找技术、搭建环境、调优算法。又比如一家 AI 教育企业,累积了大量语音素材想要训练口语识别模型,却发现想要进一步提升模型的准确度,还需要应用上更困难的,结合了语音和视觉的多模态识别能力。



当 AI 越深入产业,我们就越会发现,看似老三样解决一切的背后,是场景的个性化与琐碎化,技术成长与企业人才成长的断层,以及常常出现的反复调试和重复开发。这些问题不被解决,产业 AI 就会一直在迷宫深处兜兜转转——对于产业端口来说,如果有什么比没有应用 AI 更可怕,相信一定是低估了部署 AI 的难度,耗费大量技术升级成本却没有得到想要的结果。


但在上述那些案例的背后,这些深入 AI 迷宫的人全都找到了出口,拥抱了产业 AI 的未来。聆听他们与寻路者之间的故事,或许能够帮助我们找到产业 AI 迷宫的破局之道。

破壁、清障、助跑:

华为云画下一条直线


作为迷宫寻路者的科技企业们,其实已经在迷宫里挂满了“路标”。他们向产业开放了算力与计算平台,也在把自己的技术能力打造成易用的 API 接口,试图覆盖的产业的需求。能够指明方向、写下标识,可以说是成为寻路者基础条件。但仅仅满足基础条件,是远远不足够带产业走到出口的。


在面对真实应用场景时,我们需要意识到两点。


第一, 产业参与者分配给迷宫的时间是有限的。作为总是与科技迷宫打交道的科技企业们,可以花大把的时间与金钱成本在迷宫探索之中,但作为想要利用 AI 技术产业,他们的核心目标永远是降本增效,用最短路线抵达出口而非浏览迷宫中的景色。


产业参与者在迷宫中行进的效率是不确定的。AI 能与各行各业结合的 B 面,本应是各行各业都可以应用 AI。但对于一些小微企业或传统企业来说,他们在开发能力上的零储备和成本上的限制,必然会让他们处处碰壁。或许还没走到路标指向的下一个路口,就已经筋疲力尽。



如果大家在小时候也曾用铅笔在报纸上的迷宫图勾勾画画寻找路线,相信有不少人都有同样的经历,在耗费时间画了几笔之后,总会不耐烦的一笔画到终点。面对想要也必须以最短路线抵达出口的参与者,以及必然复杂的迷宫。寻路者或许也需要“think out of the maze”,把寻路的方式改变成拆除迷宫本身。


在华为云的 AI 寻路逻辑中,我们就可以看到这样拆除迷宫的思路。接下来我们可以通过几个现实案例,看看华为云构建的产品是如何“拆除迷宫”的。


1、 打通开发壁垒的 ModelArts。


当我们的经历飞机延误时,一定听过“航空管制”这个词。实际上每一架飞机何时起飞、何时降落,都需要航空管制员在塔台上,通过肉眼观察监视器凭借经验来判断。当恶劣天气发生以及来往航班密度增加时,航空管制员的工作难度和工作压力都会大大增加。上海麦图信息科技推出的“跑道侵入防护系统”,就是通过 AI 改造了这一现状。在麦图的解决方案中,监控视频中的飞机图像可以被及时捕捉,确定位置与速度,计算两个飞机之间的运动轨迹,再根据其他的关联数据进行认证,确保飞机之间不会发生碰撞,即使有发生碰撞的风险,也可以提前预知。



从监控视频中识别对象然后加以计算推理出结果,这听上去是再典型不过的 AI 产业应用了。可真到了开发部署时,开发者就会发现,跑道防侵入这一需求非常小众,很少能找到可参考的解决方案。这意味着从标定工具的开发,到算法设计以及后续的设备性能调优都需要从头做起。从商业角度来说,这一过程带来的成本是致命的。复杂繁重的开发过程成了一道藩篱,明明知道出口就在前方,却又被死死困住。


这也是 ModelArts 作为一站式 AI 开发与管理平台,在寻路过程中发挥的最大价值。在去年发布的 2.0 版本中,ModelArts 增加了大量诸如智能数据筛选、智能数据标注、智能数据分析、多元模型自动搜索、图神经网络、强化学习、模型评估、模型诊断、模型压缩等自动化甚至智能化的辅助开发工具,可以在数据清洗标注到模型部署调优的全链条上,对 AI 开发进行优化。


用在麦图科技的案例上,就是不论在视频中标注航天器这样最基础的工作,还是提升推理精准度不断调节参数,这些工作都可以在 ModelArts 的帮助下高效进行。麦图信息科技仅仅用了三天,就完成了第一版模型的数据标注、训练甚至客户演示。在以往可能光是采购服务器,就要花费同样的时间。


原本阻拦在迷宫出口前的壁垒,就这样被轻易打破。


2、 清除端与云障碍的 HiLens。


如果关注荣耀手机生态链的朋友,一定会记得去年的荣耀亲选推出了一款名为 BYBLUE 的智能云台摄像头。这款摄像头具有 AI 人形监测、手势识别能力,能够帮助用户监控家中状况也能“读懂”用户的手势,同时还能分辨出婴儿的哭声,承担婴儿房监听器的作用。更重要的是,这款摄像头的价格仅仅不足 200 元。



一般来说,通过视频实现多模态识别、人形识别或手势识别并不困难,在 ModelArts 的帮助下就更加简单。但想要将这些能力集成在一款 200 元左右的硬件中,就并不那么容易。端侧算力的成本限制和软件开发者对底层算力的不理解,都会让开发者明明掌握了极具价值的算法能力和适用的商业场景,却施展不开拳脚。无异于行进半路,却被障碍阻挡了步伐。


如果说 ModelArts 解决的 AI 软件层面的问题,那么 HiLens 作为与之配合的端云协同 AI 开发应用平台,解决的就是算力部署的问题。这一平台可以将端侧的计算能力与云端的计算能力结合在一起,为不同的算法找到应有的部署位置。降低了端侧需要的计算性能,自然也降低了硬件成本的要求。同时 HiLens 开放了“技能市场模式”,号召开发者在平台上推出即拿即用的视觉、多模态算法,并推出了一体化开发套件 HiLens Kit。不论是挖掘出商业场景,想从头部署一体化智能视觉硬件的企业,还是渴望智能升级的传统视觉硬件厂商,甚至干脆是只有算法能力的,对硬件部署一无所知的技术企业,都能通过 HiLens 扫清障碍,获取到终端或云端的能力,让视觉 AI 拥抱现实。


扫清了路上的障碍,走出迷宫的速度就会被极大的加快。


3、 为世界助跑的澎湃 AI 算力。


在拆除迷宫的最后一步上,我们要提出很多“终极之问”。比如宇宙中有多少星球未被我们发现,基因中的未解之谜如何能够被勘破,我们能否在有生之年勘探到更多石油资源留给下一代……


这些看似庞大却实则与人类文明发展休戚相关的问题,同样也能够被深度学习、强化学习等等 AI 技术逐步破解。只不过和所有 AI 技术一样,这些问题的探索需要强大计算来支持。



除了开发端和部署端的赋能之外,另一让华为投入了大量资源的,就是一切开发者都需要的算力底盘。突破算力峰值的 AI 集群 Atlas 900、融入了一系列硬件能力的 AI 昇腾集群服务加上全场景 AI 计算框架 MindSpore。华为云正在将海量算力释放出来,或许不是每个产业都需要突破峰值的暴力计算,但在这个算力决定实力的时代,几乎每个产业能够享受到算力提升的红利。华为云此举无疑是给每个进入迷宫的人都拍了个“Buff”,用强大的算力基础,让他们完成助跑,在迷宫中飞奔起来。


推倒迷宫,建桥梁


通壁、清障、助跑。经过去年一年的累积筹备,华为云已经为产业迷宫找了一种全新的可能。


科技企业或许可以走遍迷宫的每一个角落,为每个进入迷宫的人提供一幅地图。但真正值得思考的是,在 AI 的技术起点与产业终点之间,一定要有九曲十八弯吗?或许有一些产业兜兜转转,最终走到了迷宫的尽头。但在这一过程中,他们付出了大量“绕路”成本:用高价获取算力,争抢此前从未接触过的技术人才,与黑箱调参玄学反复斗争……那些本应用在开拓更多 AI 落地场景上的时间与精力,就在绕路中消耗掉了。更何况还有那些根本支付不起绕路成本的人——想要用 AI 分拣水果的果农、想用 AI 改善经营的小微企业以及那些充满着无尽新奇创意的普通开发者。



一项能够改变世界的技术升级,一定要以最直接的方式深入每一片产业热土,彻底改变那些沉淀已久的顽疴;而不是在无数蜿蜒岔路中,甩下那些无力追随到底的人。


华为云一直在强调的普惠 AI 就是如此。不论是通过昇腾的开放去提升算力的平均水平,还是用 ModelArts 和 HiLens 这样的工具降低 AI 开发和部署的门槛。华为云所做的一切与其说是在迷宫中寻路,不如说是否定迷宫存在。


真正的迷宫是被规划、被设计、被建造而成,供人们在其中游乐。而产业 AI 的迷宫却由现实的限制构成,是一盘整个世界都要面对的困局。


华为云这位寻路者,一边着手拆掉壁垒、抹平坎坷,一边向整个世界高呼:不要适应迷宫,要战胜迷宫。



在过去的一年中,华为云的工作已经完成了不少。我们看到 AI 在保护远方的雨林,看到成为了普通人手中的工具。而在 2 月 28 日即将启动的华为开发者大会 2020(Cloud)DevRun Live 技术沙龙直播首秀中,我们还将看到基于华为云 AI 平台开发口罩智能识别方案。面对突如其来的新冠肺炎疫情,科学和智能化的防控成为重中之重。如:口罩佩戴识别是疫情期间各园区和公共场合非常重要的管理工作,但是靠人力去 24 小时监督管理不仅费时费力且效率低下。本次直播将介绍如何基于华为云 AI 平台 ModelArts+HiLens 开发口罩智能识别方案,从数据准备、模型训练开发到应用部署等端到端的介绍整个方案的 AI 开发过程。


现在,已经有越来越多的人,艰难的走出了一条直线。当一切壁垒都被拆除,每个人都可以在 AI 起点走过一条直线,到达产业落地的终点。曾经的迷宫,也就变成了桥梁。


本文转载自脑极体公众号。


原文链接:https://mp.weixin.qq.com/s/PJw3UoCrzC3WNLjeTp_h5g


2020-02-26 22:501789

评论

发布
暂无评论
发现更多内容

音乐NFT系统开发的技术难点

北京木奇移动技术有限公司

区块链技术 软件外包公司 音乐NFT

音视频编解码的开发框架

北京木奇移动技术有限公司

音视频开发 音视频引擎 软件外包公司

面向法律场景的大模型RAG检索增强解决方案

阿里云大数据AI技术

人工智能 阿里云 LLM rag PAI

反向 Debug 了解一下?揭秘 Java DEBUG 的基本原理

京东科技开发者

图片秒变短视频!阿里妈妈“淘宝星辰·图生视频”向商家开放使用

新消费日报

如何在 Windows 上安装 Python 环境的详细指南

克莱因瓶

Easysearch Rollup 使用指南

极限实验室

Rollup Performance easysearch

从0到1:基于SSM的陪诊小程序开发笔记(一)

CC同学

普通人如何赶上AI大模型浪潮

老张

人工智能 AI 自由职业 第二曲线 大模型

智能网联汽车的数据脱敏

芯盾时代

车联网 物联网 数据安全 智能汽车

记录一次RPC服务有损上线的分析过程

京东科技开发者

版面分析技术研究方向:真实世界中更丰富的版面布局

合合技术团队

人工智能 AI 数据集 Transformer

《CPython Internals》阅读笔记:p151-p151

codists

CPython Internals

基于Springboot: 宠物小程序开发笔记(上)

CC同学

SimCorp最新买方调查显示,人工智能必须更好地融入投资流程

财见

AI智能体在自动化测试中的应用

测试人

【FAQ】HarmonyOS SDK 闭源开放能力 —Map Kit(4)

HarmonyOS SDK

harmoyos

音视频编解码开发的技术难点

北京木奇移动技术有限公司

音视频开发 音视频引擎 软件外包公司

音视频编解码的性能优化

北京木奇移动技术有限公司

软件外包公司 音视频编码 音视频解码

MIAOYUN荣获“新质榜样·2024信创力量最佳技术解决方案奖”

MIAOYUN

云计算 云原生 解决方案 信创 超融合

2025-01-15:执行操作可获得的最大总奖励 Ⅰ。用go语言,给定一个整数数组 rewardValues,其中包含 n 个代表奖励值的数字。 你开始时的总奖励 x 为 0,并且所有下标都是未标记状

福大大架构师每日一题

福大大架构师每日一题

基于云主机搭建Termgraph绘图工具,将数据转化为可视化图形

华为云开发者联盟

Python 云主机 鲲鹏 ECS 华为开发者空间

PIRF 421:Measurements – Embracing the Imperial System

Echo!!!

English

【GreatSQL优化器-11】finalize_table_conditions

GreatSQL

HBase深度历险

京东科技开发者

哈啰:构建智能出行RAG,ES还是向量数据库?

Zilliz

Milvus 向量数据库 rag 哈啰 zilliz cloud

没想到学会这个 canvas 库,竟然做这么多项目

秦少卫

Fabric.js 开源图片编辑器 开源vue图片编辑器 商品定制工具 服装设计工具

地平线Vision Mamba:超越ViT,最具潜力的下一代通用视觉主干网络

地平线开发者

自动驾驶 算法 地平线征程6

加入我们|申请成为亚马逊云科技 Community Builder,共建云端社区!

亚马逊云科技 (Amazon Web Services)

音乐 NFT 系统的智能合约开发

北京木奇移动技术有限公司

智能合约 软件外包公司 音乐NFT

深入了解淘宝天猫API接口:商品详情与关键词搜索商品列表的实用指南

代码忍者

淘宝API接口

寻路者华为云:在产业AI迷宫里走直线_AI&大模型_脑极体_InfoQ精选文章