6小时模型迭代的背后故事:华为云ModelArts+HiLens在空管领域怎么用?

InfoQ

2020 年 11 月 20 日

6小时模型迭代的背后故事:华为云ModelArts+HiLens在空管领域怎么用?

在交通运输行业,民用航空无疑是“高大上”的典型代表。资料显示,全球航空业年直接产出超过 7 千亿美元,带动经济总量 2.7 万亿美元,是工业领域的重要支柱之一,也是传统行业中的明星与骄傲。


近年来,随着云计算、大数据、人工智能等技术在 IT 产业掀起热潮,飞机制造商、航空公司和机场运营方都希望借助新一代 IT 技术解决业内现存的诸多困难与障碍,提供更加安全高效、成本合理的运输服务。


在航空业数字化转型的大趋势中,机场运营方的航空管制智能改造是当下的一大热点项目。航空交通管制(ATC)是航空运输的管理枢纽。机场运营方特别希望能够借助前沿 IT 技术来提升 ATC 的自动化水平,消除潜在的安全隐患,同时提升机场的运营效率。


在这样的需求推动下,聚焦智能航空领域、专注人工智能技术和应用研发的上海麦图信息科技有限公司希望通过 AI 技术解决机场空管面临的诸多挑战。在研发机场智能塔台产品的过程中,麦图公司的团队选择了华为云 EI 的 ModelArts+HiLens 端云协同平台作为底层基础,快速开发出了高水平、低成本、符合实践要求的解决方案,获得了客户的认可与好评;项目也获得 2020 华为开发者大赛秋季赛《人工智能大赛》金奖。2020 年 11 月 17 日,华为云 DevRun 开发者沙龙邀请到了麦图团队分享其在华为云的帮助下创建产品的历程与经验。


从左到右:麦图团队——CTO 王宏锋;华为云 MVP、智能塔台技术总监徐擎阳;首席 AI 架构师李鑫;

AI 算法专家孔维国


打造智能塔台:已有痛点与解决思路


在繁忙的空港塔台,管制员需要时刻集中注意力,同时观察停机坪及跑道情况、与飞行员语音沟通、操控复杂的仪表面板等,并随时对突发事件做出正确的判断和应对。在航班密集期间,如此复杂的操作给管制员施加了巨大的压力,增加了忙中出错的潜在风险。另一方面,塔台本身的视野往往受限,尤其对机场跑道周围的活动很难准确把握。当出现“跑道侵入事件”时,管制员很难第一时间发现并通知飞行员规避,进而引发跑道安全事故。

为了帮助管制员分担压力,更准确地把握机场全景实况信息,特别是有效预防跑道侵入事件,麦图公司团队根据机场客户需求反馈,迭代开发了一套智能塔台系统。整套系统主要分为三大模块:


1、语音识别和自动化指令输出系统。该系统可以将管制员与飞行员的语音通信内容转化为结构化的文字指令及应答报告,显示在塔台的屏幕管理界面上。

2、机场全景摄像监控网络,将机场各处的视频监控画面综合起来,从中识别出每架飞机的实时位置和速度矢量,并将管制员当前指挥的飞机画面显示在管理界面中。该网络还对跑道周围的状况提供警戒,预防跑道侵入事件的发生。

3、综合管理界面。上述语音和视频内容统一显示在塔台的中控大屏上,与管制需要的其他信息结合,减少管制员低头、跨屏等复杂操作的频率,更好地集中注意力。

在分享直播中演示了整套系统的具体操作流程:管制员向飞机发出指令,系统自动将指令语音转换为结构化指令传送给目标飞机,并联动监控视频画面开始跟踪飞机动作,实时显示飞机位置与速度数据。当飞机准备进入跑道时,系统会提前检查跑道状况,预警入侵事件。飞机进入跑道后,系统自动联动中控台开启跑道入口警示灯,防止其他飞机进入跑道。

智能塔台主要解决了传统空管模式中“看”与“防”的两大痛点:智能视频监控提供飞机目标的识别、定位和动态显示,为管制员提供数字化的“自动望远镜”,追踪监控飞机的运行状况;跑道入侵预防系统则通过综合轨迹比对、场景提升和事故防范规则等预防跑道争抢,并在出现危险时及时发出灯光和信息警报,实践中,该系统可以显著提升塔台效率,降低地面事故风险,效果得到了客户的好评。


华为云 ModelArts+HiLens:快速开发成熟的机场智能视频网络


在项目早期阶段,麦图首先自行开发了语音识别和指令控制功能,解决了智能塔台系统的第一部分需求。而在面对第二部分的重头戏:AI 视频监控网络时,麦图团队意识到从零开始创建 In-house 方案是不现实的,无论是成本还是时间投入都超过了团队能力范围。面对“钱少事多时间紧”的现实约束,麦图开始着手寻找成熟的第三方基础设施。


经过分析对比,麦图最终选定了华为云 ModelArts+HiLens 云边一体的视觉 AI 开发平台。之所以选择华为云平台,麦图提到了技术选型中麦图看重的几大要点:


  • 生态支持。华为云 ModelArts+HiLens 有着比较完善的社区生态,可以满足麦图更多类型的需求。

  • 降低基建投入。一站式 AI 开发者平台 ModelArts 可以提供标注、训练、部署、运行的一整套生产流程,降低了麦图开发过程中需要的资源投入。

  • 快速开发迭代。在华为云平台完善的功能支持下,麦图最快可以做到 6 小时迭代一个新版本,极大提升了响应能力。

  • 成果投产可延续。华为云平台可以确保实验室方案能够顺利迁移到生产环境,避免冲突和回炉。

  • 供应链稳定可靠。作为国内领先的 AI 云服务提供商,华为云能够为麦图带来长期可靠的供应链保障。


在华为云 ModelArts+HiLens 平台中,核心组件之一就是一个小巧的黑盒子:HiLensKit。该设备集成了性能强大的华为 NPU,能够提供高算力的边缘侧 AI 推理能力,同时设备上自带的摄像头可以满足常见场景的监控需求。麦图团队首先使用 HiLens Kit 自带的摄像头开发出了演示产品,获得客户认可后继续开发了四路监控平台,每一部 HiLens Kit 设备连接四路视频信号进行 AI 分析,以降低生产环境中的部署成本。

华为云 ModelArts 主要提供模型的开发和部署平台,帮助麦图快速训练图像识别模型,并提供一站式的云端管理界面。系统端云一体的物理架构如下:

选定基础开发平台后,麦图根据企业级应用的核心——扩展——应用三层范式,将技术架构的全部内容归纳为三大类别。其中,核心部分是监控图像的采集和 AI 识别,扩展功能是根据识别出来的飞机图像进行坐标和轨迹处理,而应用部分则是结合底层数据开发中控平台。

智能视频监控开发实践:从原型开发到优化改进


确定了技术架构后,麦图团队就开始着手开发第一部分的视频 AI 识别模块。这一模块的技术需求是“稳、准、快”,即图像识别框可以稳定套在目标飞机上;多路视频并行识别,并使用仿雷达算法精确定位飞机运动轨迹;保证一秒 20 帧的目标检测频率。根据这样的要求,麦图首先使用 Python 开发了一个原型方案,实现了基本的功能与特性。

但 Python 方案的性能较低,无法满足生产环境需求。为提升方案速度,麦图开始寻找基于 C++ 代码的设计。由于麦图缺乏 C++ 的实践开发经验,因此将目光投向了华为云社区,并在华为云 HiLens 平台的技能市场上找到了一个成熟的多路识别程序。经过简单修改,麦图就以此为基础实现了一个 C++ 的识别模块。进一步,团队又通过将 API 改为 Socket 接口、减小采集图片大小的方式来降低单帧处理耗时,最终实现了每秒 20 帧的输出目标。


为确保图像识别结果框与管理界面显示的监控画面稳定对齐,麦图选择由 Kafka 来传输非图片数据、Redis 键值对保存视频帧,从而分担数据处理压力,实现精确对齐。为了获取目标飞机的精确运动轨迹,麦图开发了 2D->3D 的转换算法,利用摄像头内收集的畸变等数据与场内参考数据辅助实现 2D 画面到 3D 航迹的转换。此外,麦图的仿雷达算法可以通过跨摄像头联动来追踪飞机的连续运动轨迹,而卡尔曼滤波和匈牙利算法则可实现单摄像头多目标的识别能力。


在整个开发过程中,HiLens 平台的技能市场与便捷的云端操作界面给了团队很大的便利。开发人员只需简单几步操作即可转换 pb 模型到 om 模型,下载、配置和部署技能,可以随时根据需求和反馈快速调整现有设计。整个项目的第一版模型开发仅仅用时三天,快速完成了标定、训练的全过程,华为云 ModelArts+HiLens 功不可没。

云端赋能航空业数字化转型:华为云的实践与成就


麦图的智能塔台 AI 实践只是华为云解决方案赋能航空业的一个侧影。在智慧塔台领域之外,华为云还与瑞丽航空、深圳机场、迪拜机场等客户合作,开发了机场私有业务云、智慧一体化平台、模块化数据中心等创新方案,进而达成了旅客人脸识别登机、自助托运、自动化航班机位分配、智能主动安防体系等成果。通过 AI、IoT、大数据、融合通信等技术,华为云与客户携手实现业务协同与敏捷创新,打造出智慧机场的数字世界底座。2019 年,中国民航局还与华为云签署战略合作协议,就智慧民航顶层设计、智慧民航建设、科技创新与成果应用示范、标准制定、人才培养与合作交流等领域展开合作,共同推进智慧民航建设,践行民航强国战略。


从智能塔台到智慧机场,华为云在航空业数字化转型趋势中正在扮演着越来越重要的角色。可以预期,未来会有越来越多像麦图这样的合作伙伴携手华为云,凭借不同层面的解决方案帮助机场、航司提升生产力和安全性,为航空业的未来贡献一份力量。

2020 年 11 月 20 日 14:381057

评论

发布
暂无评论
发现更多内容

小师妹学JVM之:JIT中的LogCompilation

程序那些事

JVM 「Java 25周年」 小师妹 性能调优 JIT

必知必会,程序员都应该会的Linux的50个知识点!

Java小咖秀

Linux 面试 运维 Shell 经验

第三周作业

LEAF

Zoom 妥协!对免费用户开放端到端加密服务

神经星星

音视频会议 Zoom 端到端加密 隐私保护 数据保护

架构师训练营-week01 学习总结

GunShotPanda

重学 Java 设计模式:实战责任链模式「模拟618电商大促期间,项目上线流程多级负责人审批场景」

小傅哥

设计模式 小傅哥 重构 代码优化 责任链模式

加密与解密

返町

Android APP启动白屏优化

小菜鸟学php

android白屏

数据库如何弹性伸缩?

Aaron_涛

数据库 架构 云原生

架构师训练营第三周

Melo

你真的了解敏捷吗?听马丁福勒聊敏捷

涛哥

敏捷 数字化转型

英特尔宋继强:坚持科研的长期主义 推动AI向3.0时代跃迁

飞天鱼2017

当你输入get/set命令的时候,Redis做了什么

老胡爱分享

redis 源码分析

常年“佛系”Crysis勒索病毒突然变种 变身黑客工具合辑

360安全卫士

Free space——区块链加密社交平台新秀之作

Geek_116789

一种极致性能的缓冲队列

小楼

Java 性能

跨云厂商部署 k3s 集群

米开朗基杨

k3s wireguard

如何写出高质量的代码?(浅谈代码规范、重构、单元测试的重要性)

Nick

单元测试 重构 代码重构 代码规范

GitHub 热榜:一款堪称作业终结者的开源神器!

JackTian

GitHub 开源项目 工具类网站 学生党 Text-to-handwriting

架构师训练营第二周课后作业

赵凯

框架设计

互联网人的娱乐精神之28岁退休 & P8和生活助理的故事

码农神说

程序员 漫画 退休

对不起,我爱你

小天同学

小说 爱情 情感

培训机构出来的程序员常被鄙视,招谁惹谁了

程序员生活志

程序员 程序人生

Facebook 起诉水军公司:删不过来,我还告不过来吗?

神经星星

facebook 亚马逊云 AWS Lightsail 水军 虚假评论

【写作群星榜】6.12~6.19 写作平台优秀作者 & 文章排名

InfoQ写作平台

写作平台 排行榜

flutter开发

InfoQ_1c4a1f813eb1

SharePoint 往事之:一句话让 SharePoint 罢工

手艺人杨柳

SharePoint

思想不进化的人都是可怜人

Neco.W

提升认知 思考 进步 进化

架构师训练营作业 (第三周)

王海

极客大学架构师训练营

为什么Web开发人员在2020年不用最新的CSS功能

Geek_Willie

CSS

还在埋头干活?给程序员的几个忠告

四猿外

Java 深度思考 程序员 随笔杂谈 程序员成长

AI如何在普惠金融的探索中发挥作用?

AI如何在普惠金融的探索中发挥作用?

6小时模型迭代的背后故事:华为云ModelArts+HiLens在空管领域怎么用?-InfoQ