AICon全球人工智能与机器学习技术大会周四开幕,点击查看完整日程>> 了解详情
写点什么

Amazon Rekognition Video 发布:基于深度学习技术的视频识别功能

  • 2019 年 11 月 04 日
  • 本文字数:1962 字

    阅读完需:约 6 分钟

Amazon Rekognition Video 发布:基于深度学习技术的视频识别功能

在去年这个时候举办的 re:Invent 2016 大会上,Jeff 宣布推出 Amazon Rekognition 服务。我非常高兴能参与此项服务的开发工作,以构建图像识别解决方案。您可能已经知道,Amazon Rekognition Image 是一种利用深度学习技术提供可扩展的图像识别和分析功能的云服务。Amazon Rekognition Image 让您能够在应用程序和系统中构建和集成对象及场景检测、实时面部识别、名人识别、图片审阅和文本识别功能。


Amazon Rekognition Image 服务使用深度学习神经网络模型创建,基于与 Prime Photos 相同的技术 (此项技术使 Prime Photos 具备了每天分析数十亿张图像的强大能力)。发布之初,Rekognition 的关注点在于提供可扩展、自动化的图像分析、搜索和分类功能。今天,我很高兴地向大家宣布,此服务增加了一些新功能。



你好,Amazon Rekognition Video

大家好,这是我的新朋友,Amazon Rekognition Video。对,你们猜得没错,我一开始写的是《疤面煞星》里的台词:“来跟我的小朋友问个好”。但我最终没有这样写,而是走了一条“新路”,所以大家必须给我的创新精神点个赞。好了,言归正传,我们来讨论一下这项令人兴奋的新人工智能服务功能 – Amazon Rekognition Video


Amazon Rekognition Video 是一种新的视频分析服务功能,可为 S3 存储的视频以及实时视频流提供可扩展的计算机视觉分析能力。借助 Rekognition video,您可以准确检测、跟踪、识别、提取和审阅视频中的数千个对象、面部和内容。对于这项新功能,我认为更棒的是,它不仅能够提供有关视频中对象的准确信息,而且还是同类中第一个能够使用完整的视频内影像、时间和动作上下文执行活动检测和人员跟踪的视频分析服务。因此,借助其基于深度学习的功能,您可获得有关视频中正在执行什么活动的更完整的见解。例如,此服务功能可以识别视频中的人、车、树,以及推断出视频中的男子正在跑向汽车。这很酷,对吧!您可以想象一下,这项功能可为客户带来多么广阔的应用场景。



使用异步 Amazon Rekognition Video API 进行视频分析的过程如下:


  1. 对 .mp4 或 .mov 视频调用 Rekognition Video Start 操作 API。请注意,视频必须使用 H.264 编解码器编码。Start 操作 API 包括:

  2. StartPersonTracking

  3. StartFaceDetection

  4. StartLabelDetection

  5. StartCelebrityRecognition

  6. StartContentModeration

  7. Amazon Rekognition Video 处理视频并将 Start 操作 API 请求的完成状态发布到 Amazon SNS 主题。

  8. 您通过订阅 Amazon SQS 队列或您为 SNS 主题指定的 AWS Lambda 函数获取 API 完成结果通知。

  9. 使用 SNS 通知中提供的 JobID 调用与处理视频的 Start 操作 API 关联的 Get 操作 API。此外,Start API 响应中也包含 JobID。Get 操作 API 包括:

  10. GetPersonTracking

  11. GetFaceDetection

  12. GetLabelDetection

  13. GetCelebrityRecognition

  14. GetContentModeration

  15. 通过 Get 操作 API 返回的 JSON 和下组结果的分页标记 (如果适用) 获取视频分析结果。


您可以通过 AWS CLI、AWS 软件开发工具包和/或 REST API 使用 Amazon Rekognition Video 的视频分析功能。我坚信,在学习一项新服务时,没有比亲身实践和体验更好的学习方法了。那么,我们来试试吧!


首先,我将两个 .mp4 文件格式的音乐视频上传到存储我的播放列表歌曲的 S3 存储桶。两个音乐视频分别是 Foo Fighters 的 Run 和 DJ Khaled 的 Wild Thoughts。对,您想的没错,我对音乐的品味就是这么广博和多样!



接下来,我为 Rekognition Video 通知创建一个 SNS 主题,并创建一个接收 SNS 主题通知的 SQS 队列。




将我的 SQS 队列 RekognitionVideoQueue 订阅到我的 SNS 主题 SNS-RekogntionVideo-Topic



然后,使用 AWS CLI 对我的视频 DJ_Khaled-Wild_Thoughts.mp4 调用 start-face-detection API 操作,并从 API 响应中获取 JobId



系统通知 RekognitionVideoQueue SQS 队列收到来自 SNS 主题的消息,消息中的 StatusSUCCEEDED。此时,我可以使用 JobId 调用 get-face-detection API 操作获取视频分析结果。



我也可以调用 start-label-detectionget-label-detection API 操作来对另一个视频 Foo_Fighters-Run.mp4 进行视频分析,以获取视频帧中检测到的对象的相关信息。




总结


利用 Rekognition Video 和使用手机、摄像机、物联网视频传感器拍摄的视频,可以使用实时流视频处理创建可扩展、高精度的视频分析解决方案。这项新的深度学习视频功能可自动执行检测视频中对象、人脸和活动所需的一切任务,通过与其他 AWS 服务集成,您能够构建适合不同工作负载的强大媒体应用程序。


有关 Amazon RekognitionRekognition Video 新功能的更多信息,请查阅产品页面上的“入门”部分或 AWS 文档中的 Rekognition 开发人员指南。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/launch-welcoming-amazon-rekognition-video-service/


2019 年 11 月 04 日 08:00494

欲了解 AWS 的更多信息,请访问【AWS 技术专区】

评论

发布
暂无评论
发现更多内容

JDK8新特性 Fork/Join 的优化

Java小咖秀

Java java8 jdk8 forkjoin fork

有道技术沙龙 | AI 语音交互技术在语言学习场景的实践

有道技术团队

人工智能

TcaplusDB君 · 行业新闻汇编(3月17日)

TcaplusDB

数据库 nosql 后端 TcaplusDB Tcaplus

第8周大作业

八达鸟

拍乐云创始人&CEO赵加雨:深耕18载,打造全景式音视频服务

拍乐云Pano

音视频 WebRTC 在线教育 RTC 实时通信

数据驱动业务:一张大屏掌控城市运行,效率提高95%

一只数据鲸鱼

物联网 数据可视化 智慧城市 智慧园区 智慧交通

电影AI修复,让重温经典有了新的可能

华为云开发者社区

电影 华为云视频 AI修复 视频增强 经典

JVM笔记 -- 来,教你类加载子系统

秦怀杂货店

Java JVM 类加载 虚拟机

朋友,你听说过跨域吗

河磨

spring CORS 跨域

寻找被遗忘的勇气(十七)

Changing Lin

3月日更

什么时候编程语言不重要

soolaugust

编程语言

C/C++ 性能优化背后的方法论:TMAM

vivo互联网技术

c c++ 性能优化 cpu

上万字详解Spark Core(建议收藏)

五分钟学大数据

大数据 spark 28天写作 3月日更

Zookeeper.03 - 实现分布式锁

insight

zookeeper 3月日更

智慧公安二维码定位报警系统开发,微警务平台解决方案

源中瑞-龙先生

二维码定位报警系统开发 智慧公安 智慧公安扫码

怎么找属于自己最优的2B增长模型?

boshi

销售管理 SaaS 七日更

图解堆排序

Silently9527

Java 排序算法 堆排序

Oracle Sql性能优化

大数据技术指南

oracle 大数据 28天写作 3月日更

沙龙报名 | 云计算进入多元架构,云原生时代的挑战与机遇

京东科技开发者

云计算 云原生

故事开始了,Python 图像算法取经之旅 365 天的第 1 天

梦想橡皮擦

28天写作 3月日更

微信小程序开发:绑定手机号获取验证码功能

三掌柜

小程序 3月日更

“时间”都去哪儿了?性能调优分析方法与案例详解

京东科技开发者

数据库 客户端

GoPath模式和GoMoudle模式的相爱相杀

happlyfox

Go 28天写作 3月日更

EGG公链生态项目——EFTalk上的巴莱特定律

币圈那点事

区块链

从容一些,不必赶「Day 25」

道伟

28天写作

ECMAScript 2017(ES8)新特性简介

程序那些事

ecmascript 程序那些事 ecmascript 2017 es8

少些爹味才是好爹——再谈自主性

Justin

心理学 教育 28天写作 游戏设计

架构师训练营第十一周作业 - 命题作业

阿德儿

架构实践全景图

博文视点Broadview

知识图谱上的图神经网络

博文视点Broadview

一招让Kafka达到最佳吞吐量

万俊峰Kevin

Go kafka go-zero

数据cool谈(第2期)寻找下一代企业级数据库

数据cool谈(第2期)寻找下一代企业级数据库

Amazon Rekognition Video 发布:基于深度学习技术的视频识别功能-InfoQ