写点什么

亚马逊 Rekognition Service 增加新特性

  • 2017-12-07
  • 本文字数:1168 字

    阅读完需:约 4 分钟

亚马逊在最近的一篇博文中宣布了 Rekognition Service 新增的三项新特性。这些新特性可用于识别图像中的文本、最多可从一张图片中识别出一百张人脸,以及基于上千万张人脸进行实时脸部识别。

亚马逊在 re:Invent 2016 大会上推出了 Rekognition,开发人员因此可以在他们的应用中加入图片分析功能。后来,亚马逊在这方面又投入更多资源推出新的特性。Pinterest 是 Rekognition 的早期用户之一,Pinterest CTO Vanja Josifovski

作为一个以视觉为驱动的平台,Pinterest 高度依赖图像处理的速度和质量,而图像中的文本也同样重要,因为它们提供了重要的上下文信息,对于我们的两亿活跃用户来说至关重要。借助 Rekognition 的文本识别能力,我们能够更好地从存储在 S3 上的大规模图片中抽取文本。我们期待继续与 AWS 合作,为我们的用户提供更高质量的服务和更好的体验。

Web 和移动开发者媒体管理平台 Cloudinary 已经将 Rekognition 的新特性用到他们的服务当中。Cloudinary 的业务拓展副总裁 Daniel Amitai

Cloudinary 与 AWS 紧密合作,促进这项解决方案的落地。我们与 Rekognition 的集成让这项工作取得长足的进步,省去了手动分析图片内容的枯燥工作,让用户可以自动地对图片进行分类。

Rekognition API 提供了一些操作用于脸部识别和图像分析:

  • DetectFaces——最多可从一张图片中识别出一百张人脸,并提供每张人脸的相关细节,如年龄范围、性别和表情。

  • CompareFaces——用于比对脸部特征。可以对输入图像与目标图像中的人脸进行比对,最多可以支持单张图像中最大的一百张人脸比对。

  • DetectText——检测和抽取图像中的文本,文本以元素数组的方式返回。

  • RecognizeCelebrities——识别图像中的名人,最多支持一百个。识别结果中包含名人的细节信息,如名字、URL 链接和匹配指数。

用户可以登录 AWS 体验这组 API。

开发者可以使用这组 API 对上传到 S3 的对象或字节数组进行分析。Rekognition 支持 JPEG 和 PNG 格式的图片,如果是 S3 对象,最大可以达到 15MB,如果是字节数组,最大可以达到 5MB。Rekognition API 支持 Java、.NET 和 Python,目前在美国和欧洲可用,官网给出了定价细节。

亚马逊、谷歌和微软在 AI 产品方面展开竞争,希望为自己的平台带来更多的用户。微软的 Cognitive Service 提供了超过 25 组 API,包括 Emotion API 和 Computer Vision API,它们都具备图片和人脸分析能力。谷歌推出了 Vision API,可以检测图片中的物体和人脸。谷歌和微软比亚马逊要早走一步,而现在亚马逊也迎头追击。Investopedia 的一篇文章中写道:

亚马逊的颓势在于 AI 应用的开发,AI 应用可以助力云计算用户的数据分析、语音识别和图像识别。虽然亚马逊仍然是云计算的市场领头羊,但微软和谷歌正通过推出 AI 产品来缩小差距,为用户提供更多的选择。

查看英文原文 Amazon Adds New Features to Its Rekognition Service

2017-12-07 18:001488
用户头像

发布了 322 篇内容, 共 159.8 次阅读, 收获喜欢 148 次。

关注

评论

发布
暂无评论
发现更多内容

Mimir 源码分析(二):效率爆棚的分片压缩

Grafana 爱好者

Mimir

【机器学习】梯度下降之数据标准化

计算机魔术师

8月月更

【机器学习】浅谈正规方程法&梯度下降

计算机魔术师

8月月更

融齐鲁,行中国,为天下溪:新华三的数字化赋能之路

脑极体

架构实战营模块 7 作业

Roy

架构实战营

MySQL数据库之数据查询

乌龟哥哥

8月月更

【SpringBoot 一】SpringApplication启动类的Args详解

石臻臻的杂货铺

spring-boot 8月月更

C++中转换构造函数与默认函数的优先级

计算机魔术师

8月月更

架构实战训练营|毕业总结

Roy

架构实战营

每日一 R「18」类型系统进阶(二)

Samson

学习笔记 8月月更 ​Rust

Mimir 速体验(Part 2): 使用 Grafana agent 实现多租户数据抓取

Grafana 爱好者

Prometheus Mimir

Mimir 源码分析(一):海量series chunk 同时落盘带来的挑战

Grafana 爱好者

Mimir

设计电商秒杀系统

Pengfei

俄罗斯方块彩蛋(附星空表白彩蛋)

计算机魔术师

8月月更

Git -- 入门这一篇就够了 (入门必备,超硬核)

计算机魔术师

8月月更

【实践】高性能PHP应用容器workerman快速入门

迷彩

即时通讯 通讯协议 8月月更 workerman 高性能php

Mimir 速体验(Part 3): 通过 runtime 配置实现租户细粒度管理

Grafana 爱好者

可观测性 Grafana Mimir

番外篇 of 《Mimir 源码阅读(三): 任意乱序数据的写入》

Grafana 爱好者

Mimir

【Django | 项目搭建】快速搭建自己的项目

计算机魔术师

8月月更

电商秒杀系统设计

Roy

架构实战营

架构实战营模块 8 作业

Roy

架构实战营

Mimir 源码分析(三):任意时间范围乱序数据写入

Grafana 爱好者

Mimir

什么是 Golang?[译]

宇宙之一粟

Mimir 速体验(Part 1): 使用 docker-compose 一键部署单体版集群

Grafana 爱好者

可观测性 Prometheus Mimir

vue2 el-checkbox实现分组全选/反选/半选

Mr.Cactus

Element UI JavaScrip 分组全选

leetcode 696. Count Binary Substrings 计数二进制子串(简单)

okokabcd

LeetCode 算法与数据结构

[CSS入门到进阶] 你真的了解 width height 吗?

HullQin

CSS JavaScript html 前端 8月月更

C语言基本的窗口开发

计算机魔术师

8月月更

趣味俄罗斯游戏开发心得

计算机魔术师

8月月更

【Django | 增删改查】学生管理系统案例

计算机魔术师

8月月更

【小程序 | 启航篇】一文打通任督二脉

计算机魔术师

8月月更

亚马逊Rekognition Service增加新特性_亚马逊云科技_Steef-Jan Wiggers_InfoQ精选文章