写点什么

亚马逊 Rekognition Service 增加新特性

  • 2017-12-07
  • 本文字数:1168 字

    阅读完需:约 4 分钟

亚马逊在最近的一篇博文中宣布了 Rekognition Service 新增的三项新特性。这些新特性可用于识别图像中的文本、最多可从一张图片中识别出一百张人脸,以及基于上千万张人脸进行实时脸部识别。

亚马逊在 re:Invent 2016 大会上推出了 Rekognition,开发人员因此可以在他们的应用中加入图片分析功能。后来,亚马逊在这方面又投入更多资源推出新的特性。Pinterest 是 Rekognition 的早期用户之一,Pinterest CTO Vanja Josifovski

作为一个以视觉为驱动的平台,Pinterest 高度依赖图像处理的速度和质量,而图像中的文本也同样重要,因为它们提供了重要的上下文信息,对于我们的两亿活跃用户来说至关重要。借助 Rekognition 的文本识别能力,我们能够更好地从存储在 S3 上的大规模图片中抽取文本。我们期待继续与 AWS 合作,为我们的用户提供更高质量的服务和更好的体验。

Web 和移动开发者媒体管理平台 Cloudinary 已经将 Rekognition 的新特性用到他们的服务当中。Cloudinary 的业务拓展副总裁 Daniel Amitai

Cloudinary 与 AWS 紧密合作,促进这项解决方案的落地。我们与 Rekognition 的集成让这项工作取得长足的进步,省去了手动分析图片内容的枯燥工作,让用户可以自动地对图片进行分类。

Rekognition API 提供了一些操作用于脸部识别和图像分析:

  • DetectFaces——最多可从一张图片中识别出一百张人脸,并提供每张人脸的相关细节,如年龄范围、性别和表情。

  • CompareFaces——用于比对脸部特征。可以对输入图像与目标图像中的人脸进行比对,最多可以支持单张图像中最大的一百张人脸比对。

  • DetectText——检测和抽取图像中的文本,文本以元素数组的方式返回。

  • RecognizeCelebrities——识别图像中的名人,最多支持一百个。识别结果中包含名人的细节信息,如名字、URL 链接和匹配指数。

用户可以登录 AWS 体验这组 API。

开发者可以使用这组 API 对上传到 S3 的对象或字节数组进行分析。Rekognition 支持 JPEG 和 PNG 格式的图片,如果是 S3 对象,最大可以达到 15MB,如果是字节数组,最大可以达到 5MB。Rekognition API 支持 Java、.NET 和 Python,目前在美国和欧洲可用,官网给出了定价细节。

亚马逊、谷歌和微软在 AI 产品方面展开竞争,希望为自己的平台带来更多的用户。微软的 Cognitive Service 提供了超过 25 组 API,包括 Emotion API 和 Computer Vision API,它们都具备图片和人脸分析能力。谷歌推出了 Vision API,可以检测图片中的物体和人脸。谷歌和微软比亚马逊要早走一步,而现在亚马逊也迎头追击。Investopedia 的一篇文章中写道:

亚马逊的颓势在于 AI 应用的开发,AI 应用可以助力云计算用户的数据分析、语音识别和图像识别。虽然亚马逊仍然是云计算的市场领头羊,但微软和谷歌正通过推出 AI 产品来缩小差距,为用户提供更多的选择。

查看英文原文 Amazon Adds New Features to Its Rekognition Service

2017-12-07 18:001499
用户头像

发布了 322 篇内容, 共 160.1 次阅读, 收获喜欢 148 次。

关注

评论

发布
暂无评论
发现更多内容

配电 低压电工经验总结(17)

万里无云万里天

工业 工厂运维

领域驱动设计(DDD)领域对象一定要讲究充血模型吗?

canonical

领域驱动设计 DDD 聚合根 可逆计算

BeeWorks企业即时通讯好用吗,马上简单了解一下!

BeeWorks

即时通讯 IM 私有化部署

AI 友好的云开发 MySQL SDK 它来了!微信小程序能直连关系型数据库了

蛋先生DX

微信小程序 云开发 AI‘’ mysql'

打破 “封闭垄断”:MyEMS 开源生态如何有效控制企业能源管理成本

开源能源管理系统

开源 能源管理系统

软件外包公司选择指南 - 郑州寻路科技专业建议

寻路科技

软件开发公司

为什么说境外舆情监测是全球化企业的必要投资?

沃观Wovision

舆情监测 沃观Wovision 海外舆情监测 境外舆情监测 舆情监测软件

信息化系统数据安全建设方案

金陵老街

数据安全 医疗安全

基于华为开发者空间,实现RFM分析与CLTV预测的电商客户细分与营销策略优化

华为云开发者联盟

RFM模型 华为开发者空间 CLTV

2026年境外舆情监测网站选型白皮书:功能、厂商与案例

沃观Wovision

舆情监测 沃观Wovision 海外舆情监测 境外舆情监测 舆情监测网站

MIAOYUN | 每周AI新鲜事儿(10.17-10.24)

MIAOYUN

AI 机器人 AIGC AI大语言模型 多模态模型

基于华为开发者空间云主机的软件安全栈溢出攻击实践

华为云开发者联盟

云主机 华为开发者空间

AI风险评估系统:技术架构、行业落地与风控效能革新

上海拔俗

一个基于 .NET 8 + Vue3 实现的极简 RABC 权限管理系统

追逐时光者

C# .net Vue

黑龙江龙江网络安全:等保测评的核心作用与覆盖范畴

等保测评

不止节能:MyEMS 为企业带来的成本控制、合规风控与数字化转型价值

开源能源管理系统

开源 开源能源管理系统

大数据-136 - ClickHouse 集群 表引擎详解 选型实战:TinyLog/Log/StripeLog/Memory/Merge

武子康

大数据 flink spark 分布式 Clickhouse

基于华为开发者空间云主机部署Typora高效内容创作,实现图片自动上传

华为云开发者联盟

Typora PicGo 华为开发者空间 云主机环境 对象存储服务 (OBS)

搞跨端渲染?你绕不开的HarfBuzz原理

非专业程序员Ping

大前端 ios 开发 an'droid

内网视频会议与外网视频会议的区别是什么?

BeeWorks

即时通讯 IM 视频会议 局域网

华为开发者空间,基于仓颉与DeepSeek的MCP智能膳食助手

华为云开发者联盟

MaaS DeepSeek v3 华为开发者空间

区块链 Web3 项目的开发流程

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

领域驱动设计(DDD)中聚合根的最主要职责真的是维护一致性吗?

canonical

领域驱动设计 DDD 领域模型 可逆计算 Nop平台

选对黑龙江等保测评公司:从合规准入到服务质量的全维度指南

等保测评

双碳目标下,MyEMS 为何成为制造企业的 “刚需工具”?

开源能源管理系统

开源 能源管理系统

【FAQ】HarmonyOS SDK 闭源开放能力 — AppGallery Kit

HarmonyOS SDK

HarmonyOS SDK应用服务

想了解ABAQUS,有没有比较好的SMULIA代理商公司推荐?

思茂信息

abaqus软件 达索 SMULIA代理商 思茂信息

提示词工程-复杂项目-VB Coding

Jxin

AI 软件工程 提示词工程 氛围编程

基于华为开发者空间-云开发环境,Vanna+MaaS实现自然语言与数据库对话

华为云开发者联盟

MaaS 华为开发者空间 云开发环境 Vanna Text-to-SQL

亚马逊Rekognition Service增加新特性_亚马逊云科技_Steef-Jan Wiggers_InfoQ精选文章