微软发布人脸识别、计算机视觉和内容审核 API

阅读数:1062 2017 年 5 月 15 日

话题:微软AI

微软认知服务(Microsoft Cognitive Services)于四月底向其用户发布了人脸识别 API(Face API)、计算机视觉 API(Computer Vision API)和内容审阅 API(Content Moderator API)。

认知服务集合了多款 API 和服务,帮助开发人员在自己的应用程序中添加图像识别、语音、翻译和其他功能。这些 API 还可以帮助开发人员在他们的应用程序中添加人工智能和机器学习功能,而无需亲自动手开发这些功能。

人脸识别 API可以帮助检测并识别人脸。微软可以鉴别两张图像是否属于同一个人(这对于需要使用人脸识别技术来鉴别司机身份的公司来说非常实用,比如 Uber)。人脸识别 API 还可以根据视觉相似性将人分组。这一功能的用例之一就是将老年人和年轻人分在不同的类别中。如果一个人之前被标记过,人脸识别 API 也将在新的图像中再次识别他们。除此之外,人脸识别 API 还能检测人脸部的表情。

计算机视觉 API 可以根据内容对不同的图片打上标签。比如说,下图能得到“水”、“运动”、“游泳”和“游泳池”这样的标签。该 API 还能检测到这张图像不包含种族歧视和成人级内容。

计算机视觉 API 包括两个特定领域模型,帮助你识别地标和名人

计算机视觉服务也可以用一句话描述一张图像。举例来说,会有这样的描述:“一个人坐在一张长凳上”。微软还加入了手写检测功能,可以帮助检测、分段并读取手写的文字。他们展示了几个计算机视觉 API 将便利贴和备忘录内容转换为计算机可读文本的用例。

内容审阅 API可以帮助用户筛选应用程序中输入的文字和图像。它可以识别可能令人不悦的或不需要的图像,并查找图像中具有攻击性的文字。现在已实现检测超过 100 种语言的手写文字中令人不悦的内容。内容审阅 API 还能帮助搜索个人可识别信息(PII)。视频审核 API 可以帮助检测视频中的成人级内容,但该功能目前仅供预览。

2015 年 4 月这些 API 就作为 alpha 版本发布。在通用版本发布阶段的过程中还加入了许多功能。这些 API 是分布于视觉、语言、语音、搜索和知识领域的 25 种认知服务 API的一部分。用户可以免费使用这些 API 的一些数据内容。通过访问在线演示页面,你可以上传自己的图像试用 API 提供的功能,获取相应的数据。每月需要识别超过 30000 张图像的用户需要支付约每 1000 张图像 0.55 欧元 /0.65 美元到 1.27 欧元 /1.50 美元的费用。

查看英文原文Microsoft Releases APIs for Face Recognition, Computer Vision, and Content Moderation


感谢薛命灯对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们。