微软发布人脸识别、计算机视觉和内容审核API_微软_Roland Meertens

11 月 19 - 20 日 Apache Pulsar 社区年度盛会来啦，立即报名！了解详情 



 写点什么

微软认知服务（Microsoft Cognitive Services）于四月底向其用户发布了人脸识别 API（Face API）、计算机视觉 API（Computer Vision API）和内容审阅 API（Content Moderator API）。

认知服务集合了多款 API 和服务，帮助开发人员在自己的应用程序中添加图像识别、语音、翻译和其他功能。这些 API 还可以帮助开发人员在他们的应用程序中添加人工智能和机器学习功能，而无需亲自动手开发这些功能。

人脸识别API 可以帮助检测并识别人脸。微软可以鉴别两张图像是否属于同一个人（这对于需要使用人脸识别技术来鉴别司机身份的公司来说非常实用，比如Uber）。人脸识别API 还可以根据视觉相似性将人分组。这一功能的用例之一就是将老年人和年轻人分在不同的类别中。如果一个人之前被标记过，人脸识别API 也将在新的图像中再次识别他们。除此之外，人脸识别API 还能检测人脸部的表情。

计算机视觉API 可以根据内容对不同的图片打上标签。比如说，下图能得到“水”、“运动”、“游泳”和“游泳池”这样的标签。该API 还能检测到这张图像不包含种族歧视和成人级内容。

计算机视觉API 包括两个特定领域模型，帮助你识别地标和名人。

计算机视觉服务也可以用一句话描述一张图像。举例来说，会有这样的描述：“一个人坐在一张长凳上”。微软还加入了手写检测功能，可以帮助检测、分段并读取手写的文字。他们展示了几个计算机视觉API 将便利贴和备忘录内容转换为计算机可读文本的用例。

内容审阅API 可以帮助用户筛选应用程序中输入的文字和图像。它可以识别可能令人不悦的或不需要的图像，并查找图像中具有攻击性的文字。现在已实现检测超过100 种语言的手写文字中令人不悦的内容。内容审阅API 还能帮助搜索个人可识别信息（PII）。视频审核API 可以帮助检测视频中的成人级内容，但该功能目前仅供预览。

2015 年 4 月这些 API 就作为 alpha 版本发布。在通用版本发布阶段的过程中还加入了许多功能。这些API 是分布于视觉、语言、语音、搜索和知识领域的25 种认知服务API 的一部分。用户可以免费使用这些API 的一些数据内容。通过访问在线演示页面，你可以上传自己的图像试用API 提供的功能，获取相应的数据。每月需要识别超过30000 张图像的用户需要支付约每1000 张图像0.55 欧元/0.65 美元到1.27 欧元/1.50 美元的费用。

查看英文原文： Microsoft Releases APIs for Face Recognition, Computer Vision, and Content Moderation

感谢薛命灯对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作，请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博（ @InfoQ ， @丁晓昀），微信（微信号： InfoQChina ）关注我们。

发布

暂无评论

创作场景

微软发布人脸识别、计算机视觉和内容审核 API

评论

数字藏品：为什么这么火爆，那么多人购买？

直播回顾｜容器如何提升应用的稳定性？（附PPT下载）

运维去大公司好还是小公司好？你怎么看？

开源公开课丨ChengYing安装原理剖析

ChunJun Meetup演讲分享 | 基于袋鼠云开源框架的数仓一体化建设探索

泪洒阿里，面试惜败闭关2月金九银十再战Alibaba！

字节码增强技术之 Java Agent 入门

工赋开发者社区 | Transformers如何用于遥感？阿联酋MBZUAI最新《Transformers遥感处理》综述，涵盖60+种ViT遥感方法

面试以前上司，能力一般，不想给他通过，但他卑微哀求，怎么办？

不下载软件，可以把电脑本地文件快速传到远端服务器里吗？

历经70+场面试，我发现了大厂面试的bug，并总结其中心得

袋鼠云产品功能更新报告01期丨用诚心倾听您的需求

创作场景

微软发布人脸识别、计算机视觉和内容审核 API

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载