【QCon】精华内容上线92%,全面覆盖“人工智能+”的典型案例!>>> 了解详情
写点什么

腾讯优图升级为计算机视觉研发中心,与《科学》宣布战略合作

  • 2018-09-06
  • 本文字数:3653 字

    阅读完需:约 12 分钟

9 月 6 日,在腾讯优图计算机视觉峰会上,腾讯高级执行副总裁汤道生宣布,腾讯优图实验室升级为腾讯计算机视觉研发中心,并首次公开该实验室最全面的应用落地案例;与此同时,腾讯优图实验室也正式宣布和《科学》期刊达成了战略合作,探讨通过学术奖金、产学研交流等多种形式,在人工智能前沿研究领域展开广泛合作。

腾讯优图实验室现在已升级为腾讯计算机视觉研发中心,聚焦的方向为计算机视觉研究。近年来,虽然计算机视觉在在技术和应用层面均取得了巨大的进步,但面临着的挑战和瓶颈也不可忽视。

“一些重要的思想,只有拥有“傻”的精神 ,执着的精神,才能被证明是对的。”斯坦福大学电气工程荣誉教授,密码学先驱,2015 年图灵奖获得者 Martin Hellman 在演讲中讲述自己获得图灵奖的过程时如此说道。在所有研究领域,包括计算机视觉,这种精神都同样适用。

与《科学》达成战略合作

峰会上,腾讯高级执行副总裁汤道生宣布国际化战略合作项目:与《科学》(Science)杂志达成战略合作,推动全球计算机视觉发展。

谈到与《科学》的合作的契机,贾佳亚说道,与学术的结合已经成为人工智能领域的趋势,腾讯渴望建立与国际上紧密的合作关系,腾讯将研发和场景结合,旨在为中国科研人员引入最先进的学术平台。另外,《科学》的科学家资源丰富,通过将腾讯的实践应用运用到科学家们的研发和教学中,建立起产业和研究联系的机制,以促进中国人工智能发展。

但关于与《科学》杂志的具体合作规划,腾讯未透露相关信息。

腾讯优图最全公开应用落地

腾讯优图实验室成立于 2012 年,是腾讯三大人工智能实验室之一,聚焦计算机视觉,专注在图像处理、模式识别、机器学习、数据挖掘等领域开展技术研发和业务落地。相比 AI Lab,优图实验室更偏应用,后者更多地做基础研究,腾讯公司对这两者的投入比例大概为 1:1。而三大人工智能实验室之一的微信 AI 团队,则主要聚焦于微信中的 AI 功能应用。

据腾讯优图实验室总经理、杰出科学家贾佳亚介绍,目前,腾讯优图每日服务调用次数达 3 亿次,主要调用技术为图像。

在技术上,优图重点专注于图像技术及人脸技术的研究及应用探索。图像技术包含图像识别、智能鉴黄、OCR 技术、图像分割以及超分辨率技术等。人脸识别包含人脸配准追踪技术、人脸核身技术、活体检测技术、海量人脸检索技术等。

目前优图 AI 技术已经广泛应用在零售、工业、社交娱乐、社会公益、道路感知、金融、鉴黄、安防、医疗、政务等领域,在手机 QQ、QQ 空间、QQ 音乐、微信、广点通、全民 K 歌、腾讯觅影等产品中落地,并与滴滴、公安部门、快递等行业已经有了合作案例。其中,智能医疗和自动驾驶是该实验室今年刚涉足的领域。

医疗 AI 案例

2017 年,腾讯优图实验室借助图像识别、深度学习等技术,在肺癌、糖尿病性视网膜病变早筛上取得显著进展,并通过腾讯首个医疗 AI 产品“腾讯觅影” 进入大规模的临床预试验,在早期肺癌识别,敏感度 (识别正确率) 达到 86%以上,在良性肺结核的特异性 (识别正确率)超过 86%;糖尿病视网膜病变筛查,筛查准确率提升至 96%,几乎接近医生的诊断结果。

安防 AI 案例

优图天眼系统:以安防需求为导向,基于多场景海量数据库,自研深度学习和集群计算的人脸检索引擎,面向寻亲、缉查布控、刑侦办案、安防活动、社会服务等多场景推出的智能化海量人脸检索解决方案。优图天眼支持亿级别库的人脸检索系统,毫秒级识别速度,迅速完成目标人脸和名单照片库的比对,及时返回可疑人脸数据,实现报警通知。

  

智慧零售案例

腾讯优 Mall 智能零售系统:腾讯优图实验室联合腾讯云打造。基于腾讯优 Mall 智能零售系统,通过人脸检索、识别技术,识别进店顾客身份,并为老客户进行推荐,最后通过“刷脸”完成支付动作,提升消费者体验,并帮助商场优化购物动线、店铺位置、货架陈列,提升导购推荐效率以及优化广告人群定向属性等,促使线下门店实现数据化和智能化,改变门店运营方式,让门店具有思考能力。

目前,优 Mall 智能零售系统已经通过百丽进行落地。

金融,政务 AI 案例

FaceIn 人脸核身解决方案:一种通过用户的一段自拍视频(或一张自拍照)与另外一张照片(可来源于身份证或事先留存自拍照)之间的 1:1 人脸验证来确认用户身份的技术手段,主要包括身份证 OCR 、活体检测、人脸比对。优图人脸核身服务是业内首家在金融行业(微众银行 APP)全量上线的核身服务,既能满足用户实名认证的需求,还能在识别用户为本人的同时判断是否为真人。目前,优图人脸核身服务已在微众银行、联通、滴滴多个产品中落地使用,同时被应用在政务领域,如“远程缴税”“远程领取社保”。

互联网 AI 案例

为短视频拍摄、直播、图像处理工具等互联网产品推出了包含「主播核身 + 美颜特效」的视频直播解决方案,通过主播的自拍视频(或一张自拍照)与另外一张照片(可来源于身份证或事先留存自拍照)之间的 1:1 人脸验证来确认主播身份,防止主播身份造假。美颜特效模块包含了美容美妆、滤镜、动态贴纸、人脸融合等一系列与美相关的能力。目前优图视频直播解决方案已在 B 站、东方财富、快看漫画等多个产品中落地使用;安全审核解决方案基于优图智能鉴黄技术、暴恐图片识别技术、OCR 技术和人脸识别技术,可以精准识别出图片中的露点 & 不雅行为等色情内容、暴力恐怖内容、恶意文本以及政治敏感人物,针对广告、社交、游戏、直播、短视频等行业存在的 UGC 内容,辅助甚至代替人工过滤垃圾,提高审核效率。目前优图视频直播解决方案已在斗鱼、龙珠、映客等平台上线使用。

物流业 AI 案例

优图实验室与顺丰达成合作,针对运单的收寄件人电话号码、和收件人省市区地址信息进行 OCR 自动识别信息,再结合自有运单数据库,可以自动匹配到更完整更充分的运单各字段信息,大幅提升运单信息录入效率和物流资源的调度匹配能力,支持印刷体和手写体识别,可以高精度识别身份证、名片、银行卡、行驶证驾驶证等卡证类,也支持票据、运单等定制化场景的识别,可以有效的代替人工录入信息的场景。

     

(优图 OCR 技术与竞品数据比较)

  

(AI+ 社交娱乐 优图 Facekit,目标是摆脱手机端对于三维的依赖,希望通过单目摄象头,完成整个脸部追踪和三维重建)

其中,在 AI+ 社交娱乐领域,腾讯优图此前的开发集中在 3D 人脸、人脸分析和人脸编辑方面,比如用新的方法改变人的外貌、改变人的皱纹等。但今年,优图新做的技术包括人体分割,达到了 96% 的准确率;在人体关键点追踪方面,超过 80 个点的追踪标准的误差率降低至 0.48;人体重建方面,优图可以重建 3D 人脸,这对于游戏行业的应用非常巨大。

另外,优图进行的新探索还包括人体三维和三维重建。很多游戏里面我们需要大量的动作捕捉,3D 建模是非常昂贵的过程,我们要让娱乐设备姿态捕捉要人体建模。传统的游戏姿势捕捉和人体建模成本高昂,优图则可以通过一个 Video 就能实现一个 3D 建模的匹配和完成,这包括几个重要的方面:一是人体重建算法,第二是动作捕捉的算法,优图在人体重建可以达到 53 毫米的精度,动作捕捉是 74 毫米的精度。在游戏的设计和研发过程中,这会产生非常大的作用。

  

以上二维码为腾讯优图与《科学》杂志合作上线的 AI 产品体验小程序,有兴趣的朋友可以尝试下。

计算机视觉领域仍有待突破

正如斯坦福大学电气工程荣誉教授,密码学先驱,2015 年图灵奖获得者,现如今已 70 多岁高龄的 Martin Hellman 在演讲中以几个自己的个人经历,见证了计算机视觉技术跨世纪的发展。

19 世纪 70 年代,Hellman 在 IBM 工作时有一个关于 OCR 识别邮政编码的项目。当时,这对他来说是个巨大的挑战,因为当时 OCR 一分钟只能识别一个邮编,比人的速度还慢。但是,随着计算机视觉技术的发展,这已经不是问题,因为 OCR 识别邮编的速度已经提高到 5s 识别一个邮编,现如今更是花 0.5s 的时间就可以做到。

但计算机视觉虽然历经了六十年的发展,成为备受关注的人工智能关键技术之一。但是到今天为止,真正的大规模成熟应用还是屈指可数,比如指纹识别、车牌识别或者数码相机里面的一些人脸检测技术。出现这种现象,很大的原因是技术的局限,很多技术还面临着挑战。以 Object detection(物体检测)任务为例,我们有从 Fast R-CNN 、Faster R-CNN、R-FCN 到 FPN 等各种不同的目标检测器,但 2016 年 ILSVRC 最好的 MAP 仅有 0.6627。包括几个最常用的落地产品,如视频监控,也并非完全成熟,还存在着视频数据采集单一,视频中个体尺度各异、视频分辨率低、个体部分遮挡、拍摄视角变化等问题都会影响到算法的实际应用效果,现实世界的识别更加复杂,存在的挑战和困难也更多。

这些例子表明,计算机视觉目前还只能用于一些对准确率要求不是特别高的场景,还远没有达到大规模应用的程度。但随着越来越多的企业和研究资源进入这一领域,正如 Martin Hellman 所说,“一些重要的思想,只有拥有“傻”的精神 ,执着的精神,才能被证明是对的。”计算机视觉领域出现下一个技术或应用上的突破,同样也需要这种精神。

感谢蔡芳芳对本文的审校。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2018-09-06 19:004837
用户头像

发布了 42 篇内容, 共 13.6 次阅读, 收获喜欢 53 次。

关注

评论

发布
暂无评论
发现更多内容

决胜AI金融新赛道!Python Quants 创始人分享宝贵 AI 算法交易经验

图灵教育

人工智能

使用Java实现BMI指数测试

魏铁锤

10月月更

极客时间运维进阶训练营第一周作业

chenmin

Nginx多方面调优策略

乌龟哥哥

10月月更

1024@程序员:图灵社区福利来了,请本人签收

图灵社区

程序员节

Java之面向对象

魏铁锤

10月月更

Jib构建镜像问题从定位到深入分析

程序员欣宸

Docker 10月月更 Jib

【C++】选择排序​

游坦之

10月月更

举三反一,一通百通的“数学脑”是怎样炼成的?

图灵社区

数学

C4D2023取消永久许可?Maya推出精简版?你不能错过的7个CG软件资讯...

Renderbus瑞云渲染农场

CG Renderbus瑞云渲染 渲染软件更新

阿里也没想到14年后“互联网寒冬”这个词还能火

雨果

Go 语言入门很简单:Go 使用 Redis

宇宙之一粟

redis Go 语言 10月月更

MySQL 中文分词原理

乌龟哥哥

10月月更

举三反一,一通百通的“数学脑”是怎样炼成的?

图灵教育

数学 科普

1024@程序员:图灵社区福利来了,请本人签收

图灵教育

程序员节

决胜 AI 金融新赛道!Python Quants 创始人分享宝贵 AI 算法交易经验

图灵社区

人工智能

“程”风破浪的开发者|Web3用合约让利润分配更公平

石云升

区块链 Web3.0 10月月更 “程”风破浪的开发者

分享5个可能用得上的JavaScript 库

devpoint

JavaScript i18n

测试覆盖率治不好你的精神内耗

光毅

测试 测试覆盖率

“程”风破浪的开发者 | 踉踉跄跄的Java之路

游坦之

Java 学习方法 “程”风破浪的开发者

【资损】资损防控的系统规范-内部接口类设计

小明Java问道之路

架构 微服务 安全 10月月更 资损

golang中的nil接收器

六月的

golang nil

谈谈电商系统中的商品模块设计

乌龟哥哥

10月月更

容器和单机容器编排入门与实战

poseidom

,docker Docker 镜像

Centos7对外开放端口 | 运维 | Linux

Appleex

Linux Centos 7 运维、

SpringCloud-06 Zuul学习笔记

游坦之

10月月更

CSS中px、rem与em的区别

木偶

CSS 前端 10月月更

【web 开发基础】PHP 快速入门(8)-PHP 运算符之逻辑运算符详解

迷彩

逻辑运算符 10月月更 web开发基础 PHP基础

类型转化问题

魏铁锤

10月月更

从事数字化转型的你,搞清楚这些数据类基础理念了吗

雨果

数据中台 数据仓库 数据湖

【一Go到底】第二十四天---时间和日期函数

指剑

Go golang 10月月更

腾讯优图升级为计算机视觉研发中心,与《科学》宣布战略合作_腾讯_陈利鑫_InfoQ精选文章