阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

腾讯优图升级为计算机视觉研发中心,与《科学》宣布战略合作

  • 2018-09-06
  • 本文字数:3653 字

    阅读完需:约 12 分钟

9 月 6 日,在腾讯优图计算机视觉峰会上,腾讯高级执行副总裁汤道生宣布,腾讯优图实验室升级为腾讯计算机视觉研发中心,并首次公开该实验室最全面的应用落地案例;与此同时,腾讯优图实验室也正式宣布和《科学》期刊达成了战略合作,探讨通过学术奖金、产学研交流等多种形式,在人工智能前沿研究领域展开广泛合作。

腾讯优图实验室现在已升级为腾讯计算机视觉研发中心,聚焦的方向为计算机视觉研究。近年来,虽然计算机视觉在在技术和应用层面均取得了巨大的进步,但面临着的挑战和瓶颈也不可忽视。

“一些重要的思想,只有拥有“傻”的精神 ,执着的精神,才能被证明是对的。”斯坦福大学电气工程荣誉教授,密码学先驱,2015 年图灵奖获得者 Martin Hellman 在演讲中讲述自己获得图灵奖的过程时如此说道。在所有研究领域,包括计算机视觉,这种精神都同样适用。

与《科学》达成战略合作

峰会上,腾讯高级执行副总裁汤道生宣布国际化战略合作项目:与《科学》(Science)杂志达成战略合作,推动全球计算机视觉发展。

谈到与《科学》的合作的契机,贾佳亚说道,与学术的结合已经成为人工智能领域的趋势,腾讯渴望建立与国际上紧密的合作关系,腾讯将研发和场景结合,旨在为中国科研人员引入最先进的学术平台。另外,《科学》的科学家资源丰富,通过将腾讯的实践应用运用到科学家们的研发和教学中,建立起产业和研究联系的机制,以促进中国人工智能发展。

但关于与《科学》杂志的具体合作规划,腾讯未透露相关信息。

腾讯优图最全公开应用落地

腾讯优图实验室成立于 2012 年,是腾讯三大人工智能实验室之一,聚焦计算机视觉,专注在图像处理、模式识别、机器学习、数据挖掘等领域开展技术研发和业务落地。相比 AI Lab,优图实验室更偏应用,后者更多地做基础研究,腾讯公司对这两者的投入比例大概为 1:1。而三大人工智能实验室之一的微信 AI 团队,则主要聚焦于微信中的 AI 功能应用。

据腾讯优图实验室总经理、杰出科学家贾佳亚介绍,目前,腾讯优图每日服务调用次数达 3 亿次,主要调用技术为图像。

在技术上,优图重点专注于图像技术及人脸技术的研究及应用探索。图像技术包含图像识别、智能鉴黄、OCR 技术、图像分割以及超分辨率技术等。人脸识别包含人脸配准追踪技术、人脸核身技术、活体检测技术、海量人脸检索技术等。

目前优图 AI 技术已经广泛应用在零售、工业、社交娱乐、社会公益、道路感知、金融、鉴黄、安防、医疗、政务等领域,在手机 QQ、QQ 空间、QQ 音乐、微信、广点通、全民 K 歌、腾讯觅影等产品中落地,并与滴滴、公安部门、快递等行业已经有了合作案例。其中,智能医疗和自动驾驶是该实验室今年刚涉足的领域。

医疗 AI 案例

2017 年,腾讯优图实验室借助图像识别、深度学习等技术,在肺癌、糖尿病性视网膜病变早筛上取得显著进展,并通过腾讯首个医疗 AI 产品“腾讯觅影” 进入大规模的临床预试验,在早期肺癌识别,敏感度 (识别正确率) 达到 86%以上,在良性肺结核的特异性 (识别正确率)超过 86%;糖尿病视网膜病变筛查,筛查准确率提升至 96%,几乎接近医生的诊断结果。

安防 AI 案例

优图天眼系统:以安防需求为导向,基于多场景海量数据库,自研深度学习和集群计算的人脸检索引擎,面向寻亲、缉查布控、刑侦办案、安防活动、社会服务等多场景推出的智能化海量人脸检索解决方案。优图天眼支持亿级别库的人脸检索系统,毫秒级识别速度,迅速完成目标人脸和名单照片库的比对,及时返回可疑人脸数据,实现报警通知。

  

智慧零售案例

腾讯优 Mall 智能零售系统:腾讯优图实验室联合腾讯云打造。基于腾讯优 Mall 智能零售系统,通过人脸检索、识别技术,识别进店顾客身份,并为老客户进行推荐,最后通过“刷脸”完成支付动作,提升消费者体验,并帮助商场优化购物动线、店铺位置、货架陈列,提升导购推荐效率以及优化广告人群定向属性等,促使线下门店实现数据化和智能化,改变门店运营方式,让门店具有思考能力。

目前,优 Mall 智能零售系统已经通过百丽进行落地。

金融,政务 AI 案例

FaceIn 人脸核身解决方案:一种通过用户的一段自拍视频(或一张自拍照)与另外一张照片(可来源于身份证或事先留存自拍照)之间的 1:1 人脸验证来确认用户身份的技术手段,主要包括身份证 OCR 、活体检测、人脸比对。优图人脸核身服务是业内首家在金融行业(微众银行 APP)全量上线的核身服务,既能满足用户实名认证的需求,还能在识别用户为本人的同时判断是否为真人。目前,优图人脸核身服务已在微众银行、联通、滴滴多个产品中落地使用,同时被应用在政务领域,如“远程缴税”“远程领取社保”。

互联网 AI 案例

为短视频拍摄、直播、图像处理工具等互联网产品推出了包含「主播核身 + 美颜特效」的视频直播解决方案,通过主播的自拍视频(或一张自拍照)与另外一张照片(可来源于身份证或事先留存自拍照)之间的 1:1 人脸验证来确认主播身份,防止主播身份造假。美颜特效模块包含了美容美妆、滤镜、动态贴纸、人脸融合等一系列与美相关的能力。目前优图视频直播解决方案已在 B 站、东方财富、快看漫画等多个产品中落地使用;安全审核解决方案基于优图智能鉴黄技术、暴恐图片识别技术、OCR 技术和人脸识别技术,可以精准识别出图片中的露点 & 不雅行为等色情内容、暴力恐怖内容、恶意文本以及政治敏感人物,针对广告、社交、游戏、直播、短视频等行业存在的 UGC 内容,辅助甚至代替人工过滤垃圾,提高审核效率。目前优图视频直播解决方案已在斗鱼、龙珠、映客等平台上线使用。

物流业 AI 案例

优图实验室与顺丰达成合作,针对运单的收寄件人电话号码、和收件人省市区地址信息进行 OCR 自动识别信息,再结合自有运单数据库,可以自动匹配到更完整更充分的运单各字段信息,大幅提升运单信息录入效率和物流资源的调度匹配能力,支持印刷体和手写体识别,可以高精度识别身份证、名片、银行卡、行驶证驾驶证等卡证类,也支持票据、运单等定制化场景的识别,可以有效的代替人工录入信息的场景。

     

(优图 OCR 技术与竞品数据比较)

  

(AI+ 社交娱乐 优图 Facekit,目标是摆脱手机端对于三维的依赖,希望通过单目摄象头,完成整个脸部追踪和三维重建)

其中,在 AI+ 社交娱乐领域,腾讯优图此前的开发集中在 3D 人脸、人脸分析和人脸编辑方面,比如用新的方法改变人的外貌、改变人的皱纹等。但今年,优图新做的技术包括人体分割,达到了 96% 的准确率;在人体关键点追踪方面,超过 80 个点的追踪标准的误差率降低至 0.48;人体重建方面,优图可以重建 3D 人脸,这对于游戏行业的应用非常巨大。

另外,优图进行的新探索还包括人体三维和三维重建。很多游戏里面我们需要大量的动作捕捉,3D 建模是非常昂贵的过程,我们要让娱乐设备姿态捕捉要人体建模。传统的游戏姿势捕捉和人体建模成本高昂,优图则可以通过一个 Video 就能实现一个 3D 建模的匹配和完成,这包括几个重要的方面:一是人体重建算法,第二是动作捕捉的算法,优图在人体重建可以达到 53 毫米的精度,动作捕捉是 74 毫米的精度。在游戏的设计和研发过程中,这会产生非常大的作用。

  

以上二维码为腾讯优图与《科学》杂志合作上线的 AI 产品体验小程序,有兴趣的朋友可以尝试下。

计算机视觉领域仍有待突破

正如斯坦福大学电气工程荣誉教授,密码学先驱,2015 年图灵奖获得者,现如今已 70 多岁高龄的 Martin Hellman 在演讲中以几个自己的个人经历,见证了计算机视觉技术跨世纪的发展。

19 世纪 70 年代,Hellman 在 IBM 工作时有一个关于 OCR 识别邮政编码的项目。当时,这对他来说是个巨大的挑战,因为当时 OCR 一分钟只能识别一个邮编,比人的速度还慢。但是,随着计算机视觉技术的发展,这已经不是问题,因为 OCR 识别邮编的速度已经提高到 5s 识别一个邮编,现如今更是花 0.5s 的时间就可以做到。

但计算机视觉虽然历经了六十年的发展,成为备受关注的人工智能关键技术之一。但是到今天为止,真正的大规模成熟应用还是屈指可数,比如指纹识别、车牌识别或者数码相机里面的一些人脸检测技术。出现这种现象,很大的原因是技术的局限,很多技术还面临着挑战。以 Object detection(物体检测)任务为例,我们有从 Fast R-CNN 、Faster R-CNN、R-FCN 到 FPN 等各种不同的目标检测器,但 2016 年 ILSVRC 最好的 MAP 仅有 0.6627。包括几个最常用的落地产品,如视频监控,也并非完全成熟,还存在着视频数据采集单一,视频中个体尺度各异、视频分辨率低、个体部分遮挡、拍摄视角变化等问题都会影响到算法的实际应用效果,现实世界的识别更加复杂,存在的挑战和困难也更多。

这些例子表明,计算机视觉目前还只能用于一些对准确率要求不是特别高的场景,还远没有达到大规模应用的程度。但随着越来越多的企业和研究资源进入这一领域,正如 Martin Hellman 所说,“一些重要的思想,只有拥有“傻”的精神 ,执着的精神,才能被证明是对的。”计算机视觉领域出现下一个技术或应用上的突破,同样也需要这种精神。

感谢蔡芳芳对本文的审校。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-09-06 19:004848
用户头像

发布了 42 篇内容, 共 13.6 次阅读, 收获喜欢 53 次。

关注

评论

发布
暂无评论
发现更多内容

十二要素应用: 云原生应用最佳实践

俞凡

架构 最佳实践 云原生

Clearview X for Mac(标签式电子书阅读器) v3.5.0激活版

iMac小白

WiFiSpoof for Mac(wifi地址修改工具) v3.9.4免激活版

iMac小白

TG Pro for mac(Mac硬件温度检测工具) v2.91激活版

iMac小白

OmniFocus Pro 3 for Mac(最强GTD时间管理工具)v3.15.6中文激活版

影影绰绰一往直前

央视财经推出两会AI数字人主播!

青否数字人

Cookie for Mac(浏览器缓存清理工具) v7.2.3免激活版

iMac小白

DJ Mix Pads 2 - Remix Version for Mac(独特DJ混音创作软件)v16.0.1激活版

影影绰绰一往直前

n-Track Studio Suite for Mac(多轨音乐制作软件) 10.0.0 (8466)激活版

iMac小白

淘系接口推荐:淘宝店铺所有商品数据接口

tbapi

淘宝API接口 淘宝店铺所有商品数据接口 淘宝商品数据采集

1688接口推荐:1688商品详情数据接口

tbapi

1688 1688API接口 1688商品详情数据接口 1688商品数据采集

央视两会数字主持人小天、小东完成交互!

青否数字人

数字人

遇到SSL/TLS层的攻击,有什么办法?

德迅云安全杨德俊

iNet Network Scanner for Mac(mac网络扫描工具) v3.0.6永久激活版

iMac小白

加密货币开发服务领域有哪些新兴机会

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

MediaHuman YouTube to MP3 Converter mac(YouTube音乐转MP3转换器)v3.9.9.89中文注册版

影影绰绰一往直前

Rocket Typist pro for mac(文本快速输入工具) v3.0.9激活版

iMac小白

RightFont for Mac(字体管理软件) v8.6.0免激活版

iMac小白

科技越发展普通人会越限制还是越free?

算法的秘密

实时工业控制系统的创新整合:PLC4X与CnosDB的高效数据采集与存储

CnosDB

开源 时序数据库 tsdb CnosDB

从零开始配置Jenkins与GitLab集成:一步步实现持续集成

百度搜索:蓝易云

云计算 Linux gitlab 运维 jenkins

Bookends for Mac(文献书籍管理工具)v15.0注册激活版

影影绰绰一往直前

告别过往,重获新生

少油少糖八分饱

村上春树 小说推荐 海边的卡夫卡

数字人怎样能做到不间断直播?

青否数字人

PDF Squeezer for Mac(强大的PDF文件压缩工具) v4.5.1免激活版

iMac小白

DropDMG for Mac (dmg制作工具) v3.6.7中文版

iMac小白

基于 Sass 的架构之 redis多租户

智慧源点

电动车窗开关中MOS管的应用解析

智趣匠

汽车电子 芯片技术 MOS管

腾讯优图升级为计算机视觉研发中心,与《科学》宣布战略合作_腾讯_陈利鑫_InfoQ精选文章