【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

腾讯优图实验室:践行科技向善,选择人脸识别是过往八年最重要的抉择之一

  • 2020-11-02
  • 本文字数:4293 字

    阅读完需:约 14 分钟

腾讯优图实验室:践行科技向善,选择人脸识别是过往八年最重要的抉择之一

过往,人工智能的发展一直伴随着业界对是否会引发伦理问题的讨论,这也让很多技术停留在了实验室中,很难走出去,真正落到产业界。自 2012 年成立以来,腾讯优图实验室便在人工智能的各个领域展开了研究,尤以人脸识别为最,坚持基础研究、产业落地两条腿走路的优图实验室在科技向善上找到了最佳的落地姿势。

一家实验室的竞争力是什么?

在不同的阶段、不同的环境和不同的位置,实验室所扮演的角色以及承载的使命不尽相同。


在人工智能领域,很多技术突破尚需依赖学术进展,科技巨头们纷纷开始扶持内部实验室的发展,并不断招揽学术界的大佬加盟工业界。但是,实验室在一家企业中的定位一直不是很清晰,纯粹的学术研究意味着不仅烧钱,短期内还很难看到收益。


历史上最成功的实验室当属贝尔实验室,辉煌时期的贝尔实验室平均每天都会获得一项专利,这里诞生了 UNIX 系统、C 语言、手机通讯系统基础理论等,11 位科学家获得了诺贝尔奖,16 位获得美国最高科学、技术奖,4 位获得图灵奖…


20 世纪末,美国司法部依据《反托拉斯法》拆分了 AT&T,贝尔实验室也被剥离成为了朗讯科技公司的组成部分,由于朗讯的经营情况不甚乐观,根本养不起一万多人的贝尔实验室,这导致实验室不得不裁员,实力大幅下降,被迫以出售专利来平衡支出,此后辗转到了诺基亚所有,也依旧没有恢复往昔荣耀。


创造出如此多辉煌的贝尔实验室最终都难逃落败,其他实验室又该如何抉择呢?如果存在的价值明确,那发展路径大致清晰。那么,实验室在一家科技巨头内部存在的价值是什么呢?当时,刚刚加入腾讯优图实验室的黄飞跃或许也在思考这个问题。


2012 年,现任腾讯优图实验室副总经理的黄飞跃发现公司内部众多业务部门都对图片压缩和传输有着较高需求,因此将图片二次压缩作为当时的重点研究方向,并借解决该问题为优图团队打开了声量。随后的几年,优图实验室成功协助微众银行完成了线上 AI 核身,并将技术在 QQ、QQ 空间、QQ 音乐、财付通、天天 P 图等明星产品中成功落地,这一落地将优图实验室顺利从一个单纯提供 AI 能力的实验室转型为一家能够助力行业的机构,并在公司内部找到了实验室的特殊价值。


在接受 InfoQ 的独家采访中,黄飞跃表示希望将腾讯优图实验室打造成为国际最顶尖的人工智能实验室。一直以来,优图实验室坚持基础研究和产业落地两条腿同时走路,秉持着“研究成果落地才能产生价值的原则”,技术研究以落地为导向,关注产业落地和科技向善。


“虽然行业越来越强调 AI 的落地了,但是技术一定有一个“研究-落地”的过程。技术永远是在持续更新和进步的,实验室可以给到相对纯粹的研究环境,技术的更新迭代也可以反哺产业,给产业持续带来活力。”


腾讯在 AI 领域建立了实验室矩阵,包括腾讯 AI Lab、优图实验室、Robotics X(机器人)等 AI 实验室;其中优图实验室聚焦计算机视觉这一领域。在产业落地层面,优图实验室通过腾讯云对外输出 AI 能力,技术深度应用到内容、游戏、社交、医疗、零售、到出行多个产业及领域。


“如果说 AI 路上的重要决定,我觉得做人脸识别技术是一个重要决策。”

超前布局人脸识别,这是一个正确的选择

早在 2012 年,人脸识别尚未成为热门技术,而优图实验室就已经把它当作中长期技术项目在布局。团队同学都相信,自己所做的研究终究会产生价值,因此愿意潜心去做一些中长期的研究。从 2017 年开始,人脸的相关应用开始发光发亮,从 2017 年 7 月被业界点赞的微信办证服务,到微信刷脸支付,再到后来一系列基于人脸识别的科技向善应用等,都是得益于优图实验室早期的技术积累。


“在人工智能领域,人脸识别算是落地比较成功的,包括中国的前几大人工智能创业公司都以此起家,这也在侧面说明了该项技术具有一定的成熟度,并且已经探索出了一些合适的商业化的模式。”


“可能我们运气比较好吧”,优图专家研究员及昊天研究中心技术负责人郭晓威表示,2012 年前后,深度学习才开始表现出在大规模集成上的有效性,优图就认为其将来一定会有较好的发展。2014 年,团队刚好接到微众银行人脸核身的需求,就是做远程登录核审;2015 年前后,又赶上了人工智能的风口;随后,又遇到了产业互联网的风口。


AI 落地难,产业落地这条腿怎么动?


2018 年,腾讯正式宣布向产业互联网进军,随着公司级整体业务方向的转变,优图实验室也在思考自己未来的发展方向。


同年 9 月 30 日,腾讯宣布组织架构调整,当时优图实验室被调整进入全新的 CSIG 云与智慧产业事业群,优图实验室因此也和云与智慧产业形成更密切的联动配合。


当腾讯优图的定位调整为面向产业互联网的时候,现有很多技术可以直接走到客户面向。以内容平台为例,现在可以通过调用腾讯云,直接对广电、媒体等行业输出技术,他们不需要自己研发就能进行内容的分析和理解。这个技术实际上相当于无缝地从腾讯内部被研发,直接对外发布使用。


然而,从技术到产业转化,这个过程谈何容易。“优图是面向业务落地做技术研究,并不是为了创新而创新”。在优图,做一项技术之前首先要判断是不是解决用户痛点,是否真正有足够的业务价值,并在行业里挑选一到两个标杆攻关,在攻关过程中丰富各项能力和解决方案。标杆打完以后,看解决方案能否快速推广复制到其他客户。在规模化落地阶段,往往会遇到成本问题,迁移周期及可复用范围都需要重点关注。围绕落地的降本提效上,优图去年在 AAAI 上发表的非对称互学习(Asymmetric Co-Teaching)的领域自适应 ReID 技术,可以极大降低对新场景数据标注的需求,场景复制效率整体提升了 3 倍以上。


随着科技的创新发展,AI 技术的落地应用在优化生活方式的同时,也不断刷新着我们对于世界的认知。在众多场景规模化应用落地的过程中,腾讯优图始终秉持着“科技向善”的愿景,让 AI 能够更好的为社会服务。


以腾讯优图本次发布的未成年内容审核解决方案为例,就是腾讯优图首个专门针对未成年人这一网络弱势群体的可落地技术方案。这种基于保护未成年人的技术研发和能力实现,就是腾讯科技向善的最好体现。


未成年内容审核解决方案发布


根据《2019 年全国未成年人互联网使用情况研究报告》显示,2019 年我国未成年网民规模为 1.75 亿,未成年人互联网普及率达到 93.1%。有统计数据显示,目前我国年龄低于 10 岁的网民已超过 1800 万,56%的儿童初次上网的年龄低于 5 岁。


15.6%的未成年人表示曾遭遇网络侵害,最常见的是网络欺凌、色情引诱、个人信息泄露等。特别是,疫情防控期间,网络侵害问题更为突出。这些未成年人因为自身年龄上的差异,对于内容往往没有明确的辨识和过滤能力,极有可能导致身心健康受到影响,甚至在部分极端视频的引导下做出不理智的行为。


目前,我国在多个互联网内容领域均施行了监管审核,但针对更广泛的网络内容监管审核手段较少,存在较大的真空地带真空地带,未成年人上网内容审核和分级迫在眉睫。


国家监管机构也已经注意到未成年内容杂乱的情况,国家网信办今年 5 月启动的 2020:“清朗”行动中专门组织针对未成年人暑期网络环境的整治,国家扫黄打非办上半年的“护苗 2020”专项行动中,更是查删处置淫秽色情、恐怖暴力、低俗恶俗等不良信息超过 603 万条;查缴非法有害少儿类出版物 13.2 万多册。此外,查办网上传播涉未成年人色情信息、制售非法有害少儿出版物等“护苗”类案件 70 多起。


此次腾讯优图实验室推出的未成年保护方案,是在标准内容审核基础能力之上增加了很多针对未成年设计的能力,主要有两大功能。一是面向青少年的不宜内容过滤,除过滤常规成人裸露内容外,比如血腥、暴露真实场景成人裸露场景,包括加入对虚拟场景的色情、暴力的识别,这类称为“ACG 识别”;二是未成年人敏感内容识别,主要用来发现以青少年儿童为实施主体的违规内容,例如儿童色情,这也是国际上打击比较多的。这两个功能综合运用了腾讯优图多项视觉 AI 技术,包括人脸识别、OCR、动作识别、场景识别以及图文分析等。


ACG 识别难度比真实场景要大很多。首先由于动漫,游戏中的人物和行为是创作出来的,天马行空,内容相对隐晦、甚至是意向化的,不如真实场景容易定义(如明确的漏点或者性行为)。仅仅去定义标准就是件细致和繁琐的工作。其次,特征的复杂性和非典型性也比真实场景要大。比如针对卡通脸识别,脸部细节的艺术手法使得展现上和真实的人脸照片差异很大。优图实验室今年也重点针对卡通动漫场景做了专门研发,例如今年 6 月份参加“IJCAL2020”时获得“iCartoonFace(卡通人脸挑战赛)”第一。


目前,这套解决方案对于明显色情图片的召回率超过 96%;对于烟赌毒、纹身、床上直播等低俗内容的召回率能够达到 80%以上;在识别“未成年人直播”、“儿童裸露”等不良行为和图片方面,在“区分 14 岁以上或以下”两分类测试标准条件下,召回率接近 80%。

结束语

对于计算机视觉技术的未来发展,郭晓威表示视觉感知层面还有很多突破的可能,一是应对开放场景下的精度挑战。举个例子,人脸识别是视觉里相对成熟的技术,配合产品上的场景设计与限制,在受限的场景中可以达到商业可用。但面向开放场景,挑战就很大了,比如行人重识别(REID)技术,需要在各种室内、室外环境通过衣帽外观、行为体态等特征精准锁定一个人的行为轨迹,这其中不可控的因素很多,包括摄像头的角度,分辨率,行人的朝向,姿态,衣着,遮挡,以及天气等等。另外,如何大幅降低 AI 生产成本,并适应快速复制,满足规模化落地的商业需求也是业界亟待解决的挑战。当前数据需求与网络架构优化是生产成本居高不下的主要痛点,相关技术例如领域自适应,半/自监督,模型剪枝,NAS 等也已成为业界研究的热点与趋势,但整体来说还有很长的路要走。


未来,腾讯优图实验室将继续聚焦人工智能技术的研究,持续探索更多前沿算法,让更好的算法去找更多的场景,并通过腾讯云对外输出,研究员也需要走到客户一线,从客户的需求角度出发,对算法提出更高要求。深挖应用场景,结合产业需求和实际应用场景落地解决方案,并且注重产业应用的广度和深度,帮助传统企业降本、增效、提质,驱动产业智慧化升级。


采访嘉宾:


黄飞跃  腾讯优图实验室副总经理。拥有清华大学计算机博士学位,于 2008 年加入腾讯。黄飞跃负责优图实验室主要研究和落地项目,包括人脸识别、图像识别等视觉 AI 重点方向。目前,优图实验室专注在图像处理、模式识别等领域开展技术研发和业务落地,多次刷新世界纪录。


郭晓威,2007 年毕业于中山大学数计学院信息与计算科学专业,主攻机器学习与图像处理方向。2011 年加入腾讯公司,主要从事计算机视觉、机器学习、深度学习等技术研究与应用工作。现担任优图专家研究员及昊天研究中心技术负责人。具备十年以上视觉领域以及海量数据处理的一线技术研发与项目落地经验。


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2020-11-02 09:411855

评论

发布
暂无评论
发现更多内容

财富管理2.0时代,券商数字营销突围之路

Speedoooo

数字化转型 解决方案 营销数字化 数字化业务战略 数字营销

你可以不知道KFC疯狂星期四,但不能不知道InfoQ会员周!七天限时福利冲冲冲!

InfoQ写作社区官方

热门活动 InfoQ会员周

黄东旭: 关于基础软件产品价值的思考

PingCAP

功效护肤理念增强,透明质酸继续引领护肤热点

易观分析

护肤 医美 透明质酸

web前端培训:React 核心调度功能的实现

@零度

前端开发 React

Apache SeaTunnel & Kyuubi 联合 Meetup | 见证中国大数据崛起!

Apache SeaTunnel

大数据 开源 大数据平台 apache 社区 Apache SeaTunnel

数据孤岛下的新破局 Real Time DaaS:面向 AP+TP 业务的数据平台架构

tapdata

数据中台 数据仓库 异构数据 Real Time DaaS DaaS

“东数西算”超级工程上马,利好云计算但暗藏汹涌

行云管家

云计算 混合云 多云 东数西算

三步教企业搭建产品帮助中心

小炮

4种常见分支模式解析及优劣对比 | 研发效能提升36计

阿里云云效

阿里云 云原生 研发团队 研发 分支管理

分库分表中间件的高可用实践讲解

Linux服务器开发

高可用 高并发 中间件 Linux服务器开发 Linux后台开发

天翼云基于 KubeEdge 的大规模 CDN 场景落地实践

华为云原生团队

开源 云原生 边缘计算 边缘技术 边缘云

MVCC 时光机:在 TiDB 的时空自由穿梭丨渡渡鸟复兴会赛队访谈

PingCAP

iuap 助力鹏鹞环保打造智慧水务大数据运营管理平台

用友BIP

用友 用友iuap

技术平台&应用开发专题月 | 一文搞懂全链路监控系统(上)

用友BIP

用友 用友iuap

视频渲染靠cpu还是显卡 视频渲染的作用是什么

懒得勤快

【51单片机】介绍

謓泽

单片机 3月月更 51

LigaAI完成A轮融资,加速打造全新的智能研发协作平台

LigaAI

行业资讯 智能 LigaAI A轮融资 研发协作平台

改进DevSecOps框架的 5 大关键技术

禅道项目管理

DevOps 敏捷 自动化

OAuthApp H5 应用开发/云托管平台

unclewang

微服务 前端 .net core H5制作 SaaS平台

ModStartCMS 模块化建站系统 Laravel 9.0 版 v3.3.0

ModStart开源

CRM系统帮助降低业务成本的方式

低代码小观

企业管理 CRM 企业管理系统 CRM系统 客户关系管理系统

项目启动 | 德荣医疗携手用友iuap共谱数字化转型新篇章

用友BIP

用友 用友iuap

大咖说|制造业发展趋势:“专精特新”与数字化转型

大咖说

阿里巴巴 阿里云 数字化 中制智库

3 月亚马逊云科技培训与认证课程,精彩不容错过!

亚马逊云科技 (Amazon Web Services)

架构师 培训

Linux之traceroute命令

入门小站

Linux

2个动作,让研发效率提升120%,代码减少50%

云智慧AIOps社区

敏捷开发 代码优化 开发规范 研发提效 研发效率

FinClip 黑客马拉松正式开赛,码力集结,等你来战!

Speedoooo

小程序生态 hackathon APP开发 黑客马拉松 黑客松

如何编写有效的常见问题解答(内附 5 个最佳示例)

小炮

【专访蓝景科技】5G+实时云渲染赋能数字孪生,共建元宇宙

3DCAT实时渲染

5G 数字孪生 实时云渲染

在线TOML转YAML工具

入门小站

工具

腾讯优图实验室:践行科技向善,选择人脸识别是过往八年最重要的抉择之一_大数据_赵钰莹_InfoQ精选文章