GMTC北京站9折购票最后一周,2022年大前端方向又有哪些技术热点? 了解详情
写点什么

旷视十年,回答 AI 技术价值跃迁的“灵魂”三问

  • 2021 年 7 月 19 日
  • 本文字数:2771 字

    阅读完需:约 9 分钟

旷视十年,回答AI技术价值跃迁的“灵魂”三问

今年,AI 独角兽 — 旷视科技迎来了成立 10 周年。


7 月 16 日,在 2021·旷视技术开放日(MegTech 2021)上,旷视首席科学家、旷视研究院院长孙剑,旷视研究院张祥雨、范浩强、周而进等多位研究员,分享了旷视十年来在 AI 技术上的实践和思考,通过一系列技术演示,系统展示了旷视最新的技术成果。

基础科研是 AI 创新突破的基石


旷视首席科学家、旷视研究院院长孙剑总结了过去十年中国 AI 技术价值的发展历程。


AI 有没有用?AI 在哪里用?AI 易不易用?这是 AI 行业的“灵魂”三问,是所有 AI 企业需要回答的问题。


孙剑表示,人工智能最核心的动力是深度学习。在 2011 年 - 2012 年,深度学习刚刚崭露头角,展示出它比传统的方法有一定优势。在这个时期,一个主要回答的问题是,以机器学习为代表的 AI 到底是不是比传统方法好很多?到底能不能带来很大的价值?到底是不是有用?


因此从 2011 年开始,可以看到全球各个企业、高校都在投入大量的资金和人力研究 AI 在不同的应用上到底是不是有用。以旷视为例,旷视在 2012 年旷视推出了Face++开放平台,并在接下来的一两年里,使用深度学习第一次显著超越了传统的人脸检测和识别方法。


有了 AI 技术能解决很多问题,但 AI 应该用在哪里?孙剑表示,从 2014 年-2015 年开始,各行各业开始广泛应用 AI 技术。自 2015 年开始,旷视陆续推出了在线身份认证、智能摄像头、手机人脸解锁、物流操作系统河图、屏下指纹和摄影技术。


旷视首席科学家、旷视研究院院长孙剑


AI 发展的第三个阶段是现在时。现在 AI 的应用可以说是无处不在,但在有些行业应用较深,有些行业应用较浅。下一个阶段,AI 如何有更深入、更广泛的应用?它是不是好用,是不是易用的?门槛能否降低?


在第一阶段、第二阶段,把 AI 用得好,主要是靠经验丰富的算法工程师深入理解问题,一个问题一个问题地去攻克,并没有解决广泛行业应用者不懂深度学习的技术,或者对怎么用好没有掌握得很精深的问题。


孙剑认为,降低算法门槛,让非资深的算法工程师也可以使用 AI 工具解决各行各业的问题。这样才能回答 AI 好不好用、易不易用、是不是低成本的问题,让 AI 广泛得到应用,再向前推进。这也旷视推出其 AI 生产力平台 Brain++的初衷。


“AI 有没有用,归根到底是看 AI 基础科研有没有突破。基础科研是 AI 创新突破的基石,需要长期主义的坚持”,孙剑认为。


旷视研究院张祥雨研究员详细介绍了旷视在基础科研领域的布局。张祥雨介绍,旷视基础科研主要包括三类:基础模型、基础算法,基础应用。


旷视研究院张祥雨研究员


在基础科研创新方面,成立 10 年来,旷视在在学术上发表 85 篇顶级会议论文,在竞赛上获 40 项冠军,在实用上研发了包括ShuffleNets系列在内的众多基础模型,已经广泛应用在手机等智能设备上,推动软硬协同发展。


旷视现场展示了最新的基础科研成果,包括面向服务器和下一代 AI 芯片的通用模型 RepVGG 系列,其在开源后 Github star 已超过 1800;目前性能最强的端到端实时全卷积全景分割算法;以及挑战经典,目标检测架构创新的 YOLOF。

AI 在哪里用:从科研到落地


AI 在哪里用?


孙剑表示,要回答这个问题的关键词是“行业落地”,“推动算法边界拓展”,不断推动各种各样的算法在行业中得到深入运用。


旷视的技术主要有三大应用场景 —— 消费物联网、城市物联网和供应链物联网。AI 是核心能力,IoT 是落地场景,在数字世界与物理世界融合的智能化时代,AI 算法正在为产品带来更多的价值提升。从明星产品神行面板机系列,到超越人眼的暗光拍照和暗光视频,再到突破物理限制的屏下 AI 光学指纹和屏下摄像,以及追求全局最优解的河图系统和机器人设备。


旷视研究院范浩强研究员认为,业内存在的一些对于“人工智能和人工智障”的讨论说明,一些算法并没有达到用户对智能产品的预期。只有生产优质的算法,不断追求算法品质,才能够实现物理世界中真实的产品的价值。这些价值体现在更加鲁棒、适应多环境、更加符合用户预期等多方面。



旷视研究院范浩强研究员


旷视认为,算法不只让很多产品从好变更好,更能让产品从不可能变可能。


“传统意义上,很多做产品的人将算法定义成软件的一部分,在硬件设计好之后再思考软件该怎么构建,在这个过程中,算法可能只占最末端、最小的环节”,范浩强表示,“但在 AI 落地实践中,旷视发现,传统的产品算法思维是时候被颠覆了。现在,产品的易用度、特性很大程度上是由其算法所决定,需要在产品最早的定义、设计、研发全生命周期纳入对算法的考量。也就是说,算法不再仅仅是软件物料的一部分,它正在成为我们日常所使用产品中的核心组件”。


在旷视十年的 AI 实践落地中发现,从科研到落地,算法正在创造越来越大的价值,也在开始重新定义软硬件。

算法生产能力决定算法价值上限


算法生产能力决定算法价值上限,也决定 AI 是不是真的更易用。


传统的算法生产的过程很复杂,如果想在真实的生产环境中生产出有效的算法,往往要经过需求分析、数据处理、模型训练、上线部署等环节。此外,一次训练的算法并不能一次性解决实际场景中各种各样的问题,需要进行算法或模型改进环节。在经历多轮的常规算法生产过程中的迭代后,最终才能够得到一个实际落地应用过程中符合期望和体验的好模型或好算法。


而且,当前,大量算法生产过程还是非标准化的,因为非标准化,所以算法生产过程充满不确定性。 旷视研究院周而进研究员表示,算法生产的过程就像“炼金术”,需要付出大量时间试错。这个非标准化的生产过程,一方面需要靠全能型的人才从头到尾解决这个问题,这对于人才的储备、素质的要求非常高。另一方面如果算法流程仍然是这样一个高度耦合化的过程,这也说明整个算法生产在业界处于初级的阶段。


旷视研究院周而进研究员


旷视认为,落地实用是检验算法的最高标准之一,而生产落地实用算法的过程只有先标准化才能自动化,才能更进一步实现规模化的普惠易用。


从 2014 年至今,持续打磨升级的 AI 生产力平台Brain++,就是旷视推动算法生产迈向自动化时代的 AI 基础设施。


周而进表示,旷视十年的的算法探索和应用落地,就是希望把整个算法生产的过程标准化。只有标准化了,才把之前积累下来的经验、模型、算法工程化起来,成为组件和工具。工程化之后,才有可能做到整个生产流程的自动化,从而大大扩大算法生产的能力。“我们希望 AI 生产力平台能够把整个算法生产过程,通过标准化和工程化的方式最终走向自动化的平台”。


在现场,旷视介绍了 Brain++的最新功能,包括自动化的数据管理和质检、自动推荐合适的训练算法和模型、自动检查算法准确率并给出优化建议等。此外,Brain++具有三大特点,一是生产真正有效算法;二是算法能力复用;三是公式化管理各类算法模型和策略,便捷用户调用和使用。


从基础科研,到行业落地,再到基础设施,这是人工智能技术价值跃迁的三个关键。预研一代、孵化一代、交付一代,是旷视技术创新的研发模式。在技术开放日现场,旷视将这一套创新研发模式首次对外完整的呈现出来。


旷视技术开放日的 Demo 展示现场

2021 年 7 月 19 日 16:382131
用户头像
刘燕 InfoQ记者

发布了 839 篇内容, 共 281.8 次阅读, 收获喜欢 1595 次。

关注

评论

发布
暂无评论
发现更多内容

Spock单元测试框架实战指南五 - void方法测试

Java老k

Java 单元测试 spock

北京奥森小景

小马哥

摄影 美景 奥森 28天写作

人脸识别是如何实现的

anyRTC开发者

ios 音视频 WebRTC 人脸识别 安卓

话题讨论 | 30 张图解高并发服务模型你必须这些

程序员柠檬

话题讨论

第三周作业

走走,停停……

在构造函数中调用其它构造函数会有什么问题吗?

jiangling500

Java c++ C++11 构造函数

《css大法》之使用伪元素实现超实用的图标库(附源码)

徐小夕

CSS css3 大前端 CSS小技巧

《算法导论》.pdf

田维常

区块链打破数字医疗桎梏,赢数据未来新生

CECBC

区块链 医疗

为什么要有 Servlet ,什么是 Servlet 容器,什么是 Web 容器?

yes

tomcat Web Servlet

roblox mini map

katichar

话题讨论 | 说说那些"Oh my god"的时刻

Kurtis Moxley

话题讨论

话题讨论 | 选择做一个程序员,你后悔过吗?

xcbeyond

话题讨论

学习笔记3

Qx

如何使用 JuiceFS 在云上优化 Kylin 4.0 的存储性能?

苏锐

大数据 kylin 性能优化 JuiceFS

区块链技术生态持续优化,五大趋势不容忽视

CECBC

区块链 场景应用

如何预防勒索攻击事件?这份安全自查指南请查收

京东科技开发者

数据安全 数据加密 系统安全

为什么删除数据后,Redis内存占用依然很高?

Java架构师迁哥

只谈链不谈币,区块链会发展成什么样的方向?

CECBC

区块链

可见性是什么?(通俗易懂)

叫练

volatile JMM 多线程 synchronized

架构师训练营第十二周作业

我是谁

极客大学架构师训练营

第四章作业

走走,停停……

情报合成研判系统开发,智慧警务解决方案

t13823115967

智慧公安

最值得Deepin的思维模型“组合创新” | 技术人应知的创新思维模型 (3)

Alan

创新 思维模型 28天写作

生产环境全链路压测建设历程第四篇 技术体系的发力

数列科技杨德华

架构词典:质量

lidaobing

架构 质量管理

有钱还APP系统开发|有钱还软件开发(现成)

系统开发

Mybatis 中xml和注解映射,这次终于搞明白了

田维常

mybatis

Java并发编程:进程、线程、并行与并发

码农架构

Java并发

Mock | 拦截ajax的两种实现方式

梁龙先森

Java 大前端

分布式时序数据库DolphinDB与InfluxDB对比测试报告

DolphinDB

数据库 大数据 Influxdb 性能测试 DolphinDB

WAVE SUMMIT 2022 深度学习开发者峰会

WAVE SUMMIT 2022 深度学习开发者峰会

旷视十年,回答AI技术价值跃迁的“灵魂”三问_AI_刘燕_InfoQ精选文章