【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

OPPO 研究院成立智能感知与交互研究部,首次公开展示研发成果

  • 2020-06-17
  • 本文字数:1764 字

    阅读完需:约 6 分钟

OPPO研究院成立智能感知与交互研究部,首次公开展示研发成果

一年一度的全球计算机视觉顶级会议 CVPR(Conference on Computer Vision and Pattern Recognition 国际计算机视觉与模式识别会议)落下帷幕,该会议是由 IEEE(国际计算机视觉与模式识别会议)举办的计算机视觉和模式识别领域的顶尖会议。每年汇聚全球顶尖的相关专家、学者和研究者,共同关注和探讨计算机视觉技术的发展方向与趋势。


InfoQ 了解到,在 CVPR 2020 的一系列学术竞赛中,OPPO 共获得两项第一、两项第三,获奖技术成果包括:将模糊的照片智能处理清晰的超分技术,凭照片定位拍摄方位技术以及通过录像识别人类行为技术。


据悉,此次 OPPO 参加 CVPR 2020 的多项获奖成果均来自今年年初新成立的智能感知与交互研究部门。今年 3 月,前小鹏首席科学家郭彦东加入 OPPO 并担任 OPPO 智能感知首席科学家,领导快速组建并完善专业科研团队。目前,智能感知与交互研究部已初具规模,并引进了许多顶尖科技公司与科研院校人才。


郭彦东表示:“非常高兴能在今年的 CVPR 竞赛中取得优秀成绩,这是 OPPO 研究院智能感知与交互研究部成立以来首次公开展示研发成果,分别对应环境感知、以人为本的计算、以及数字生成三个核心研究方向,充分反映了 OPPO 在人工智能领域的深厚积淀与实力。”


在本次大会上,OPPO 获得第一名的技术成果为:将模糊图片“算”清晰的“极端超级分辨率感知”技术;此外,通过照片计算拍照方位的"手持设备视觉定位"技术则获得第三名和分项第一;通过读取录像智能识别其中人类行为的“长视频行为识别”技术同时获得第三名。

超分技术成果,凭空将模糊图片算清晰

“极端超分辨率感知”( Perceptual Extreme Super-Resolution)是 CVPR 难度最高的赛项之一,要求从模糊的低分辨率图片中,获得细节更清晰、更接近真实情况的高清图像。


针对这项挑战,OPPO 提出了独创的神经网络架构 RFB-ESRGAN,通过更智能的方式提取原图特征,用分布式算法提高计算效率,以更多元的采样与计算模型配合,通过计算把模糊的图片清晰放大了 16 倍,从全球 280 多个顶尖参赛团队中脱颖而出,获得第一名。



OPPO 极端超分辨率感知处理效果,最左侧图片红框内为原图,最右侧为最终结果


这项技术将在未来为诸多应用场景提供帮助,例如将用户手机拍摄到的模糊影像处理成细节丰富的高清效果,修复图像受到损坏的老照片、老电影,或者对卫星、航天图像进行细节分析等工作。



人工智能程序对图片从多维度进行分析

视觉定位和长视频行为识别

在“手持设备视觉定位”挑战(Visual localization for handheld devices challenge)中,OPPO 获得了面向室外场景的数据集(Aachen Day-Night)第一名,与面向室内场景的数据集(InLoc)第三名。


“视觉定位”是通过搜集和分析图像中的海量信息,对自身拍摄方位作出精确判断。OPPO 团队自主设计的全新分析流程,可以智能分析图像信息的分类标签及图像深浅信息,大量排除错误结果,从而显著提升分析准确程度。这一技术对未来的 AR 眼镜,智能机器人,精准导航等应用都能起到重要作用。例如,当智能机器人助手安装了摄像头之后,就可以利用视觉定位技术对拍摄到的图像作运算分析,获得准确定位,从而精准的移动。


此外,OPPO 在“长视频行为识别”(Activity detection in extended videos)赛项中获得了第三名。


“视频行为识别”是指在某段视频中分析并判断人或物体对象的行为动作。OPPO 的智能程序可高效识别并重组每一帧画面中的人物,辨别复杂动态视频中的人类行为。在一段数十人出镜的长视频中,它准确识别了视频中每个人走动或是聊天等的数十种动作。这项技术在未来能广泛应用在人机交互、运动分析等领域,例如未来的手机产品便可以自动识别正在运动的拍摄对象,并自动调节快门对焦。



视频行为识别结果


除 OPPO 研究院智能感知与交互研究部之外,OPPO 美国研究所也在 CVPR 上有所收获,取得了“真实世界超分辨率图像处理技术”(Real-World Super-Resolution Challenge:Track 1: Image Processing artifacts)第六名的成绩。


OPPO 美研所时空实验室主管孟子博在 CVPR 做了暗光影像技术演讲“穿透黑暗:从图像到视频”(Looking into the dark: from image to video),AI 计算机视觉高级技术总监全书学做了“从零开始构建可在智能手机和 AR 眼镜上运行的统一 SLAM 系统”演讲(Building a unified SLAM system running on both smartphone and AR glass from scratch)。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2020-06-17 16:582223

评论

发布
暂无评论
发现更多内容

AI赋能低代码,助力企业数智化转型

这我可不懂

人工智能 低代码 JNPF

LLMs 诸神之战:LangChain ,以【奥德赛】之名

Zilliz

Milvus AIGC LLM langchain

Golden Gate (GGX) 启动公测,下一代创新DeFi和跨链 dApps 征程开始

股市老人

Neuron 提供免费无限时试用:完整体验数十种工业协议连接

EMQ映云科技

工业物联网 网关软件 工业协议

软件测试 | spyne开发接口

测吧(北京)科技有限公司

测试

图数据库 NebulaGraph 的内存管理实践之 Memory Tracker

NebulaGraph

数据库 内存管理 图数据库

生产环境质量保障的重要性

老张

质量保障 稳定性保障

亚马逊云科技 一周回顾 – 2022 年 7 月 18 日

亚马逊云科技 (Amazon Web Services)

Amazon

领先芯片供应商u-blox通过Perforce Helix Core加强协作,实现基于组件的开发

龙智—DevSecOps解决方案

组件化 芯片设计

“全球金牌课程”6月17-18日 · CSM认证在线周末班【提前报名特惠】CST导师亲授

ShineScrum捷行

Scrum 敏捷

MobTech ShareSDK|助力预热618

MobTech袤博科技

软件测试/测试开发丨学习笔记之列表、元组、集合

测试人

Python 软件测试 自动化测试 列表 测试开发

“伙伴+华为”体系,数字时代的新航标

脑极体

伙伴 体系

开源赋能 普惠未来|360集团寄语2023开放原子全球开源峰会

开放原子开源基金会

龙智即将亮相2023上海国际嵌入式展,为嵌入式开发提供全球领先解决方案

龙智—DevSecOps解决方案

嵌入式软件 嵌入式设计 嵌入式开发

广西高等教育学会高校教育技术委员会莅临瑞云科技考察交流

3DCAT实时渲染

虚拟仿真 元宇宙 实时渲染云

Django笔记三十之log日志记录详解

Hunter熊

Python django 日志 log

4大特性看Huawei Cloud EulerOS为开发者带来平滑迁移体验

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

ControlNet: 控制扩散模型的魔法

Zilliz

AIGC Towhee Stable Diffustion controlnet

软件测试 | 接口测试

测吧(北京)科技有限公司

测试

2023年汽车软件行业趋势分析:安全性是汽车软件开发的重大挑战2023年汽车软件开发

龙智—DevSecOps解决方案

汽车软件安全 电动汽车软件 汽车软件开发

“敏捷教练必修课程”7月22-23日 ·A-CSM认证在线周末班【提前报名特惠】CST导师亲授

ShineScrum捷行

Scrum 敏捷 敏捷精髓 敏捷实践 A-CSM

国产操作系统如何构建自己的生态

Onegun

国产化 国产操作系统

10个提高工作效率的Cinema 4D小技巧

Finovy Cloud

C4D

开源赋能 普惠未来|浪潮集团寄语2023开放原子全球开源峰会

开放原子开源基金会

一文看懂OpenStack SR-IOV

统信软件

小程序6大开发框架对比分析

Onegun

小程序 小程序框架 小程序容器

融云 WICC 2023 定档!「出海嘉年华」穂城来袭!

融云 RongCloud

通信 社交 融云 出海 wicc

【论文分享|SIGMOD'22】WeTune 自动发现和验证重写规则

Databend

软件测试 | 开发接口

测吧(北京)科技有限公司

测试

2023 年度中国 DevOps 现状调查|有奖问卷

CODING DevOps

DevOps 云端IDE cloudstudio

OPPO研究院成立智能感知与交互研究部,首次公开展示研发成果_AI&大模型_罗燕珊_InfoQ精选文章