10月21日,杭州云栖大会-技术&可持续发展论坛,注册有礼 了解详情
写点什么

手机摄影挑战单反,旷视 AI 多摄技术揭秘

2021 年 10 月 14 日

手机摄影挑战单反,旷视AI多摄技术揭秘

手机已经成为人们身边最为便捷的影像设备。

 

调研机构艾瑞咨询发布的《2020 中国人工智能手机白皮书 — AI 重新定义光感知》报告显示,短视频相关应用的流行使拍摄功能成为消费者最关注的要素。

 

随着 AI 技术的发展,消费者对智能手机摄影功能的需求也越来越高。近期多款最新手机的发布,让以多摄为代表的 AI 计算摄影技术受到了越来越多的关注。

 

智能手机毫无疑问已经进入了多摄时代。但可能鲜有人知的是,当多摄技术在各厂商的智能手机上“争奇斗艳”的背后,其实是计算机视觉 AI 公司在提供者底层技术的支撑。

 

据了解,旷视科技自 2016 年起开始研发多摄技术,经过 5 年多的技术迭代和优化,旷视的 AI 多摄算法目前已在多款畅销手机机型中实现技术应用落地。

 

InfoQ10 月 12 日获悉,在旷视 MegTech Lite 漫谈 AI 技术分享会上,旷视研究院研究员范浩强详细介绍了 AI 多摄技术的发展历程,并并分享了旷视在 AI 多摄领域的技术创新和实践成果。


旷视研究院研究员范浩强在旷视 AI 多摄技术分享会上的演讲


用户需求升级,促进 AI 多摄技术发展

 

从 2000 年世界上第一款配备摄像头的手机诞生至今,手机拍摄能力经过了一轮轮的迭代升级。

 

与此同时,用户的拍照需求逐渐释放,不再拘泥于简单的高清图像,更加追求兼顾“所见即所得”的真实性与媲美相机的质感,开始利用手机进行专业级别的影像创作。

 

囿于手机空间和模组尺寸的局限性,单个摄像头的拍摄效果有限,手机多摄技术应运而生。

 

范浩强表示,摄像头最大的功能是变焦,多摄最大的作用是可以切换不同的焦段或者不同的视野。通过多个摄像头的协调配合,AI 技术加持的手机摄影可以实现媲美单反相机的拍摄效果,为终端消费者带来更好的拍摄体验。

 

在手机后置摄像头从双摄逐渐升级到三摄、四摄的过程中,AI 算法已成为多摄像头联动不可或缺的纽带。

 

变焦、虚化、融合,多摄助力手机影像突破

 

主摄、广角、超广角、长焦、潜望式、微距、ToF……随着多摄技术的成熟和发展,手机后置摄像头的数量和类别不断增加,让多摄形成了花样繁多的排列组合,也为终端用户带来了更优的拍摄体验:通过双摄变焦实现最佳拍摄效果、利用双摄虚化实现媲美单反相机的光圈效果、多摄融合有效提升图片质量。

 

然而,后置摄像头不是越多越好,也不是越大越好。旷视认为,手机成像,是系统工程,是重要的要素之间的匹配。

 

旷视提出了“AI 重新定义光感知系统”的理念,将光感知系统“硬件升级 — 算法辅助 — 优化后期处理”相对流程化和独立化的传统运作方式,转变为光感知系统软硬件“一体化协同升级”。

 

这一理念从整个影像系统设计出发,配合智能手机的光学系统以及传感系统,借力人工智能算法,通过图像识别、融合、增强、分割等方式,优化拍摄能力、丰富拍摄功能、升级成像质量,带来指数级的效果提升。

 

面向未来,AI 驱动的图像获取

 

AI 多摄逐渐走进大众视野,既得益于手机厂商对于产品的迭代升级,也离不开旷视等 AI 企业对于底层技术的创新和赋能。

 

以多摄融合为例,旷视的多摄融合算法采用神经网络设计模型,可有效解决清晰度不均匀、主体边缘线条弯曲、部分位置重影、线条断裂错位、重复纹理错位等传统多摄融合算法中的常见问题。

 

基于多年的技术积累和项目工程落地经验,旷视的双摄虚化、多摄平滑变焦、多摄融合等算法均具有很强的泛用性,可适配多种模组组合和排布方式。

 

随着算力的丰富和以多摄为代表的 AI 计算摄影技术的不断优化和发展,未来的手机拍摄,将会向着利用 AI 技术,理解用户意图,利用算法自动调配摄像头,完美捕捉到用户想要拍摄的画面,从“所见即所得”到“所想即所得”。在这个过程中,计算和 AI 所占的比重会越来越大,会成为主要要素。

 

范浩强表示,除了 AI 之外,旷视还在传感器方面进行探索,推出更多新形态传感器的解决方案,从而实现面向未来的画质。

 

期待,未来 AI 会把智能手机摄影带到新的高度。

 

2021 年 10 月 14 日 08:571
用户头像
刘燕 InfoQ记者

发布了 691 篇内容, 共 222.2 次阅读, 收获喜欢 1334 次。

关注

评论

发布
暂无评论
发现更多内容

全面互联网时代背景下,一个好的Java程序员需要掌握哪些核心技术

Crud的程序员

Java 程序员 编程语言

花了60天的时间肝出了这些spring,jvm,并发编程等学习笔记,春暖花开再战大厂!

Java架构师迁哥

泰山版震撼来袭!阿里巴巴2021年Java程序员面试指导小册已开源

Java架构师迁哥

推理综艺的正确打开方式!爱奇艺玩转智能技术,“互动+内容”引爆迷综季

爱奇艺技术产品团队

综艺节目 智能 影视制作

一图读懂丨索信达灵枢如何助力金融机构提升模型管理效能

索信达控股

金融科技 监管平台 大数据平台 模型开发 数据管理平台

深入了解一些字符串函数,内存函数(c语言)

小写丶H

c 字符串函数

奇亚矿机分币系统搭建,Bzz云算力挖矿系统

13823153121

四面阿里巴巴如愿拿到offer定级P7,为此我筹备了半年

Java架构师迁哥

Hadoop Committer如何炼成?爱奇艺新晋核心贡献人给出了这份攻略!

爱奇艺技术产品团队

hadoop 开源 程序员 Apache社区

java异常分类和处理机制

加百利

Java 后端 异常 6月日更

拆分电商系统为微服务

Vincent

架构训练营

☕【JVM 技术探索】Class字节码指令操作介绍(上)

李浩宇/Alex

Java JVM Class字节码 6月日更

一文带你,彻底了解,零拷贝Zero-Copy技术

奔着腾讯去

c++ Linux 缓存 零拷贝 Linux服务器开发

重仓AI人才培养,打造产业落地升级护城河

百度大脑

人工智能

凭借阿里技术官最新版Java核心开发笔记,已斩获阿里offer

Crud的程序员

Java 架构 编程语言 后端开发

股价预测的基本思路(1)

Qien Z.

6月日更 量化投资 股价预测

2021年,最新Java硬核技能微服务、虚拟机、高并发,掌握轻松拿大厂offer

Java架构师迁哥

硬核!阿里自爆虐心万字面试手册,Github上获赞89.7K

Java架构师迁哥

Vue3.0 组合式 API 分析与实践

百度开发者中心

开发者

又到一年“粽子节”,快来测测你包的粽子颜值几分

华为云开发者社区

端午节 华为云 modelarts 粽子

Boss直聘转发超90W次,Java面试突击手册 火遍全网,却遭封杀

Java架构师迁哥

iOS 面试秘籍全套

程序员 编程之路 iOS 知识体系

爱奇艺M2VOC挑战赛落幕,6篇论文被ICASSP2021收录

爱奇艺技术产品团队

Apache hadoop 开源 程序员 成长

动手实践,Linux安装php-vld全过程实录

架构精进之路

插件 6月日更 笔记分享

10大流行软件测试工具

百度开发者中心

测试工具

Java从业者如果不懂这些,面试80%都会挂在这些核心知识上面

程序员改bug

Java spring 程序员 面试

从零开始学习3D可视化之场景层级(2)

森友小锘

前端 可视化 数字孪生

极狐(GitLab)开课了!实践进阶五步走,助你成为DevOps专家

极狐GitLab

DevOps认证

TcaplusDB | 行业新闻汇编(6月9日)

数据人er

数据库 nosql tencentdb TcaplusDB

Github全面爆火,这份阿里Java面试复盘笔记到底有何魅力?

云流

Java 程序员 架构 面试

狂刷了29天的阿里面试参考指南(恒山版),竟成功收到了12个offer

云流

Java 程序员 架构 面试

数据cool谈(第1期)数据库寻路,开源有态度

数据cool谈(第1期)数据库寻路,开源有态度

手机摄影挑战单反,旷视AI多摄技术揭秘-InfoQ