2025云栖大会,开启通往AGI的未来之旅 了解详情
写点什么

手机摄影挑战单反,旷视 AI 多摄技术揭秘

  • 2021-10-14
  • 本文字数:1548 字

    阅读完需:约 5 分钟

手机摄影挑战单反,旷视AI多摄技术揭秘

手机已经成为人们身边最为便捷的影像设备。

 

调研机构艾瑞咨询发布的《2020 中国人工智能手机白皮书 — AI 重新定义光感知》报告显示,短视频相关应用的流行使拍摄功能成为消费者最关注的要素。

 

随着 AI 技术的发展,消费者对智能手机摄影功能的需求也越来越高。近期多款最新手机的发布,让以多摄为代表的 AI 计算摄影技术受到了越来越多的关注。

 

智能手机毫无疑问已经进入了多摄时代。但可能鲜有人知的是,当多摄技术在各厂商的智能手机上“争奇斗艳”的背后,其实是计算机视觉 AI 公司在提供者底层技术的支撑。

 

据了解,旷视科技自 2016 年起开始研发多摄技术,经过 5 年多的技术迭代和优化,旷视的 AI 多摄算法目前已在多款畅销手机机型中实现技术应用落地。

 

InfoQ10 月 12 日获悉,在旷视 MegTech Lite 漫谈 AI 技术分享会上,旷视研究院研究员范浩强详细介绍了 AI 多摄技术的发展历程,并并分享了旷视在 AI 多摄领域的技术创新和实践成果。


旷视研究院研究员范浩强在旷视 AI 多摄技术分享会上的演讲


用户需求升级,促进 AI 多摄技术发展

 

从 2000 年世界上第一款配备摄像头的手机诞生至今,手机拍摄能力经过了一轮轮的迭代升级。

 

与此同时,用户的拍照需求逐渐释放,不再拘泥于简单的高清图像,更加追求兼顾“所见即所得”的真实性与媲美相机的质感,开始利用手机进行专业级别的影像创作。

 

囿于手机空间和模组尺寸的局限性,单个摄像头的拍摄效果有限,手机多摄技术应运而生。

 

范浩强表示,摄像头最大的功能是变焦,多摄最大的作用是可以切换不同的焦段或者不同的视野。通过多个摄像头的协调配合,AI 技术加持的手机摄影可以实现媲美单反相机的拍摄效果,为终端消费者带来更好的拍摄体验。

 

在手机后置摄像头从双摄逐渐升级到三摄、四摄的过程中,AI 算法已成为多摄像头联动不可或缺的纽带。

 

变焦、虚化、融合,多摄助力手机影像突破

 

主摄、广角、超广角、长焦、潜望式、微距、ToF……随着多摄技术的成熟和发展,手机后置摄像头的数量和类别不断增加,让多摄形成了花样繁多的排列组合,也为终端用户带来了更优的拍摄体验:通过双摄变焦实现最佳拍摄效果、利用双摄虚化实现媲美单反相机的光圈效果、多摄融合有效提升图片质量。

 

然而,后置摄像头不是越多越好,也不是越大越好。旷视认为,手机成像,是系统工程,是重要的要素之间的匹配。

 

旷视提出了“AI 重新定义光感知系统”的理念,将光感知系统“硬件升级 — 算法辅助 — 优化后期处理”相对流程化和独立化的传统运作方式,转变为光感知系统软硬件“一体化协同升级”。

 

这一理念从整个影像系统设计出发,配合智能手机的光学系统以及传感系统,借力人工智能算法,通过图像识别、融合、增强、分割等方式,优化拍摄能力、丰富拍摄功能、升级成像质量,带来指数级的效果提升。

 

面向未来,AI 驱动的图像获取

 

AI 多摄逐渐走进大众视野,既得益于手机厂商对于产品的迭代升级,也离不开旷视等 AI 企业对于底层技术的创新和赋能。

 

以多摄融合为例,旷视的多摄融合算法采用神经网络设计模型,可有效解决清晰度不均匀、主体边缘线条弯曲、部分位置重影、线条断裂错位、重复纹理错位等传统多摄融合算法中的常见问题。

 

基于多年的技术积累和项目工程落地经验,旷视的双摄虚化、多摄平滑变焦、多摄融合等算法均具有很强的泛用性,可适配多种模组组合和排布方式。

 

随着算力的丰富和以多摄为代表的 AI 计算摄影技术的不断优化和发展,未来的手机拍摄,将会向着利用 AI 技术,理解用户意图,利用算法自动调配摄像头,完美捕捉到用户想要拍摄的画面,从“所见即所得”到“所想即所得”。在这个过程中,计算和 AI 所占的比重会越来越大,会成为主要要素。

 

范浩强表示,除了 AI 之外,旷视还在传感器方面进行探索,推出更多新形态传感器的解决方案,从而实现面向未来的画质。

 

期待,未来 AI 会把智能手机摄影带到新的高度。

 

2021-10-14 08:574545
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 585.4 次阅读, 收获喜欢 1981 次。

关注

评论

发布
暂无评论
发现更多内容

Hadoop Spark太重,esProc SPL很轻

石臻臻的杂货铺

SPL

实至名归!九章云极DataCanvas公司荣获智能制造领域多项殊荣

九章云极DataCanvas

智能制造

前端高频面试题

helloworld1024fd

开源一夏 | 教你快速实现“基于Docker快速构建基于Prometheus的MySQL监控系统”

知识浅谈

开源 8月月更

STM32+OLED显示屏制作指针式电子钟

DS小龙哥

8月月更

XDR平台架构与关键技术解析

极盾科技

网络安全 信息安全 数据安全 xdr 检测响应

本周四晚19:00知识赋能第4期直播丨OpenHarmony智能家居项目之设备控制实现

OpenHarmony开发者

OpenHarmony

Python 教程之输入输出(3)—— 在 Python 中从用户那里获取多个输入

海拥(haiyong.site)

Python 8月月更

LP流动性挖矿DAPP系统开发丨流动性挖矿功能原理及说明

开发微hkkf5566

近邻搜索算法浅析

得物技术

深度学习 算法 Faiss 近邻搜索 乘积量化

C#/VB.NET 从PDF中提取表格

在下毛毛雨

C# .net PDF 提取表格

fastposter v2.9.0 程序员必备海报生成器

物有本末

fastposter 海报生成器 海报编辑器 海报生成 图片生成

中文字体反爬,易易易易易易【Python脱敏】车车车车车车车车

梦想橡皮擦

Python 爬虫 8月月更

wallys/new product/MT7915/MT7975/4*radios/

wallys-wifi6

深入解析分布式文件系统的一致性的实现

移动云大数据

分布式系统 数据同步

微信小程序获取用户手机号码

源字节1号

微信小程序 软件开发 前端开发 后端开发

ABAB-740新语法

桥下本有油菜花

SAP abap

Dva.js 新手入门指南

Susie喵~

dva 8月月更

聊天app开发——防炸麦以及节省成本的内容鉴定方法

开源直播系统源码

软件开发 语音聊天室 直播系统源码 直播源码 语音app开发

限流不只有计数器,带你快速了解四种经典限流算法实现

知识浅谈

8月月更

TiKV & TiFlash 加速复杂业务查询丨TiFlash 应用实践

PingCAP

TiDB

mysql进阶(二十四)防御SQL注入的方法总结

No Silver Bullet

MySQL SQL注入 8月月更

后台图库上传功能

CRMEB

下午见!2022京东云数据库新品发布会

京东科技开发者

MySQL 数据库 云计算 安全 数据迁移

web前端面授培训课程

小谷哥

浅谈SVN备份

剑雪封喉

开源一夏 | 分享一款实用的太阳能充电电路(室内光照可用)

矜辰所致

开源 电路设计 8月月更 太阳能

深入理解MySQL事务MVCC的核心概念以及底层原理

jiangxl

MySQL 事务 MVCC dba 签约计划第三季

《数字经济全景白皮书》金融数字用户篇 重磅发布!

易观分析

金融 数字用户

七夕专属限定:1 分钟 Serverless 极速抽盲盒

hum建应用专家

云计算 Serverless

手机摄影挑战单反,旷视AI多摄技术揭秘_AI&大模型_刘燕_InfoQ精选文章