NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

手机摄影挑战单反,旷视 AI 多摄技术揭秘

  • 2021-10-14
  • 本文字数:1548 字

    阅读完需:约 5 分钟

手机摄影挑战单反,旷视AI多摄技术揭秘

手机已经成为人们身边最为便捷的影像设备。

 

调研机构艾瑞咨询发布的《2020 中国人工智能手机白皮书 — AI 重新定义光感知》报告显示,短视频相关应用的流行使拍摄功能成为消费者最关注的要素。

 

随着 AI 技术的发展,消费者对智能手机摄影功能的需求也越来越高。近期多款最新手机的发布,让以多摄为代表的 AI 计算摄影技术受到了越来越多的关注。

 

智能手机毫无疑问已经进入了多摄时代。但可能鲜有人知的是,当多摄技术在各厂商的智能手机上“争奇斗艳”的背后,其实是计算机视觉 AI 公司在提供者底层技术的支撑。

 

据了解,旷视科技自 2016 年起开始研发多摄技术,经过 5 年多的技术迭代和优化,旷视的 AI 多摄算法目前已在多款畅销手机机型中实现技术应用落地。

 

InfoQ10 月 12 日获悉,在旷视 MegTech Lite 漫谈 AI 技术分享会上,旷视研究院研究员范浩强详细介绍了 AI 多摄技术的发展历程,并并分享了旷视在 AI 多摄领域的技术创新和实践成果。


旷视研究院研究员范浩强在旷视 AI 多摄技术分享会上的演讲


用户需求升级,促进 AI 多摄技术发展

 

从 2000 年世界上第一款配备摄像头的手机诞生至今,手机拍摄能力经过了一轮轮的迭代升级。

 

与此同时,用户的拍照需求逐渐释放,不再拘泥于简单的高清图像,更加追求兼顾“所见即所得”的真实性与媲美相机的质感,开始利用手机进行专业级别的影像创作。

 

囿于手机空间和模组尺寸的局限性,单个摄像头的拍摄效果有限,手机多摄技术应运而生。

 

范浩强表示,摄像头最大的功能是变焦,多摄最大的作用是可以切换不同的焦段或者不同的视野。通过多个摄像头的协调配合,AI 技术加持的手机摄影可以实现媲美单反相机的拍摄效果,为终端消费者带来更好的拍摄体验。

 

在手机后置摄像头从双摄逐渐升级到三摄、四摄的过程中,AI 算法已成为多摄像头联动不可或缺的纽带。

 

变焦、虚化、融合,多摄助力手机影像突破

 

主摄、广角、超广角、长焦、潜望式、微距、ToF……随着多摄技术的成熟和发展,手机后置摄像头的数量和类别不断增加,让多摄形成了花样繁多的排列组合,也为终端用户带来了更优的拍摄体验:通过双摄变焦实现最佳拍摄效果、利用双摄虚化实现媲美单反相机的光圈效果、多摄融合有效提升图片质量。

 

然而,后置摄像头不是越多越好,也不是越大越好。旷视认为,手机成像,是系统工程,是重要的要素之间的匹配。

 

旷视提出了“AI 重新定义光感知系统”的理念,将光感知系统“硬件升级 — 算法辅助 — 优化后期处理”相对流程化和独立化的传统运作方式,转变为光感知系统软硬件“一体化协同升级”。

 

这一理念从整个影像系统设计出发,配合智能手机的光学系统以及传感系统,借力人工智能算法,通过图像识别、融合、增强、分割等方式,优化拍摄能力、丰富拍摄功能、升级成像质量,带来指数级的效果提升。

 

面向未来,AI 驱动的图像获取

 

AI 多摄逐渐走进大众视野,既得益于手机厂商对于产品的迭代升级,也离不开旷视等 AI 企业对于底层技术的创新和赋能。

 

以多摄融合为例,旷视的多摄融合算法采用神经网络设计模型,可有效解决清晰度不均匀、主体边缘线条弯曲、部分位置重影、线条断裂错位、重复纹理错位等传统多摄融合算法中的常见问题。

 

基于多年的技术积累和项目工程落地经验,旷视的双摄虚化、多摄平滑变焦、多摄融合等算法均具有很强的泛用性,可适配多种模组组合和排布方式。

 

随着算力的丰富和以多摄为代表的 AI 计算摄影技术的不断优化和发展,未来的手机拍摄,将会向着利用 AI 技术,理解用户意图,利用算法自动调配摄像头,完美捕捉到用户想要拍摄的画面,从“所见即所得”到“所想即所得”。在这个过程中,计算和 AI 所占的比重会越来越大,会成为主要要素。

 

范浩强表示,除了 AI 之外,旷视还在传感器方面进行探索,推出更多新形态传感器的解决方案,从而实现面向未来的画质。

 

期待,未来 AI 会把智能手机摄影带到新的高度。

 

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-10-14 08:573230
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 494.5 次阅读, 收获喜欢 1968 次。

关注

评论

发布
暂无评论
发现更多内容

【豆瓣9.1】《大数据处理框架Apache Spark设计与实现(全彩)》PDF

程序员李木子

“数字人”走进我们生活了!

青否数字人

数字人

【Linux技术专题】「夯实基本功系列」带你一同学习和实践操作Linux服务器必学的Shell指令(深入Kill指令探索)

洛神灬殇

Linux Shell 2024年第二十二篇文章 技术指令

产品经理需要掌握哪些技能?一文弄懂PM的方方面面!附知识图谱

彭宏豪95

产品经理 产品设计 PM 在线白板 团队协同

听GPT 讲Rust源代码--compiler(30)

fliter

Tipard Video Converter Ultimate for Mac(视频格式转换工具)v10.2.52中文版

影影绰绰一往直前

使用阿里云Rocky Linux镜像源替换默认源教程

百度搜索:蓝易云

云计算 Linux 运维 云服务器 Rocky

Programming Abstractions in C阅读笔记:p258-282

codists

【豆瓣8.4】《RabbitMQ实战指南》PDF

程序员李木子

在线 cURL 参数对比工具,让你的开发工作更加高效

秦少卫

curl 接口工具 调试工具 请求参数对比 参数格式化

C# 面向对象编程解析:优势、类和对象、类成员详解

小万哥

C# 程序人生 编程语言 软件工程 后端开发

百度反链是什么? 如何查询百度反链?

百度搜索:蓝易云

云计算 百度 运维 SEO 云服务器

Be Focused Pro for Mac(任务时间小工具)v2.4.1激活版

影影绰绰一往直前

【新手视频】在线快速搭建AI原生应用

AI大咚咚

百度 AI rag AI原生应用 Agent构建

Nop入门:极简服务层开发

canonical

gRPC 低代码 graphql SpringBoot3

Ableton Live如何设置中文?ableton live 11 mac中文破解版 永久可用

Rose

mac音乐制作软件 Ableton Live 11破解版 Ableton Live 11中文版

Aiseesoft HEIC Converter mac:HEIC格式的文件转换为图片格式

Rose

Mac软件 图片格式转换 HEIC格式 HEIC Converter

最强GTD时间管理工具OmniFocus Pro 3 for Mac最新激活版 附注册机 兼容M1/M2

Rose

苹果软件 OmniFocus 下载 Mac任务管理器 OmniFocus Pro 3 GTD时间管理

文心一言 VS 讯飞星火 VS chatgpt (187)-- 算法导论14.1 4题

福大大架构师每日一题

福大大架构师每日一题

linux系统下多种yum repo创建教程

百度搜索:蓝易云

Linux 运维 yum 云服务器

Atlassian 停服 Bitbucket?三步快速迁移至极狐GitLab

极狐GitLab

Programming Abstractions in C阅读笔记:p254-p257

codists

HDFS 小文件合并最佳实践

冰心的小屋

NameNode 海量小文件

应该如何选择轻量级低代码、重量级低代码、轻量级低代码+定制、纯定制软件开发?

天津汇柏科技有限公司

低代码开发 低代码,项目开发 定制软件开发 软件开发定制

点赞!HashData连续三年获评数据猿“最具投资价值企业奖”

酷克数据HashData

Nop入门:极简数据访问层开发

canonical

mybatis 低代码 ORM graphql

hazel mac破解版 自动化文件清理工具 含hazel激活码 兼容m1 m2

Rose

苹果软件资源 Hazel 下载 Mac自动清理工具 Hazel Mac破解版

AnyMP4 iPhone Password Manager for Mac(iPhone密码管理器)v1.0.20激活版

影影绰绰一往直前

Keep It for mac(Mac笔记软件)v2.3.8激活版

影影绰绰一往直前

GarageSale for Mac(mac eBay在线拍卖客户端)v9.6.0激活版

影影绰绰一往直前

手机摄影挑战单反,旷视AI多摄技术揭秘_AI&大模型_刘燕_InfoQ精选文章