写点什么

手机摄影挑战单反,旷视 AI 多摄技术揭秘

  • 2021-10-14
  • 本文字数:1548 字

    阅读完需:约 5 分钟

手机摄影挑战单反,旷视AI多摄技术揭秘

手机已经成为人们身边最为便捷的影像设备。

 

调研机构艾瑞咨询发布的《2020 中国人工智能手机白皮书 — AI 重新定义光感知》报告显示,短视频相关应用的流行使拍摄功能成为消费者最关注的要素。

 

随着 AI 技术的发展,消费者对智能手机摄影功能的需求也越来越高。近期多款最新手机的发布,让以多摄为代表的 AI 计算摄影技术受到了越来越多的关注。

 

智能手机毫无疑问已经进入了多摄时代。但可能鲜有人知的是,当多摄技术在各厂商的智能手机上“争奇斗艳”的背后,其实是计算机视觉 AI 公司在提供者底层技术的支撑。

 

据了解,旷视科技自 2016 年起开始研发多摄技术,经过 5 年多的技术迭代和优化,旷视的 AI 多摄算法目前已在多款畅销手机机型中实现技术应用落地。

 

InfoQ10 月 12 日获悉,在旷视 MegTech Lite 漫谈 AI 技术分享会上,旷视研究院研究员范浩强详细介绍了 AI 多摄技术的发展历程,并并分享了旷视在 AI 多摄领域的技术创新和实践成果。


旷视研究院研究员范浩强在旷视 AI 多摄技术分享会上的演讲


用户需求升级,促进 AI 多摄技术发展

 

从 2000 年世界上第一款配备摄像头的手机诞生至今,手机拍摄能力经过了一轮轮的迭代升级。

 

与此同时,用户的拍照需求逐渐释放,不再拘泥于简单的高清图像,更加追求兼顾“所见即所得”的真实性与媲美相机的质感,开始利用手机进行专业级别的影像创作。

 

囿于手机空间和模组尺寸的局限性,单个摄像头的拍摄效果有限,手机多摄技术应运而生。

 

范浩强表示,摄像头最大的功能是变焦,多摄最大的作用是可以切换不同的焦段或者不同的视野。通过多个摄像头的协调配合,AI 技术加持的手机摄影可以实现媲美单反相机的拍摄效果,为终端消费者带来更好的拍摄体验。

 

在手机后置摄像头从双摄逐渐升级到三摄、四摄的过程中,AI 算法已成为多摄像头联动不可或缺的纽带。

 

变焦、虚化、融合,多摄助力手机影像突破

 

主摄、广角、超广角、长焦、潜望式、微距、ToF……随着多摄技术的成熟和发展,手机后置摄像头的数量和类别不断增加,让多摄形成了花样繁多的排列组合,也为终端用户带来了更优的拍摄体验:通过双摄变焦实现最佳拍摄效果、利用双摄虚化实现媲美单反相机的光圈效果、多摄融合有效提升图片质量。

 

然而,后置摄像头不是越多越好,也不是越大越好。旷视认为,手机成像,是系统工程,是重要的要素之间的匹配。

 

旷视提出了“AI 重新定义光感知系统”的理念,将光感知系统“硬件升级 — 算法辅助 — 优化后期处理”相对流程化和独立化的传统运作方式,转变为光感知系统软硬件“一体化协同升级”。

 

这一理念从整个影像系统设计出发,配合智能手机的光学系统以及传感系统,借力人工智能算法,通过图像识别、融合、增强、分割等方式,优化拍摄能力、丰富拍摄功能、升级成像质量,带来指数级的效果提升。

 

面向未来,AI 驱动的图像获取

 

AI 多摄逐渐走进大众视野,既得益于手机厂商对于产品的迭代升级,也离不开旷视等 AI 企业对于底层技术的创新和赋能。

 

以多摄融合为例,旷视的多摄融合算法采用神经网络设计模型,可有效解决清晰度不均匀、主体边缘线条弯曲、部分位置重影、线条断裂错位、重复纹理错位等传统多摄融合算法中的常见问题。

 

基于多年的技术积累和项目工程落地经验,旷视的双摄虚化、多摄平滑变焦、多摄融合等算法均具有很强的泛用性,可适配多种模组组合和排布方式。

 

随着算力的丰富和以多摄为代表的 AI 计算摄影技术的不断优化和发展,未来的手机拍摄,将会向着利用 AI 技术,理解用户意图,利用算法自动调配摄像头,完美捕捉到用户想要拍摄的画面,从“所见即所得”到“所想即所得”。在这个过程中,计算和 AI 所占的比重会越来越大,会成为主要要素。

 

范浩强表示,除了 AI 之外,旷视还在传感器方面进行探索,推出更多新形态传感器的解决方案,从而实现面向未来的画质。

 

期待,未来 AI 会把智能手机摄影带到新的高度。

 

2021-10-14 08:573916
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 535.9 次阅读, 收获喜欢 1977 次。

关注

评论

发布
暂无评论
发现更多内容

程序员的时间管理

Kerwin

程序员

设计模式总篇:从为什么需要原则到实际落地(附知识图谱)

Kerwin

Java 设计模式

6 个珍藏已久 IDEA 小技巧,这一波全部分享给你!

楼下小黑哥

Java IDEA

关于如何判断一个list是否为空的思考

Leetao

Python Python基础知识 列表

week6 总结

不在调上

Docker网络学习第二篇-认识iptables

Lazy

Docker Linux 网络

30岁+程序员职场攻略:找到自己的“职业锚”乘风破浪

华为云开发者联盟

程序员 AI 开发者 职场

ARTS - Week 5

Khirye

ARTS 打卡计划

纯CSS实现自定义单选框和复选框

爱嘤嘤嘤斯坦

CSS Java 编程语言 标签

一张PDF了解JDK10 GC调优秘籍-附PDF下载

程序那些事

Java jdk JVM GC JDK10

5万字、97 张图总结操作系统核心知识点

苹果看辽宁体育

操作系统 计算机

因为 Django ORM update,我今天差点「从删库到跑路」

AlwaysBeta

数据库 django 编程 程序员

没内鬼,来点干货!SQL优化和诊断

Kerwin

MySQL

当我们在谈架构时,我们谈的是什么?

冯文辉

架构 企业架构 系统架构

秒懂云通信:通信圈黑话大盘点

阿里云Edge Plus

云通信 通信云

redis系列之——一致性hash算法

诸葛小猿

redis 一致性hash redis集群

nginx在重定向时端口出错的问题

烫烫烫个喵啊

nginx

没内鬼,来点干货!volatile和synchronized

Kerwin

Java volatile synchronized

疫情年逆风翻盘

Kerwin

程序员

架构师训练营 - 第六周 - 作业

韩挺

【计算机网络】你需要知道的链路层知识

烫烫烫个喵啊

计算机网络 链路层 交换机

日记一则

progyoung

Java8——方法引用

Java旅途

java8 方法引用

SpringBoot代码生成器

Kerwin

Java 开源

Hello!GitHub 好用好玩值得收藏的开源项目集合~

Kerwin

开源

前端杂记-&&和||

阡陌r

JavaScript && ||

简述 CAP 原理

不在调上

Docker网络学习第一篇:Linux虚拟网络

Lazy

Docker Linux 网络

Elasticsearch从入门到放弃:再聊搜索

Jackey

elasticsearch

Mybatis执行流程浅析(附深度文章推荐&面试题集锦)

Kerwin

Java mybatis

开发框架文档体系化的思考

vivo互联网技术

框架开发

手机摄影挑战单反,旷视AI多摄技术揭秘_AI&大模型_刘燕_InfoQ精选文章