东亚银行、岚图汽车带你解锁 AIGC 时代的数字化人才培养各赛道新模式! 了解详情
写点什么

智能化与沉浸式将成视觉媒体的未来趋势

  • 2019-11-11
  • 本文字数:1447 字

    阅读完需:约 5 分钟

智能化与沉浸式将成视觉媒体的未来趋势

云、物联网、5G、人工智能……接踵而至的前沿技术,开发者们是如何进行天马行空的创意和极限突破?11 月 6 日—7 日,首届 Techo 开发者大会在北京召开。在前沿技术探索 X 论坛上,腾讯多媒体实验室总监李松南发表了《视觉媒体的今天与未来-智能化与沉浸式》的主题演讲,围绕视觉媒体的发展现状以及未来发展趋势展开分析,以视觉媒体的实际应用为例,从智能化与沉浸式两方面分享了腾讯多媒体实验室的研究领域及实际落地应用,并表示,会持续进行技术优化,为用户带来更好体验。


Techo 开发者大会由腾讯云发起,致力于开发者的能力成长和实践创新,旨在通过汇聚全球顶尖行业专家和技术爱好者,搭建一个开放、中立、活跃的技术交流平台。本届大会聚集来自全球的 5000 多位开发者,并邀请超 150 位业界大咖围绕前沿技术发展进行分享和交流,是一次真正面向全球云计算领域开发者和技术爱好者的年度盛会。



(腾讯多媒体实验室总监 李松南)

视觉媒体的智能化趋势

新媒体时代人们接收到的内容越来越丰富,用户个性化特征日益明显,优质的内容、合理的分发无疑是视频网站吸引用户的重要手段。


近几年,在内容生产、分发和管理三个方面涌现出了许多人工智能媒体应用,作为在音视频领域具有长久规划的实践者,腾讯多媒体实验室正在努力实现从生产到消费全方位视觉媒体的智能化,把媒体呈现的内容和最主要的媒介——视频、图像、声音演变为数据,并借助深度学习技术实现更加智能化的建模,为企业带来更优质的音视频处理以及理解服务,为个人用户带来更佳的多媒体消费体验。



(腾讯多媒体实验室的部分视频处理能力)


在人工智能的赋能下,多媒体实验室通过结合传统图像视频处理以及深度学习技术,提供了多种视觉媒体的处理能力,如降噪、超分、增强、去压缩失真等;通过使用基于多模态的深度学习技术,在媒体生产、云服务,媒体消费全流程中解决处理、编辑、审核、管理等应用问题,实现视觉媒体的质量增强和内容理解。


智能云剪辑是腾讯多媒体实验室的众多研究领域之一,并且已经成功应用于国庆七十周年的阅兵直播中。“通过对历史阅兵视频的学习,时间上精准定位不同方阵间隔之处,精准拆条;图片分类上精准识别领导人、海军方阵、陆军方阵、群众方阵,以及方阵间隔等;音频识别上识别“向右看”口号和音乐,最终基于以上多模态时序信息,实现智能剪辑。”李松南介绍,智能云剪辑在国庆阅兵中实时帮助完成拆条工作,短时间内为央视频 App 输出更多优质素材。

优化技术,为用户带来沉浸式体验

在 5G 技术影响下,沉浸式体验是未来视觉媒体另一重要特征。在打造沉浸式新媒体这一领域,腾讯多媒体实验室始终走在技术前沿,不断探索未来信息传递的多种可能性,把 OMAF、DASH 等标准研究成果融入产品,从采集、传输、转码、播放、互动等多端带给用户沉浸式感官体验。


目前,腾讯多媒体实验室已经引入国际最新 360 视频标准,针对 VR 视频压缩传输等技术壁垒进行工程化实验和 XR(VR,AR,MR)互动技术落地探索,并联合在线教育、视频云联合推出 VR 教育业务。李松南表示:“站在 5G 的风口,腾讯多媒体实验室未来将会针对实际业务场景持续研发,保持领域内技术领先,同时为 XR 系统提出解决方案,在融媒体、新媒体等更多更丰富的场景中实现落地 。”


互联网平台创造了一个海量信息自由开放流通的公共领域,也把各类信息和数据汇聚到平台之中,随着 5G 的落地应用,让海量数据高速率、低延时传输成为可能。腾讯多媒体实验室将会持续完善音视频的传输、处理以及理解技术,实现从看见、看清再到看懂,让工具更懂用户,推动数字媒体的繁荣发展。


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2019-11-11 21:57879

评论

发布
暂无评论
发现更多内容

油猴脚本学习

Sher10ck

脚本 油猴

rxjs Observable 设计原理背后的 Pull 和 Push 思路

Jerry Wang

typescript 响应式编程 angular RXJS 6月月更

中科方德技术专家直播:如何基于 OpenStack、Ceph 构建私有云平台? | 第 27 期

OpenAnolis小助手

Ceph 龙蜥大讲堂 中科方德 OpenStack 私有云平台

高效远程办公的基石:有效沟通 |社区征文

wljslmz

远程办公 初夏征文

00 后云原生工程师:用开源 Zadig 为思创科技(广州公交)研发开源节流

Zadig

DevOps 研发效能 工程师 自动化运维

linux检测系统是否被入侵(下)

入门小站

Linux

Go Web 编程入门:HTTP 自定义路由

宇宙之一粟

Go 语言 6月月更

CTO专访:合见工软深化产品布局 加速国产EDA技术革新

科技热闻

在线文本过滤小于指定长度工具

入门小站

工具

自媒体行业内卷严重:企业自媒体应该何去何从

石头IT视角

这玩意叫跳表?

慕枫技术笔记

数据结构 算法 6月月更

【Go实现】实践GoF的23种设计模式:装饰者模式

元闰子

Go 设计模式 装饰器 装饰者模式

深入浅出总结Flink运行时架构

百思不得小赵

大数据 flink 6月月更

微博评论架构设计

泋清

#架构训练营

稳!上千微服务如何快速接入 Zadig(Helm Chart 篇)

Zadig

DevOps 微服务架构 持续交付 自动化运维 Zadig

数据生态第三弹 | RocketMQ OpenMLDB Connector,实时数据到特征工程的高速传输

第四范式开发者社区

人工智能 云原生 实时数据 特征平台 特征工程

融云通信解决方案 破解企业沟通痛点

融云 RongCloud

HashMap分析-基础属性与结构

zarmnosaj

6月月更

架构实战营|模块5

KDA

#架构实战营

8年打磨,《游戏设计梦工厂》发布史诗级更新!

博文视点Broadview

Prometheus 2.36.0 新特性

耳东@Erdong

release Prometheus 6月月更

Android包体积优化(常规、进阶、极致)

yechaoa

android 性能优化 包大小 6月月更 包体积优化

Ubuntu环境下载OpenJDK11源码

程序员欣宸

Java Openjdk 6月月更

最新版CorelDRAW Technical Suite2022

茶色酒

cdr2022

悬赏平台并没有WEB端开发,在原生开发和混合开发中哪种合适?

开源直播系统源码

软件开发 app源码 原生开发 混合开发 悬赏平台源码

带链接跳转的微信红包封面制作教程和使用指南

boshi

小程序 微信红包封面 微信红包

要想Linux命令行玩的溜,还得apropos!此文运维必看!

wljslmz

Linux 运维 6月月更

在线SQL转HTMLTable工具

入门小站

工具

笔记

IT蜗壳-Tango

6月月更

设计电商秒杀系统

凯博无线

Java中java.util.Arrays参考指南

okokabcd

Java

智能化与沉浸式将成视觉媒体的未来趋势_服务革新_云加社区_InfoQ精选文章