【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

智能内容生产,媒体的智能未来

  • 2020-12-28
  • 本文字数:1500 字

    阅读完需:约 5 分钟

智能内容生产,媒体的智能未来

内容作为媒介传播的主体,无论是在传统纸媒时代、PC 互联网、移动互联网还是以后的物联网、视联网,它依然具有强悍的生命力,内容为王永不过时。而文章、图片、视频、音乐等内容的生产,是个极其庞大的产业。过去内容生产一直被认为需要很强的创造性,因此主要由人来完成。


然而近两年飞速发展的人工智能(AI)已经逐渐渗透进了内容生产的各个环节,人工智能从事内容生产似乎已经没那么遥远。随着移动互联网时代的发展,信息传播的无限畅通使内容创作的诉求不断提高而门槛不断降低。人人皆可创作的新环境,同时也意味着内容创作的竞争空前加剧。此时,依靠 AI 实现的智能创作应需而生,科技巨头和创业公司开始纷纷发力,一个新的市场初见端倪。


腾讯智媒 内容生产平台


Smart Content Platform


基于对媒体发展的理解,多媒体实验室很早就在智能媒体方向上开始进行研究和尝试,同时打造的很多智能生产能力已经在实际项目中得到了很好的落地。基于相关的经验多媒体实验室打造了跨模态的腾讯智媒内容生产平台。平台可以将视频、音乐、文字、图片四种类型的素材进行有机的整合和转化,高效的生产各种类型的内容。



部分能力介绍


随着大家获取信息的方式大量的从浏览文字转为观赏视频,人们对优质视频内容的需求量与日俱增。简单的扩大编辑团队除了会显著增加成本以外,也很难稳定把控视频的质量。同时短视频的兴起带来了海量非专业人士制作 UGC 视频的需求,因此如何降低视频制作门槛简化制作流程成为了关键问题。基于人工智能技术,智能生产平台上的「视频智能剪辑」和「智能视频配乐」就可以很好的简化这个过程,甚至在某些场景下做到一键成片。


视频智能剪辑


视频智能剪辑基于多模态视频理解技术,将用户感兴趣或关键的片段进行剪辑、拼接、和理解。以体育精彩集锦为例:我们体育剪辑引擎先利用事件检测技术定位到视频的关键事件区间,将完整体育比赛视频拆分成若干片段;再利用时序动作识别技术对视频片段进行进一步理解;最后将以上信息进行筛选和融合,自动完成剪辑工作。以下足球视频即为系统自动剪辑生成。


00:00 / 00:00
    1.0x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    智能视频配乐


    智能视频配乐基于跨模态内容检索和标识技术,将合适的音乐内容或视频内容进行自动匹配,高效完成短视频创作。我们一方面基于智能内容检索技术,收集海量无监督的优质短视频素材,学习各模态的特征;另一方面基于内容标识技术,对不同类别的内容进行标签提取,通过标签在语义空间中的分布情况来进行素材的高效匹配。


    00:00 / 00:00
      1.0x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      音乐智能理解


      音乐作为科学和艺术的交叉点,也是人工智能较晚走入的领域。通过不断的积累,智能生产平台在音乐领域也已经具备了十八般武艺。音乐智能理解基于多种音乐结构分析技术,通过对音乐全局结构和节奏等信息进行抽取和理解,自适应的获得音乐的鼓点以及高潮位置。同时提供音乐各章节的横向理解能力,以及区分人声、伴奏、贝斯等的纵向理解能力,可以便捷的在各类场景中使用。



      图片/视频翻译


      图片/视频描述基于时序特征翻译技术,将图片或视频中的视觉信息综合理解,生成对应的文字信息。我们的算法会将单帧的视频图像与视觉空间中的内容上下文进行综合理解;然后将获得的视觉信息转化为文字信息,经过一系列的优化生成贴切的文字描述。相关的能力可以应用在电商等场景中,快速自动化的生成商品介绍。



      落地案例


      目前智能内容生产平台已经服务于全民 K 歌、微视、企鹅号、腾讯视频、腾讯影业等众多产品,每天为海量腾讯 C 端用户提供优质内容。同时协同腾讯云发力 B 端,在传媒、文旅、政务等多个 ToB 行业中得到良好的应用。



      头图:Unsplash

      原文智能内容生产,媒体的智能未来

      来源:腾讯多媒体实验室 - 微信公众号 [ID:TencentAVLab]

      转载:著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

      公众号推荐:

      2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

      AI 前线公众号
      2020-12-28 23:272356
      用户头像

      发布了 38 篇内容, 共 69617 次阅读, 收获喜欢 31 次。

      关注

      评论 1 条评论

      发布
      用户头像
      pc 浏览器上看到的视频都不能播放,时长显示为 0
      2020-12-29 13:29
      回复
      没有更多了
      发现更多内容

      Hoo研究院调研报告 |从公链Terra生态看区块链稳定币的三大核心产品

      区块链前沿News

      Hoo 虎符交易所 虎符研究院

      一个cpp协程库的前世今生(十六)读写锁

      SkyFire

      c++ cocpp

      InfoQ写作平台|Python板块试运行

      IT蜗壳-Tango

      InfoQ-Python板块

      建立堡垒机的原则有哪些?需要注意哪些方面?

      行云管家

      网络安全 数据安全 信息泄露 资产安全

      浅析SaaS软件和传统软件交付模式的区别

      郑州埃文科技

      Cloudera的企业数据云

      郭华

      云计算 大数据 数据仓库 云原生

      到底什么是云?其实云计算从业者也不懂!

      Geek_f56666

      云计算

      前端开发之JS数组去重方法

      @零度

      JavaScript 前端开发

      面向对象

      你?

      FabEdge V0.4 新特性:支持多集群通讯

      BoCloud博云

      云原生 边缘计算 网络 开源社区

      Flutter:GridPaper 示例

      坚果

      flutter 1月月更

      Linux云计算好学吗?Linux云计算运维学习资料 Linux基本操作命令

      学神来啦

      元宇宙时代:银行如何探索数字化转型

      CECBC

      在线HTTP/HTTPS协议GET,POST,RESTful接口测试

      入门小站

      工具

      技术干货 | ToB 业务场景下自动化测试的实践及探索

      网易云信

      运维 自动化

      Mysql的逻辑架构与存储引擎

      编程江湖

      MySQL

      IOS技术分享| anyRTC 互动白板场景实现

      anyRTC开发者

      ios 音视频 在线教育 视频会议 互动白板

      当技术重构遇上DDD,如何实现业务、技术双赢?

      百度Geek说

      架构 后端 DDD 技术债

      大数据开发之SparkSQL面试篇

      @零度

      大数据 spark SQL

      时空大数据 AI 研究院在京成立,助推时空产业高质量发展

      百度大脑

      人工智能

      恒源云(GPUSHARE)_云GPU服务器如何使用iKataGo?

      恒源云

      运维 镜像 算力

      存储空间降为MySQL的十分之一,TDengine在货拉拉数据库监控场景的应用

      TDengine

      数据库 大数据 tdengine 物联网

      企业堡垒机搭建核心需求是什么?可以自己研发搭建吗?

      行云管家

      网络安全 信息安全 数据安全 IT资产

      一步一步理解Generator函数的原理

      恒生LIGHT云社区

      JavaScript 前端 Generator

      JavaScript 浅拷贝与深拷贝

      编程江湖

      某厂审批流引擎核心技术揭秘

      空空

      什么是生产管理?制造企业想要做好生产管理应该怎么做?

      优秀

      企业生产管理

      微软Office新增实用功能允许用户在不同设备上轻松送同步字体

      淋雨

      [架构实战营] 模块九作业

      张祥

      架构实战营

      开源服务社会:EMQ 映云科技获评“优秀中国开源原生创企”

      EMQ映云科技

      物联网 开源项目 mqtt

      Spring Boot 实现通用 Auth 认证的 4 种方式

      码农架构

      Java springboot spring 5 1月月更

      智能内容生产,媒体的智能未来_文化 & 方法_腾讯多媒体实验室_InfoQ精选文章