写点什么

编转码、CDN 和 AI 是如何撑起短视频数百亿市场规模的

  • 2018-05-23
  • 本文字数:2781 字

    阅读完需:约 9 分钟

直播链接请点击这里

2018 年,你的朋友圈有没有被短视频刷屏呢?上到白发苍苍,下到咿呀学语,短视频不仅用户覆盖了各个阶层和年龄段,连创作者也覆盖了各类人群。行业迎来了全面爆发,意味着关注度、吸金力和研发重视程度都已今非昔比。那么究竟是哪些因素导致了在背后推动了短视频的全面爆发呢?

为了深入探索短视频崛起背后的秘密,首期《云中论道》节目邀请到了英特尔中国区互联网业务部技术总监高明、金山云高级总监武爱敏以及知乎专栏作者刘晓明三位业内专家参与,三人就短视频崛起背后的技术支撑,如视频编转码、CDN 以及 AI 等技术展开了深入探讨。

视频编转码的闯关路

目前,短视频行业在全国用户量已经达到 4 亿,市场规模数百亿。从视频行业接触到互联网开始,编转码就成为一个绕不开的话题。更何况现如今热门视频层出不穷,用户量巨大,那么应当如何在高并发情况下完成解码步骤,保障用户体验呢?

为什么短视频一定需要用到编转码呢?因为短视频从生成、上传等过程里需要适应不同的播放器。为了满足用户在不同播放环境的体验,就要进行不同程度的转码。而且转码在今后应用的会越来越多,目前的一大趋势就是从 H.264 向 H.265 转化。数据来看,在 2017 年 H.265 在市场中所占比例约 10% 左右,2018 年就已经达到了 30%。

改善用户体验,降低延迟是必不可少的一部分。但是视频从上传到播放之间一定会产生时延,这其中不仅包括了转码延迟,人工审核和 CDN 也一样会产生,所有的延迟在过去有可能达到几十分钟的级别。

转码方面,在多码率转码情况下,为了保持各部分同步可能需要时间比较长。但是近几年在硬件和系统升级的影响下情况得到了改善,与直播相比,短视频并不需要作者与用户之间的实时交互,因此对延时要求并不太严格,转码控制在分钟级已经足够,相对的直播的转码控制就要在毫秒级。

延时问题的产生,在 CDN、网络、缓存、DNS、服务器、负载均衡、网关等多个方面都会有影响。因此提升用户体验除了在技术上进行优化外,后端硬件支持以及网络存储等架构的升级也十分重要。在去年下半年,英特尔推出的新至强可扩展处理器每个 CPU 达到 6 通道使得内存带宽提高了 50%,并且每个 CPU 核心的二级缓存容量从 256KB 提升至 1MB 为上一代至强处理器的 4 倍,可以让视频编解码能力实现提升。

过去,短视频行业常用的英特尔至强处理器 E5 2600 系列 V3、V4 系列使用的是 AVX2.0 指令集,寄存器位宽为 256 位;新至强采用新的 AVX-512 指令集则可以达到 512 位寄存器位宽,量级翻倍也意味着单指令多数据的计算性能也可以提升高至 2 倍。举例来看,金山云的业务需要对 H.264 视频转码,使用英特尔至强铂金 8168 处理器的转码性能达到了过去使用英特尔至强处理器 E5-2690 V4 性能的 194%,对短视频转码速度提升有着很大帮助。

CDN 如何保障视频质量

本质上来看,短视频与直播采用的是一类技术,二者相比传统视频都对延迟和秒开有着较高的要求,这一点在移动时代更显得尤为突出。

是从 2015 年 10 月移动端直播出现开始,视频行业的发展就接入了高速轨道。2016 年号称移动直播元年,2017 年又成为了移动直播的下半场。走到今天,不少移动直播的末端企业已经无力回天,流量竞争已经越来越集中在头部客户中。这些客户的竞争主要集中在视频质量和内容吸引力等方面。评价视频质量主要包括延迟、秒开、卡顿等三个主要参数。

延迟一般会在三个环节中产生,一是推流;二是 CDN 传输的过程,但这个延迟很小只有几十毫秒;三则是在播放端会有 2 到 3 秒左右的延迟。不过并不是所有的延迟都是不允许出现的,对延迟要求最高的直播行业中,不同直播类型对延迟控制要求不同,游戏类、社交类、秀场类的延迟会控制在 3 到 5 秒,这样才能满足主播与粉丝之间的文字交互不受影响;对于事件类和赛事类的直播,由于会涉及到一些特殊的因素,一般延迟会更大一些,在播出过程中会要求有 15 到 30 秒的延迟,这样也方便做内容的审核。

秒开方面的实现,在离用户最近的 CDN 边缘节点缓存一部分数据,能让用户在几十毫秒内看到音视频;而且,短视频和直播不同,一些热点短视频很容易在边缘网络中存储,然后在手机端进行加速,可以进行预加载帮助实现秒开。

再者,传统网络和终端的细节也会有所影响,比如 DNS 和播放器的细节问题进行优化。典型问题就是最后一公里的网络,即从手机到最近的节点的距离。由于用户可能会身处户外或者信号不好的地方,很容易导致延迟产生。

解决这一问题有多种办法,比如金山云推出了一款双边加速产品,帮助解决边缘网络难题,提高观看质量。另外也可以让码率在传输过程中降低,然后在终端实现增强,这种码率的自适应方式可以通过算法感知到用户终端播放过程中网络问题,动态的切换到适应的码率上,以保障视频播放用户的体验。

人工智能是短视频行业的重大利好

视频质量的保障靠 CDN,而另一大竞争点内容吸引力则要靠人和人工智能了。在以往,视频是一种特殊的内容,只有人才能够理解、欣赏和应用。在人工智能崛起后,机器在人工智能的帮助下也能够做到人的部分工作,从本质上使得视频行业发生了转变。

视频吸引力的保障一方面需要优质的视频作者或主播源源不断的提供素材,另一方面就要看视频本身的因素了,这包括了内容的安全和对用户的传递。而且 AI 能做到的越来越多,包括了软件检测、物体检测、视频分析、视频分类、违规视频检测等,通过硬件和软件的提升可以在平台上将 AI 的速度和性能兼顾以达到最佳效果。内容安全方面,在内容识别领域可以通过分析找出违规或者不允许的内容,高效而且降低了人力成本;图像增强方面,AI 能够通过算法将一些不太清晰的视频细节恢复出来,既节省了传输带宽,又增强了用户体验。

AI 的出现对于视频行业意味着什么呢?这可能是一种颠覆。AI 模型可以对机器进行训练,让机器能够识别视频,并且在很多领域实现应用,在安防领域的识别,训练过的机器一个月帮助公安局多抓 500 名逃犯;而民用领域,色情、恐暴等内容也会无处遁形。AI 对视频行业带来的是重大的利好。

对于机器学习,一个优质的训练平台可以实现事半功倍的效果。目前英特尔主推的至强可扩展处理器可以很好的进行 inference,英特尔一方面会帮用户进行测试选型,从不同的 CPU 型号中选择最适合的主频和核数的 CPU 来支撑用户业务,提供最好的性能和 TCO;另一方面则是提供针对英特尔平台优化的深度学习软件框架使至强 CPU 性能的得到最大发挥,英特尔工程师也可以根据用户的具体需求进行有针对性的调优,比如根据拓扑结构等进行特定的算法优化,借助英特尔的平台提升深度学习的性能。通过提供英特尔优化版 Caffe、TensorFlow、MXNet 等机器学习框架,用户可以最大程度利用英特尔至强可扩展处理器的 AVX-512 指令集来达到性能提升,在终端设备上英特尔提供的 Movidius VPU 等硬件加速器也可以实现图像及视频的分析加速,通过引入英特尔 FPGA 等更多的新硬件也能够在提供高性能的同时进一步降低延迟。

2018-05-23 08:336672

评论

发布
暂无评论
发现更多内容

一次错误的解码处理导致Netty堆外内存泄漏问题的分析

Java你猿哥

Java Netty ssm RSS 逻辑

如何将千亿文件放进一个文件系统,EuroSys'23 CFS 论文背后的故事

百度Geek说

数据库 云计算 百度 企业号 5 月 PK 榜

为什么要用线程池?

javacn.site

GitHub上开源24小时获星96K的,从零到实战Java架构师成长手册

Java你猿哥

架构 架构师 高可用架构 高性能架构 高可扩展

引领下一代云计算技术的变革:无服务器架构

xfgg

云计算 severless

深度理解:Redis Hash(散列表)实现原理

Java你猿哥

redis 开源 ssm hash 散列表

解锁人机交互新技术 华为开发者联创日·全栈AI黑客松大赛等你来

说山水

MatrixOne 助力开启分布式计算格局新征程

MatrixOrigin

分布式数据库 HTAP MatrixOrigin MatrixOne 矩阵起源

一块显存为 12GB 的 GPU 卡能够在CST 时域求解器仿真的最大网格数是多少?

思茂信息

cst cst使用教程 cst操作 cst电磁仿真 cst仿真软件

如何科学地利用MTTR优化软件交付流程?

SEAL安全

DevOps MTTR 企业号 5 月 PK 榜

Solaris Network:BSC上首个链上合成资产解决方案

鳄鱼视界

华为云UniXcoder-VESO-v1问鼎CodeXGLUE榜单第一名

算法 代码 华为云 代码语义

前端开发如何更好的避免样式冲突?级联层(CSS@layer)

vivo互联网技术

CSS 级联 @layer

500行代码手写docker-实现硬件资源限制cgroups

蓝胖子的编程梦

容器 k8s ,docker Cgroups #k8s

刚入职的后端开发问我SpringBoot如何跨域配置?我表示

Java你猿哥

Java Spring Boot ssm 跨域

5月书讯 | 《这就是ChatGPT》来了!

图灵社区

数学 书单 书单推荐 GPT

量子程序设计基础 | 从经典计算到量子计算

TiAmo

量子计算 经典计算

使用 Node.js、Socket.IO 和 GPT-4 构建 AI 聊天机器人

devpoint

node.js websocket GPT-4

2023数博会丨软通智慧发布“一屏统揽”TongView 数字政府慧治平台解决方案

说山水

阿里架构组分布式架构技术使用心得:全在这一份文档里面了

Java你猿哥

架构 分布式 ssm 分布式架构 安全架构

Health Kit文档大变样,一起尝鲜!

HarmonyOS SDK

HMS Core

大语言模型技术原理

NineData

AIGC ChatGPT AI大语言模型 大语言模型 技术原理

基于WebGPU的AI原生3D引擎迎来新机遇!Orillusion在GOTC上演讲!

Orillusion

开源 渲染引擎 元宇宙 webgpu AIGC

GitHub发布即百万!字节内网超实用 java性能优化手册,star超十万

Java你猿哥

Java ssm jvm调优 Java性能优化

如何避免写重复代码:善用抽象和组合

阿里技术

Java 代码实战

4 种 MySQL 同步 ES 方案,yyds!

Java你猿哥

Java MySQL sql elasticsearch Binlog

5月书讯 | 《这就是ChatGPT》来了!

图灵教育

数学 书单 GPT

从7天到1天,Kyligence 和亚马逊云科技助力欣和提高数据应用价值

Kyligence

数字化转型 指标平台

设计模式之模板方法模式

越长大越悲伤

设计模式

创建矢量图形:Patternodes 3 免激活版

真大的脸盆

Mac Mac 软件 矢量图形创作 创建矢量图形

硬核!阿里2023版Spring全家桶进阶笔记流出,堪称Java跳槽神器

Java你猿哥

spring Spring Boot spring security Spring全家桶 Spring Cloud Aliababa

编转码、CDN和AI是如何撑起短视频数百亿市场规模的_音视频(后端)_贾凯强_InfoQ精选文章