从云、CDN、AI 到架构 重走短视频技术的长征路

  • Jackson

2018 年 4 月 9 日

话题:文化 & 方法

在网上,爆款产品的出现往往意味着其背后技术也会受到大众的关注。而近期火爆的短视频也不能例外,其背后技术如云、AI、CDN 等也一样成为了引人瞩目的焦点。在 QCon 北京 2018 全球软件开发大会上,第一天的晚上便上演了这样的一幕好戏,极客邦科技 InfoQ 联合 Intel 共同策划主办了以“短视频崛起背后的技术支撑”为主题的晚场活动,从多个角度入手,深度剖析了短视频崛起的技术秘密。

此次活动中,爱奇艺技术总监邢常亮、Intel 资深解决方案架构师慕延峰先后登场,先为到场的技术人提供了两个主题分享。而后,新浪网视频运维平台负责人马根蕾、熊猫直播技术专家卢永菁、陌陌高级研发工程师龚清华、爱奇艺算法高级技术经理方非等四位业内专家担任了四个小组的组长,带领到场人员就“短视频技术选型”“如何让技术跟上业务的发展脚步”“短视频及直播的体验优化”和“AI 赋能短视频”等四个主题分别展开讨论。

主题分享:聊聊短视频背后技术那些事

爱奇艺技术总监邢常亮提到,从 2016 年中期开始到现在,短视频的百度热搜指数便一路飙升,在资本市场上也变得炙手可热。短视频的爆发是很多因素聚合在一起所引发的爆点。客观来看,短视频爆发的主要因素来源于三个方面,商业变现模型逐渐完善、用户碎片化消费习惯养成、短视频内容制作门槛降低等,都是短视频爆发的推动力。而技术的创新和规模化应用在背后起到了催化剂的作用,促成了短视频的大爆发,涉及的技术包括:智能手机,4G/WIFI,视频拍摄,视频合成,机器学习,AI,推荐算法,大数据,云计算,编解码,CDN,广告等等。

如果深入剖析短视频的商业闭环,发现其与其他以内容为主的商业模式极为类似,都会涉及创作、上传、生产、发现到变现等若干环节。但同时,短视频也有自己的独特性,比如:创作中拍摄、加工、合成等并不都是专业人士,这意味着普通用户也可以很容易地参与其中,直接导致内容量级的飞跃,用户兴趣点的分散化,这使得原本的以人工运营为主的内容推送方式不得不转向以机器算法为主,进而为后台推荐系统提出了更高的挑战。另外,用户入门门槛的降低也意味着内容质量会参差不齐,如何有效地进行内容审核以及优质内容的筛选,也是个要解决的问题。

爱奇艺最近推出了爱奇艺号开放平台,积极的构建短视频的内容生态。利用 AI、大数据等技术手段来解决短视频业务发展中的相关问题,比如:利用 AI 技术来进行封面图质量检测 / 软色情内容检测,来保证平台内容的质量;利用 NLP 技术对视频评论数据进行感情分析和标注,进而对优质内容和高质量作者进行有效的筛选;利用大数据技术对用户行为和上传内容进行全方位的分析计算,从而得到爱奇艺号用户指数,该指数反映了作者的创作能力和受欢迎程度,并以此为基础构建起用户等级权益的金字塔,收拢高质量的短视频创作者。

短视频行业很容易出现爆款内容,这就对后台业务系统的高并发处理能力提出了挑战,面对随时可能出现的用户流量爆炸式突增情况,需要在系统架构设计中充分的考虑熔断、限流、隔离等处理策略,以保证系统的稳定运行,即使出现意外,也能够将问题控制在局部而不会大规模扩散。另外,对于端视频开播速度、卡顿等基础性的播放体验来说,用户的要求会更加苛刻,容忍度会更低。为了能够得到极致的播放体验,需要在短视频开播流程,码流生产分发策略,CDN 调度,码流预加载等多个环节进行大量的优化工作。

最后,短视频的爆发给互联网行业带来了巨大的机遇和挑战,希望可以利用技术的手段让短视频业务取得更快更健康的发展!

主题分享:助力短视频业务

Intel 资深解决方案架构师慕延峰表示,在短视频爆发的带动之下,整个视频行业的业务也在不断演进中,视频业务的流量消耗在高速增长,屏幕变大的同时分辨率也在增长,4K 业务推动行业要求更高像素、更高色彩和更高帧率;网络带宽的限制进一步提升了对高效媒体编码的需求,而一些解决方案提供商就需要提供更经济、高密度的视频转码能力。??

那么视频业务有需求,在数据中心方面是如何解决计算、存储和网络等问题的呢?在底层的芯片支持上,在不同的应用场景采用了不同的芯片,如智能摄像头、视频网关、数据中心和云、客户端等不同场景采用不同型号的芯片,利用高速视频编解码和图像处理进行压缩,加入计算视觉解决方案整理深度学习推理,采用定制化的解决方案优化计算、进行多样化编程,进一步提升性能和功效。

而且,采用优质的解决方案下的软硬件进行搭配,对业务的提升是显而易见的。通过硬件加速的编解码器、加速器和处理器中的集成图形来加速媒体及计算机视觉痛点, 从灵活性和互操作性中受益。

分组讨论:短视频的技术选型

在两位讲师分享结束后,晚场活动进入了小组讨论的阶段,每个小组根据不同的话题在组长的带领下有序进行。

新浪网视频运维平台负责人马根蕾带领“短视频的技术选型”小组经过讨论后认为,在短视频选型中,生产、转码、存储、CDN 和播放器等都需要面临选择。转码方面,在初创公司没有很大的技术团队,初期选择商用产品会更好些;但是后期如果有自己的转码研发团队,这时去做自己的转码业务会更好些,也可以根据自己的业务应用和业务特点去进行调整。

存储和 CDN 方面,自研和商用相结合是一种好办法。在商业产品中来看,CDN 之间竞争激烈,价格透明,市场成熟度高,一般成本上是不会亏的。但是如果说自建的话,第一,可以拿到一些非常好的资源,第二可以从运营商处获得优质资源,第三,容灾能力会更强。存储自研的话,第一,扩容、数据保护、加密等都可以根据业务进行调整,灵活可靠。总结来看,在选型的过程中可以多对比几家进行挑选,每家业务特色不同,这样就可以找到适合自家业务线的产品,用起来会更顺手。

分组讨论:如何让技术跟得上的业务发展的脚步

熊猫直播技术专家卢永菁带领“如何让技术跟得上的业务发展的脚步”小组探讨后发现,目前,很多企业的视频业务正在蓬勃发展,越来越多的用户在使用这一功能。但是这个功能在深层领域中,涵盖了转发、存储、转网、分发等诸多技术,这些技术有些是属于痛点问题,有些则是支撑起来了用户体验,所以总结一下可以得出一个结论,妨碍用户体验的最关键技术点在于精彩内容的寻找过程,也就是生成和创作过程。

生成是指通过手机录制的过程,其中有编码等问题存在;视频录制好后,需要上传到云,上传到服务器,然后从长视频中找到精彩片断进行剪辑。短视频希望用户有更好的体验,是用户期望看到的片断,这个精彩内容的寻找过程就变得异常重要。

想要迅速实现这一目的,一方面期望利用视频内容智能识别,包括人物、动作、人际关系等进行自动识别,找到这个视频最精彩的片断然后分发出去。另一方面在直播视频编辑时也是一样的,找到最精彩的部分,现在很多是手工,如果加入一些人工智能技术,基于深度学习进行视频内容理解,这部分不但节省了大量的人员投入,还能够实现视频找到用户,让用户看到最精彩的部分。

分组讨论:短视频与直播的体验优化

陌陌高级研发工程师龚清华带领“短视频与直播的体验优化”小组探讨后得出,体验优化包括了秒开、卡顿、延迟、上行质量以及海外质量等。而秒开质量对于用户体验的整体质量影响最大,其优化主要在网络层面。首先要进行 CDN 的预热。根据对用户使用习惯的分析或者针对近期的一些热点视频,对用户的观看喜好进行预判,而不是放在 CDN 预热,没有了先下载到 CDN 的过程会让整个过程变得更快。在 DNS 方面,其解析时间依然很长,通过优化能够节省几十毫秒,一点点优化,就会让整个时间变短。预判用户即将打开的视频进行预载也可以达到这一目的。

在卡顿方面,包括时间占比、人数占比、技术占比等问题。解决卡顿问题一般通过两部分,第一是客户端打点,做 CDN 回流等。一些案例,包括了主播推流时的卡顿,用户下载时的卡顿等,这多数与 CDN 相关,因此往往采用 CDN 自动切换的功能可以解决问题。另一方面则是国外的视频播放,这些国外的业务也会遇到 CDN 专项的卡顿问题,当然也可能会与 DNS 存在一些相关性,所以会做一些优化。

分组讨论:AI 赋能短视频

爱奇艺算法高级技术经理方非带领“AI 赋能短视频”小组探讨后得出结论,在这一话题下包括了三大方向,生产制造、管理审核分析和分发推荐消费。在创作上,AI 和短视频的内容形态有关比如 TGC、UGC 和自动形成的视频。也与创作阶段有关系,假设把内容分层三类,过程分成三条,这样就会有 9 种不同的 AI 作用的场景。在设计思路上,AI 可以提供什么样的东西?举个例子,通过聚类或者是提出关键词,搜出类似比较精品的思路或者提供脚本,剧本已经定下来,只要表演视频就可以了。第二是录制,最常见就是美颜。第三是后期制作,AI 可以自动优化,可以提高质量,甚至是风格转换或者音效转换。

在分发和消费类,分两大阶段,第一阶段对事物完成理解,第二阶段分发和推送。在推荐当中最有效的,行为是最重要的。其次在场景和用户内容理解上也会有 AI 的帮助。内容上最重点的是文本内容,这其中包括了语音识别后的文本等,因为语音识别本来就是人工智能一部分。目前在科研和工业界热点是多模态交互,即把图像、音频、视频等产生不同的表达,也会成为可以理解的内容上的东西。

文化 & 方法