最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

专访 B 站高级开发工程师李超然:揭秘互动视频背后的故事

  • 2019-11-04
  • 本文字数:2805 字

    阅读完需:约 9 分钟

专访B站高级开发工程师李超然:揭秘互动视频背后的故事

2018 年 12 月 28 日,Netflix 推出《黑镜·潘达斯奈基》,电影片长为 90 分钟,交互总时长达到 312 分钟,五个主线结局上百种支线选择,虽然口碑两极分化,但服务器流量暴涨,拿奖拿到手软,被称为是“互动视频鼻祖级别的创新”。

作为一家以 UGC 内容为主的视频平台和文化社区,B 站(哔哩哔哩)也在互动视频领域做出了一些尝试。在2019 QCon上海站的现场,InfoQ 有幸采访到了 B 站高级开发工程师,同时也是 B 站互动视频的负责人李超然先生,并对互动视频进行全方位揭秘。


InfoQ:首先还是请您简单聊聊所谓“互动视频”的概念,一个完整的互动视频需要包含哪些元素?


李超然:我觉得,广义地说,但凡用户输入(比如点按按钮)会影响视频走向,就可以算是互动视频。所以,这会是一个很宽泛的概念,我们也是在项目推进的过程中,不断更新对互动视频这个概念的理解的。


起初,我们以为互动视频会类似《黑镜》,通过一个一个的选项按钮,把视频片段组织起来。这样一来,观看者可以按照自己的意愿,选择不同的选项,从而影响剧情走向,最终加强观看者的代入感。



互动视频《黑镜》片段


功能上线一段时间后,我们发现创作者的想象力,还是大大超出了我们的预期。比如,很多用户利用互动视频的隐藏变量功能,去创作测试类的视频,出现了很多类似性格测试、恋爱测试的投稿,甚至还有的用户利用互动视频的随机功能,创作了抽卡模拟器,用户可以在互动视频上体验随机抽卡的乐趣,就像很多手机游戏上的抽卡过程一样。


互动视频需要有什么必要的元素,这个问题可能不太好回答,互动视频品类真的太多了。当然了,接受和处理用户输入,一定是必要的,否则就不是互动视频了。但具体是怎么接受和处理用户输入,其中的交互形式以及逻辑机制,可能是多种多样的。具体交互形式可以是按钮,可以是滑杆,甚至是用户的摄像头。具体的逻辑机制,就更多种多样了,这一点可以参考传统游戏。



B 站部分互动视频


事实上,我们不太希望,抽象太多的规则出来,也不打算直接给出规则,互动视频应该包含哪些“元素”才算是“完整”。因为用户才是最有创造力的,会给我们带来无限惊喜。


InfoQ:互动视频在 Netflix 上取得成功之后,国内也以最快的速度引入了进来,在您看来互动视频对用户的吸引力主要体现在哪些方面?


李超然:对于观看者来说,视频画面里的视觉元素可以点击,点击之后还能影响剧情发展,这种新奇的体验本身就是很吸引人的。抛开新鲜感,互动视频本身淡化了视频和游戏的边界,观看者能够在视频中获得之前玩游戏才能获得的乐趣,这也很吸引人。再者,就像我刚才提到的,互动视频品类非常多,有的人把它当成可以代入主角的电影,有的人把它当性格测试,有的人把它当 RPG 游戏,这种内容的多样性和创意也同样吸引我们的用户。


另外,除了吸引观看者,更让我们感到高兴的是,互动视频对于创作者的吸引力同样很大。B 站的生态是很独特的,这是一家重 UGC 的视频平台,大量视频内容是用户自制的。像《黑镜》这类的片子,是由专业机构生产投入大量财力人力物力制作,对于我们大多用户来说,门槛太高。我们用户更多的是希望通过创新视频形式来产出优质内容,互动视频给他们提供了非常多的创作可能。


InfoQ:有观点认为,互动视频的核心主要在于剧本,并没有太多的技术含量,所以无法认同这是一项“黑科技”。对此您是如何看待的?


李超然:用户眼中的“黑科技”可能和技术人员眼中的“黑科技”不太一样。用户眼中的黑科技,更多的是一些超出用户原本认知的创意,而不是其中有多少硬核的技术突破。用户现在可以在视频里,答题完成性格测试,甚至体验推理游戏,也可以称之为”黑科技“。


回到技术人员的视角,互动视频带来的技术挑战,也是非常大的。我一直觉得,软件开发的根本困难,在于对复杂逻辑的整理和抽象。如我在前面的回答里提到的,互动视频本身概念是模糊的,用户的想象力总是超出我们的预期,对于一个技术人员,面对一个如此不清晰的需求,想要在工程层面进行抽象,挑战真的很大。


我们的整体技术方案,需要具有非常强的拓展性,能够快速响应创作者的新诉求,甚至需要让用户不更新我们的 App 就能够体验新的特性;数据结构的抽象,需要具有非常强的通用性,能够适应各种类型的互动视频,尽可能不限制创作者的想象力;技术栈的选择需要跨平台,保证多端一致的体验。整个互动视频,系统演化到最后,几乎变成了一个 2D 游戏引擎。


InfoQ:经过三个月的尝试,互动视频在 B 站内取得的效果如何?是否可以透露一些数据来进行说明。


李超然:目前互动视频的频道内,有超过 3 亿次的视频播放量, 1 万多个用户自制稿件,数据表现还是比较不错的。不少创作者,因为制作互动视频,得到观看者的好评,疯狂涨粉,也是让我们非常高兴的。


InfoQ:在您看来,目前互动视频这样的娱乐方式还存在哪些比较明显的短板?是否有比较合适的解决方案?


李超然:制作成本太高是一个比较大的短板。对创作者来讲,相比于制作一个普通视频,制作同样长度的互动视频的投入,往往要翻好几倍,但回报有多少却是个未知数。针对这个问题,我们可能会对一些常见的模式进行抽象,使其模板化,从而来降低创作成本。


另一方面,互动视频目前还是以视频作为载体,视频本身是线性的,具有非常强的时间轴概念,这某种程度上这会非常限制创作。我们需要很好的产品逻辑抽象,并且提供非常强大的创作工具,来打破这种限制,需要我们长时间一步一步地探索。


InfoQ:随着 5G 时代的到来,人们对于“5G+”也产生了各种期待,在您看来 5G、人工智能、VR/AR 等技术对于互动视频可以带来什么样的改变或者突破?


李超然:5G 带来的最直接的变化就是“高带宽、低延迟”。对于互动视频,高带宽,让我们能在运行时下载更多的视频外资源;低延迟,可以让以前很多为了低延迟而在客户端进行的计算,迁移到服务端了。这对增强用户体验,拓展功能,提供更多可能性,会有一些帮助。


至于 VR/AR 能在互动视频领域起多少作用,我们团队内部也会有讨论,但目前还没有太多可落地思路。可能之后我们会考虑通过 VR/AR 等技术,增强用户的观感,或者拓展用户的输入方式。


InfoQ:最后,能否请您简单谈一谈有关 B 站互动视频的未来发展规划,以及您本人对于互动视频这一领域的未来有哪些期待?


李超然:目前重点还是在内容生态的运营上,我个人最期待的,肯定是看用户还能创作出哪些新玩法。有很多用户给我们反馈,说很感谢我们做这样一个功能,让他把自己以前那些脑洞都做出来。看到用户做出一些超出我们预期的投稿,真的很令人兴奋。非常希望互动视频,能够为 B 站,甚至整个行业的内容生产,注入新的活力,带来更多的可能。


采访嘉宾简介


李超然,哔哩哔哩高级开发工程师,毕业于复旦大学物理系,现就职于哔哩哔哩,目前负责移动端 App 中的播放器与弹幕内核,主导移动端弹幕渲染引擎和互动视频的开发工作。工作内容涵盖音视频播放,画面与弹幕跨端渲染,以及相关的性能调优工作。个人对数学物理和计算机图形学有浓厚的兴趣,业余游戏开发者。


2019-11-04 14:013085
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 262.6 次阅读, 收获喜欢 1293 次。

关注

评论

发布
暂无评论
发现更多内容

Android 查看签名

沃德

程序员 7月月更

Scala 基础 (五):面向对象(上篇)

百思不得小赵

scala 大数据 oop 7月月更

OAI 5G NR+USRP B210安装搭建

柒号华仔

5G 7月月更

spark调优(二):UDF减少JOIN和判断

怀瑾握瑜的嘉与嘉

spark 7月月更

案例 ①|主机安全建设:3个层级,11大能力的最佳实践

青藤云安全

网络安全 主机安全 网络安全、攻防演练

Java多线程案例之阻塞队列

未见花闻

7月月更

渲大师携手向日葵,远控赋能云渲染及GPU算力服务

Finovy Cloud

渲染 GPU算力

【鲲鹏BoostKit】OminiRuntime ——高效统一的大数据分析Runtime底座

Geek_2d6073

终于可以一行代码也不用改了!ShardingSphere 原生驱动问世

SphereEx

数据库 ShardingSphere ShardingSphere-JDBC

AddressSanitizer 技术初体验

焱融科技

内存泄露 存储 文件存储 分布式文件存储

代理和反向代理

沃德

程序员 7月月更

CRMEB 商城系统如何助力营销?

CRMEB

三步就能在OpenHarmony中实现车牌识别

OpenHarmony开发者

OpenHarmony

redisson bug分析

wgy

Java redis redisson

A5000 vGPU显示模式切换

姚华

显卡、gpu

BP神经网络(算法整体思路及原理+手写公式推导)

秃头小苏

7月月更

用Java写学生登陆认证系统

魏铁锤

SAP Fiori 应用索引大全工具和 SAP Fiori Tools 的使用介绍

Jerry Wang

SAP Fiori SAP UI5 ui5 7月月更

关于静态类型、动态类型、id、instancetype

NewBoy

前端 移动端 iOS 知识体系 7月月更

“整洁架构”和商家前端的重构之路

得物技术

架构 前端 重构

Spring Cloud源码分析之Eureka篇第三章:EnableDiscoveryClient与EnableEurekaClient的区别(Edgware版本)

程序员欣宸

Java SpringCloud 7月月更

ORACLE进阶(四)表连接讲解

No Silver Bullet

oracle 7月月更 表连接

LSF 集群全面监控!浅析 HPC 基于龙蜥操作系统的迁移替代解决方案

OpenAnolis小助手

开源 解决方案 龙蜥操作系统 常青藤开源科技 HPCinsights

如何提高网站权重

源字节1号

微信小程序 软件开发 网站开发

beegfs高可用模式探讨

姚华

HPC beegfs 并行文件系统

python变量:引用和可变性

AIWeker

Python python小知识 7月月更

C#/VB.NET 给PDF文档添加文本/图像水印

在下毛毛雨

C# .net PDF 添加水印

视频化全链路智能上云?一文详解什么是阿里云视频云「智能媒体生产」

阿里云视频云

人工智能 媒体 音视频

设计你的安全架构OKR

I

安全架构师 安全架构 企业安全 安全治理

提前解锁 2 大直播主题!今天手把手教你如何完成软件包集成?|第 29-30 期

OpenAnolis小助手

云原生 直播 龙蜥大讲堂 SIG 双周会 CSI 与 open-local

《数字经济全景白皮书》保险数字化篇 重磅发布

易观分析

保险数字化

专访B站高级开发工程师李超然:揭秘互动视频背后的故事_QCon_陈思_InfoQ精选文章