短视频的色彩特效原来是这样做出来的_文化 & 方法_常青



 写点什么

从眼睛的进化说起

大约在 5 亿 4 千万年前的寒武纪，地球上一部分生物体开始进化出了感光细胞，这种细胞可以感应光线的强弱，并且直接驱动本体的运动细胞采取必要的规避动作，以确保脆弱的细胞不被紫外线所伤。

后来单个的感光细胞开始扎堆聚集并且形成了凹陷，随着凹陷程度的逐步加深，这些感光细胞也就渐渐地汇聚成了一个前部有孔隙的球状结构，“眼球”的雏形也就由此形成了。

随着球形的眼睛结构渐渐成型，中学物理课本中的“小孔成像”原理也就越来越能发挥作用：只要开孔足够小，光线就能准确地到达这些聚集的感光细胞进而成像，眼前的物体也就开始变得边界清晰。代表腾讯文化吉祥物之一的鹦鹉螺，就是采用了这种“以小为美”的进化策略，而且一直坚持到现在。

但是这种越来越小的策略也会导致光线进入量越来越小，所以鹦鹉螺们的世界想必是很昏暗的。我们的祖先可不希望放弃一个光明的世界，所以，我们给自己的眼睛安装了一个足够高级的光学部件 —— 晶状体，以期拥有一个光明而清晰地世界。

然而，当大家都能把世界看得很清楚的时候，色彩分辨能力也就演变成了新一轮的军备竞赛。

当我们的祖先踩着那些坚称“我就想健健康康地当个素食主义者”的同类尸体艰难前行的时候，他们并不知道，让自己活得更久的原因，竟然是因为那双能区分树叶是嫩叶还是成熟叶片的眼睛。因为成熟的叶片常常包含大量的植物性毒素，会让进食者身体遭受很大的伤害。所以，我们都是那一波“好色的”猴子的后代。

而眼睛对色彩的分辨能力，不仅在远古时代让我们活了下来，也让今天衣食无忧的我们，能看到更多色彩斑斓的效果。

比如短视频的移形换影特效，其本质原理就是一个充分利用色彩的小把戏。

三原色的修改和组合

人体有三种视觉锥细胞，所以我们看到的颜色都是由三原色组成的，并不是说世界上就只有这些颜色，而是更加绚丽的色彩空间我们也感知不到。

因此，液晶显示器的成像原理上也就是基于 R（红）G（绿）B（蓝）三原色的组合而实现的，腾讯云短视频（UGSV）的移形换影特效，就是在这三种颜色空间上做了一些文章：

先以一幅静态的图片来举例：

Doloris

现在把图片中红色的分量去掉，放大 10%，再移动一些距离。

Doloris-strip-red

再把蓝色的分量去掉，放大 10%，并移动一些距离。

Doloris-strip-blue

再把绿色的分量去掉，放大 10%，并移动一些距离。

Doloris-strip-green

然后将这三副图片以 33%的透明度和源图叠加到一起，形成一种移形幻影的效果。

Doloris-blend

交给计算机来实现

上面这些图片是我用图片处理软件简单处理后得到的，但如果是视频文件，显然要交给计算机自动解决，如何做到呢？

首先我们先给这幅图片定义坐标，为了方便处理我们将图片的中心点定义为 (0,0)，图片的 XY 轴最大值为 1，如下图所示：

坐标定义

然后开始处理上面提到的两个变换，一个是放大，一个是移动。

放大如果定义图片上的任意象素坐标是(x,y)，放大 s 倍后的坐标就是 (x’,y’) = s(x,y) = (sx, sy)
移动如果定义图片上的任意象素坐标是(x,y)，将其移动(?x,?y)，移动后的坐标就是(x’,y’) = (x+?x, y+?y)
合并将上面两个公式进行合并，得到的新坐标点就是 (x’,y’) = (s(x+?x), s(y+?y))
叠加然后我们要将修改过的图片叠加到原图上，alpha 叠加的公式是 src * (1 - alpha) + overlay * alpha。

基于 OpenGL 的版本

短视频的特效处理，每秒钟要处理几十张甚至更多的视频画面，所以简单的 C 语言处理算法并不能满足性能上的要求，我们需要使用手机的硬件加速能力，目前除了常见的 OpenGL 等 API 之外，还有如 Vulkan, DirectX, Metal 等可选方案。就目前而言，OpenGL 在各平台上通用性最好，网上的资料也比较丰富，不论是桌面平台还是移动平台都有支持，本文就以 OpenGL 来讲讲特效的实现。

实现移形换影特效的时候，我们会用到 OpenGL 的 Fragment Shader, Fragment Shader 作用就是返回图像各点的色值，Fragment Shader 也有一套自己的编程语言，叫 Shading Language 简称 GLSL, GLSL 和 C 很像，增加了一些向量的数据类型，和一些图像相关的处理函数。Shading 和 C 比起来有一个比较特殊的地方是不支持隐含的类型转换，比如浮点点整型的转换（在使用浮点数时，一定要加上小数点，如 1.0）。

篇幅原因，我不在这里把所有的特效代码都一一列举了，仅附上放大和位移的部分实现：

varying vec2 textureCoordinate;uniform sampler2D inputImageTexture;void main() {  vec2 offset = vec2(0.05, 0.05);  float scale = 1.1;  vec2 coordinate;  coordinate.x = (textureCoordinate.x - offset.x) / scale;  coordinate.y = (textureCoordinate.y - offset.y) / scale;  gl_FragColor = texture2D(inputImageTexture, coordinate);}

复制代码

考虑到不是所有读者都学过 Shading Language，这里做一个简单的解读：

我们在这里定义了一个变量 coordinate，这个就是前面提到的(x,y)，它的值就是 ((x - ?x)/s, (y-?y)/s)。
函数 texture2D 的作用就是从图片中获取某个坐标的颜色。这里从 inputImageTexture 中的 coodinate 坐标点获取了颜色。
gl_FragColor, 这是 Fragment Shader 的输出的值， gl_FragColor 是一个 GLSL 预定义的全局变量，类型是 vec4 既 (r,g,b,a) 这四个量，也就是一个 RGBA 颜色。
程序运行后在 textureCoordinate 这个坐标就会显示 gl_FragColor 这个颜色。

上面讲了单幅图的处理，对于视频我们可以做些更有意思的效果，比如我们可以把当前帧和上一帧的图片进行叠加，这样就可以作出一些更有意思的效果。

创作场景

短视频的色彩特效原来是这样做出来的

从眼睛的进化说起

三原色的修改和组合

交给计算机来实现

基于 OpenGL 的版本

更多特效

评论

软件测试学习笔记丨WebSocket原理&使用

应用监控 eBPF 版：实现 Golang 微服务的无侵入应用监控

释放全球互连的数字潜力！MWC 2024云网高峰论坛召开，中国电信天翼云扬帆起航！

LLM 推理优化探微 (2) ：Transformer 模型 KV 缓存技术详解

Vocabulary

SD-WAN: 灵活部署，助力云服务

NineData云原生智能数据管理平台新功能发布｜2024年2月版

淘宝天猫详情接口API：快速实现商品信息查询和展示

好物期刊#1：我每天都使用的在线工具

如何做代币分析：以 LDO 币为例

从《繁花》看图数据库的关联力！

数字先锋| 上云！让“媒”好“发声”

Sermant运行流程学习笔记，速来抄作业

如何做代币分析：以 USDC 币为例

IT外包提升企业灵活性与敏捷性

淘宝1688京东...商品详情API接口（属性，详情图，价格，sku评价等接口）可高并发批量采集

钉钉如何通过AppLink快速连接仓储系统

利用API接口进行竞品价格监控的综合指南

开发者分享：利用 EMQX Cloud 与 ESP32 微控制器实现智能液冷散热系统

如何基于容器网络流量指标进行弹性伸缩

向“新”而行，以科技创新培育新质生产力！

IT外包对企业业务流程整合有什么帮助？

如何使用香山之香山工具详解：difftest应用及配合波形检验

金融信创湖仓一体数据平台架构实践

前端的你常用的编程语言有哪些？

广州孚瑞经营改善企业经营持续增长方案提供商

创作场景

短视频的色彩特效原来是这样做出来的

从眼睛的进化说起

三原色的修改和组合

交给计算机来实现

基于 OpenGL 的版本

更多特效

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载