视频
![阿里大模型又有新进展:时间、空间可控的视频生成模型VideoComposer正式问世](https://static001.infoq.cn/resource/image/87/f0/873d79c1db88e36b637676019d5d7ef0.png?x-oss-process=image/crop,x_29,w_1208,h_678/resize,w_416,h_234)
阿里大模型又有新进展:时间、空间可控的视频生成模型 VideoComposer 正式问世
VideoComposer 通过组合式生成范式同时实现视频在时间和空间两个维度上的可控性。
![WebTransport 开播的应用实践之路](https://static001.infoq.cn/resource/image/2b/e9/2bb3db7ffa96fc915cb4e2fd97c6fee9.jpg?x-oss-process=image/crop,y_1,w_5455,h_3068/resize,w_416,h_234)
WebTransport 开播的应用实践之路
WebTransport 是如何稳定传输高质量音视频的?
![火山引擎视频云“再升段位”:本次发布的新产品有点儿意思!](https://static001.infoq.cn/resource/image/92/39/92e4931275685de231c2f57211594239.jpg?x-oss-process=image/crop,x_-892,y_1,w_5427,h_3052/resize,w_416,h_234)
火山引擎视频云“再升段位”:本次发布的新产品有点儿意思!
更高清,更互动,更沉浸
![聚焦新产品,论剑新技术——2023 春季火山引擎 FORCE 原动力大会即将开启!](https://static001.infoq.cn/resource/image/fb/17/fb6ea703c03d3bf06fac4dd6fcd88017.jpg?x-oss-process=image/crop,y_561,w_1080,h_606/resize,w_416,h_234)
聚焦新产品,论剑新技术——2023 春季火山引擎 FORCE 原动力大会即将开启!
2023 春季火山引擎 FORCE 原动力大会即将开启,这次有哪些看点?
![技术深度解析:H.266/VVC 标准之量化技术](https://static001.infoq.cn/resource/image/e6/33/e610afff3d122e293b724225a10acf33.jpg?x-oss-process=image/crop,y_1,w_8191,h_4606/resize,w_416,h_234)
技术深度解析:H.266/VVC 标准之量化技术
一篇深度技术论文
![字节新一代解码器 BVC 帮助 H.266/VVC 标准商业落地](https://static001.infoq.cn/resource/image/d8/3b/d8998bf637d6df993ce6fddc60d7ec3b.jpg?x-oss-process=image/crop,w_3773,h_2122/resize,w_416,h_234)
字节新一代解码器 BVC 帮助 H.266/VVC 标准商业落地
作为 HEVC 的继任者, H.266/VVC 能够在相同的质量下将压缩效率再提升一倍。 H.266/VVC 标准的推动将能为未来视频内容的发展提供巨大的潜力。
![基于深度学习的环路滤波技术](https://static001.infoq.cn/resource/image/8f/91/8f37246aa79288f1fbeba192ef4a5091.jpg?x-oss-process=image/crop,y_1,w_4095,h_2302/resize,w_416,h_234)
基于深度学习的环路滤波技术
基于深度学习的编码工具方兴未艾,其展现诱人性能的同时,亦引起较高的复杂度。
![ICME VQA Grand Challenge 获奖工作分享](https://static001.infoq.cn/resource/image/f4/9e/f465bef1a785c7fa4af77d6736368f9e.jpg?x-oss-process=image/crop,y_1,w_2199,h_1236/resize,w_416,h_234)
ICME VQA Grand Challenge 获奖工作分享
字节跳动火山引擎 - 多媒体实验室团队获得了 ICME 21 Best Grand Challenge Winner Team。
![技术深度解析:H.266/VVC 标准之仿射运动模型](https://static001.infoq.cn/resource/image/17/4f/17484e5483d71188bc934a19d7a90e4f.jpg?x-oss-process=image/crop,y_1,w_4255,h_2392/resize,w_416,h_234)
技术深度解析:H.266/VVC 标准之仿射运动模型
VVC 使用了大量的新技术,如多叉树块划分技术、历史运动矢量预测技术、亮度色度线性模型预测技术等。本文将重点介绍 VVC 中的仿射运动模型技术。
![“零耗时”首帧视频体验的优化实践](https://static001.infoq.cn/resource/image/f4/1c/f401db715b327a77f240843e97f7171c.jpg?x-oss-process=image/crop,y_1,w_3999,h_2248/resize,w_416,h_234)
“零耗时”首帧视频体验的优化实践
字节跳动技术团队的一篇技术干货分享
![云游戏技术的过去、现在和未来](https://static001.infoq.cn/resource/image/87/3c/87f5e8598fd07a80dc8c78eae370123c.jpg?x-oss-process=image/crop,y_1,w_4895,h_2752/resize,w_416,h_234)
云游戏技术的过去、现在和未来
本文将剥去云游戏的各种产品外衣,对云游戏技术的演进历史,面临的挑战,和未来的优化方向进行一个梳理和汇总。
![基于深度学习的超分辨率效果优化](https://static001.infoq.cn/resource/image/46/d9/468a17739854b99124e08b27115385d9.jpg?x-oss-process=image/crop,y_1,w_3992,h_2244/resize,w_416,h_234)
基于深度学习的超分辨率效果优化
超分辨率,是一种提高图像、影片分辨率的技术。
![H.266/VVC 标准——360 视频编码技术深度解析](https://static001.infoq.cn/resource/image/f5/c8/f58203435ac623a18b99cf4b75a223c8.jpg?x-oss-process=image/crop,y_1,w_5406,h_3040/resize,w_416,h_234)
H.266/VVC 标准——360 视频编码技术深度解析
随着 5G 网络和具有更强视频拍摄和图形处理能力的智能手机推广, 360 视频应用的质量将得到很大改进,而且低延迟的实时交互式 360 视频应用服务成为可能。
![六自由度的全景视频技术](https://static001.infoq.cn/resource/image/6a/26/6ab881922860a99273ea699b2f9f9c26.jpg?x-oss-process=image/crop,y_1,w_7951,h_4472/resize,w_416,h_234)
六自由度的全景视频技术
本文提出了一种低成本且易用的六自由度全景视频技术。
![字节跳动视频编码技术:码率控制](https://static001.infoq.cn/resource/image/50/2f/504ce564fd24fea4e37ac9d68d2b382f.jpg?x-oss-process=image/crop,y_1,w_5039,h_2834/resize,w_416,h_234)
字节跳动视频编码技术:码率控制
码率控制技术是实际视频编码器中一个非常重要的技术模块。
![字节跳动:H.266/VVC 帧内预测技术](https://static001.infoq.cn/resource/image/93/20/939ac8585f2464c975d99dc460c69f20.jpg?x-oss-process=image/crop,y_1,w_4109,h_2310/resize,w_416,h_234)
字节跳动:H.266/VVC 帧内预测技术
一篇硬核干货
![极致首帧播放方案:零首帧解决方案](https://static001.infoq.cn/resource/image/e6/33/e610afff3d122e293b724225a10acf33.jpg?x-oss-process=image/crop,y_725,w_8191,h_4606/resize,w_416,h_234)
极致首帧播放方案:零首帧解决方案
「零首帧」并不是真的 0 毫秒启播,而是用户几乎感知不到有首帧时间的存在。
![视频编码标准发展史](https://static001.infoq.cn/resource/image/35/26/355b4bc2756fa1b4effa27af2bc92e26.jpg?x-oss-process=image/crop,y_335,w_5471,h_3076/resize,w_416,h_234)
视频编码标准发展史
视频已经在人们的日常工作和生活中无处不在,并且正逐步替代文字成为人们获得知识和资讯的最重要方式。
![突破视频编码模式级压缩瓶颈:一种基于长短期相关性建模的帧内模式编码方法](https://static001.infoq.cn/resource/image/ee/2d/ee41c7be6b0ca9d239d357d389516a2d.jpg?x-oss-process=image/crop,y_520,w_5706,h_3208/resize,w_416,h_234)
突破视频编码模式级压缩瓶颈:一种基于长短期相关性建模的帧内模式编码方法
视频压缩的核心在于去除视频信号中的冗余信息,而其中对于空域冗余的去除通常使用帧内预测的方式来实现。
![编码技术新突破:字节跳动AVG让视频缩小13%](https://static001.infoq.cn/resource/image/ec/01/ec721290ff505099e47d8cdfcb154001.jpg?x-oss-process=image/crop,y_162,w_5471,h_3076/resize,w_416,h_234)
编码技术新突破:字节跳动 AVG 让视频缩小 13%
字节跳动 AVG (先进视频团队)在 2021 年发起了一项视频压缩的技术提案,该提案能够在优化压缩质量的同时,节约至少 13% 的存储和带宽。
![无损压缩,解决卡顿,《硅谷》技术正被字节跳动海外团队逐步实现](https://static001.infoq.cn/resource/image/37/cb/37e7800cdfe9241527377c7e8592f1cb.jpg?x-oss-process=image/crop,y_85,w_3647,h_2050/resize,w_416,h_234)
无损压缩,解决卡顿,《硅谷》技术正被字节跳动海外团队逐步实现
字节跳动旗下 To B 业务「火山引擎」对外开放了视频点播服务。
![从 QoS 到 QoE,RTC 的用户体验该如何评判?](https://static001.infoq.cn/resource/image/d0/d0/d08af32653b6c525ed2yyebe1922d3d0.jpg?x-oss-process=image/crop,y_1,w_4572,h_2570/resize,w_416,h_234)
从 QoS 到 QoE,RTC 的用户体验该如何评判?
火山引擎 RTC 基于亿级 DAU 用户的真实反馈和 RTC 全链路质量监测数据,通过长期、大规模的数据分析、归因、验证,建立了一套“标准透明、度量准确、归因全面、预测可靠”的指标体系
![2023,音视频技术将如何发展?](https://static001.infoq.cn/resource/image/7a/9e/7ab0b85e5722ac05c5db5963b5c2339e.jpg?x-oss-process=image/crop,y_624,w_6000,h_3374/resize,w_416,h_234)
2023,音视频技术将如何发展?
云厂商是否能够抢占未来的音视频市场,就看是否能够精准抓住用户需求
![抖音世界杯直播的低延迟是怎么做到的?](https://static001.infoq.cn/resource/image/5d/1b/5d8ffd000e048652dc7fdac144e4b31b.jpg?x-oss-process=image/crop,y_624,w_6000,h_3374/resize,w_416,h_234)
抖音世界杯直播的低延迟是怎么做到的?
世界杯期间,抖音直播提供的 4K 超高清超低延迟看播能力给亿万观众留下了深刻的印象
![音视频技术持续进击,直播互动场景会如何“进化”?](https://static001.infoq.cn/resource/image/47/bc/47020acd83475e698b52c459a7f5b9bc.jpg?x-oss-process=image/resize,w_416,h_234)
音视频技术持续进击,直播互动场景会如何“进化”?
最近几年,音视频是一个非常热的技术话题。远程办公、线上娱乐的需求持续增加,元宇宙的概念也在被广泛讨论,在通信技术不断演进迭代的同时,带来了很多直播互动的新玩法、新形式。
![端云上的“音视频+”:与 AI 擦出了怎样的火花?](https://static001.infoq.cn/resource/image/27/1e/27e7c7525415008134b4e27d32b42f1e.jpg?x-oss-process=image/crop,y_1,w_1706,h_958/resize,w_416,h_234)
端云上的“音视频 +”:与 AI 擦出了怎样的火花?
端云一体化,视听新体验
![端云一体化,视听新体验 | 2022 OGeek 技术峰会主题分会场](https://static001.infoq.cn/resource/image/7b/cd/7b0e3ff6e1e2ayyaafab9891079882cd.jpg?x-oss-process=image/resize,w_416,h_234)
端云一体化,视听新体验 | 2022 OGeek 技术峰会主题分会场
在 2022 OGeek 技术峰会的“端云一体化,视听新体验”主题专场中,OPPO 实时音视频架构师李雪松、声网视频算法工程师郑林儒、OPPO 实时音视频架构师董华三位技术大牛带来了许多干货分享,围绕 RTC、云渲染及音视频 + 技术在应用场景下的实践与开发者展开了讨论。