2025 火山引擎智能视频云实践精选集

2025 火山引擎智能视频云实践精选集

发布于:2026-01-27 14:01
围绕火山引擎视频与边缘在过去一年的 AI /大模型&音视频技术实践,包括:(1)AIGC 画质大模型、自由视角视频直播、AI 音视频编码、AI + 增强视频质量等全球前沿的论文精选;(2)媒体智能工具、音视频交互、智能剪辑、智能 3D 视频等 AI + 技术的落地实践;(3)AI + 设计、智能硬件、短剧出海、VR 大空间等行业场景的最佳实践。
查看更多
下载此书

目录

1. 国际认可

火山引擎多媒体实验室多项成果入选 SIGGRAPH ASIA 2025


火山引擎多媒体实验室 AIGC 视频画质理解大模型 VQ-Insight 入选 AAAI 2025 Oral


火山引擎多媒体实验室画质理解大模型 Q-Insight 入选 NeurIPS 2025 Spotlight


火山引擎多媒体实验室重要突破!LiveGS 技术登榜 SIGGRAPH,重新定义移动端自由视角视频直播


ICME 2025 | 火山引擎在国际音频编码能力挑战赛中夺得冠军


CVPR 2025 | 火山引擎获得 NTIRE 视频质量评价挑战赛全球第一


火山引擎蝉联全国人工智能大赛 — AI + 增强视频质量评价冠军

2. 技术探索

当一朵云,打出「豆包同款」的旗


从 “抖音同款” 到 “豆包同款”:AI 时代,视频云正在有了新表达


从 “抖音同款” 到 “豆包同款”:视频云正在进入 Agent 时代


火山引擎智能 3D 视频启动商业化,计划落地直播应用云端协同构建 VR 院线,加速 LBE 产业化与规模化发展


火山 HTTPDNS Cache2.0:网段级精准调度驱动核心业务收益


基于 DiT 大模型与字体级分割的视频字幕无痕擦除方案,助力短剧出海


大模型帮你剪视频 —— 基于 MCP 打造火山引擎 VOD 智能剪辑


火山引擎推出 veimage-mcp Server,打造专属您的图片智能助理


火山引擎 OS Agent 解决方案、豆包 1.5・UI-TARS 模型发布


10 + 芯片和模组商集体适配!让智能硬件能听会看还会唠


重构智能设备管理范式:火山引擎端智能解决方案上新,多重 AI 服务即刻享用!


揭秘豆包音视频通话幕后技术,自己开发产品也能用


你给豆包打的这通视频背后,藏着 AI 实时交互的体验密码


多模态需求井喷,智能视频云如何靠分布式处理破局?


从 “可用” 迈向 “好用”:详解火山引擎智能视频云的三层架构升级


破解 AI 硬件落地困局,火山引擎 RTC 重塑智能交互生态


重新定义离线编码,H.266 为何能让视频更高清?


实时通信的下一站,H.266 作为破局关键


画质之外,直播编码还应当关注哪些技术优化点


H.266 解码 “困局”,被这个解码器解决了


重回 AI 战场!H.266/VVC 的时代才刚刚开始


在 AI 应用爆发前夜,H.266 成熟了


NeurIPS 2025 | 火山引擎多媒体实验室联合南开大学推出 TempSamp-R1 强化学习新框架 助力视频理解大模型高效提升时序理解能力!


直击 3D 内容创作痛点 - 火山引擎多媒体实验室首次主持 SIGGRAPH Workshop 用前沿技术降低沉浸式内容生成门槛

3. 最佳实践

图虫 × 火山引擎:AIGC 创意工具链,让设计灵感高效实现


探秘史前海洋,火山引擎 × 北京天卓视创带你沉浸式 “摸鱼”!


央视点赞!凌云光・元客视界 × 火山引擎:打造数字人光场重建方案


沉浸式文旅新玩法 - 基于 4D GS 技术的真人数字人赋能 VR 体验升级


沉浸式 LBE 大空间互动体验!火山引擎支持《转折・从头越》北京 VR 巡展


中央美院 × 火山引擎:AI + VR 构建艺术展新形态


火山引擎赋能微短剧出海:从市场验证到规模化复制的 AI 实践路径


火山引擎 RTC 联合乐鑫、移远:智能硬件注入 “豆包”,“模” 力升级


详解 velmageX 助力卓特视觉智能、高效生成设计素材


评论

发布
暂无评论