【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

腾讯披露自研芯片“沧海”最新进展

  • 2023-04-21
    北京
  • 本文字数:1753 字

    阅读完需:约 6 分钟

腾讯披露自研芯片“沧海”最新进展

腾讯自研芯片“沧海”已经广泛应用到实际环境,并斩获 8 项世界第一。

 

4 月 15 日,莫斯科国立大学举办的 MSU 硬件视频编码比赛成绩揭晓。经过数月的严格测试,腾讯自研的编解码芯片“沧海”包揽了所参加的两个赛道 8 项评分的全部第一。据了解,沧海芯片已在业务场景中投用数万片,服务腾讯自研业务及公有云客户。

 

MSU 是视频压缩领域最具影响力的顶级赛事,迄今已连续举办了十七届,吸引了包括亚马逊、英伟达、Intel、AMD、字节、快手、阿里和腾讯在内的国内外知名企业参与。

 

具体来看,SSIM (结构相似性)、PSNR(峰值信噪比)和 VMAF(视频多方法评估融合)等多项评价指标,沧海芯片大幅领先行业 GPU 等标品硬件。值得一提的是,在 120fps 的高帧率档位上,在同等画质下沧海较行业领先 ASIC 水平能再节省 10%码率。

 

作为全真互联时代的交互模式和关键技术,音视频背后的编解码能力至关重要。基于自研芯片与软件的联合调优,腾讯云的音视频编解码能力已达业界领先水平。

 




瞄准编解码领域核心难题

 

多媒体业务进入音视频直播时代,4K/8K 的超高清内容对云计算基础设施提出了难题。如何在降低成本的同时,最大化还原画质、实现低延迟,是全真互联时代面临的难题。业界已有的通用处理器,并非针对数据中心转码场景定制开发,部署中很难兼顾真实场景的全方位挑战。

 

2019 年初,腾讯蓬莱实验室、香农实验室联合启动编解码芯片”沧海“研发。对硬件编解码的算法、架构和工程进行深度攻关,向高画质、低延迟、低成本的“不可能三角”发起挑战。

 

基于自身在底层软硬件架构和音视频领域的多年积累,研发团队对每个模块的计算任务都作了并行拆解。通过分配不同的计算单元,从而叠加大量处理任务;为沧海芯片内置视频编码加速专用功能模块,让流水控制逻辑更纯粹,减少重复计算和分支判断,带来更低的功耗和成本。

 

沧海芯片的编码器设计中完整实现了高精度运动搜索、全率失真优化、高效自适应量化等所有主流编码工具,并融合腾讯云软件编码器码率控制等方面的领先技术,压缩率高于市面标品 35%以上。

 

在硬件架构上,通过将视频预分析计算单元进一步卸载到硬件中,沧海芯片大幅减少了高密度转码场景下任务对 CPU 性能的依赖,将转码性能提升到更强。通过灵活的多核扩展架构、高性能编码流水线、层级化 Memory 布局,沧海芯片能满足高吞吐、低时延和实时性要求。

 

根据 MSU 实测数据,从各项指标看,在同码率下,相较于业界 GPU 等标品硬件,沧海能大幅改善画面质量;在 120fps 的高帧率档位上,同等质量下,沧海比行业领先水平进一步节省 10%以上的码率;另外,沧海芯片的单帧 1080p 的编码耗时仅 4 毫秒,吞吐性能几乎不受到编码参数、视频类型的影响。

 

已在业务场景规模应用

 

去年 3 月,沧海芯片顺利“点亮”,目前已经量产并投用数万片,在云游戏、直点播等场景中,面向腾讯自研业务和公有云客户提供服务。

 

在直播平台中,观看人数小于 200 人的中长尾直播是主体,沧海芯片能帮助节省大量计算成本;在 4K/8K 超高清、高帧率场景中,相对软件编码,沧海芯片能实现低延时的高质量转码。

 

腾讯丰富的多媒体应用场景,提供了充分的分析和验证条件,让沧海芯片迭代出更有针对性的场景解决方案。

 

例如,针对云游戏场景,沧海芯片的瑶池板卡,可以灵活配比不同厂商 GPU。针对视频转码场景,沧海芯片提供单机 1024 路的高密转码能力,将转码成本降至最低。

 

软硬件的联合调优,也为腾讯云媒体处理(MPS)带来了领先的产品优势。现在,腾讯云能提供音画质增强、云原生录制、实时特效渲染、智能编辑、内容分析理解等服务,为用户提供更低成本、更低延时、更极致压缩的处理效果。

 

在去年专业流媒体技术社区 SLC 发布的报告中,腾讯云 MPS 超越亚马逊 AWS、微软 Azure 等国际云厂商,摘得三大场景下性能全部最优。

 

芯片是硬件中最核心的部分。面向业务需求强烈的场景,腾讯有着长期的芯片研发规划和投入,结合算力场景,推动自研芯片规模落地。目前,腾讯已经实现芯片端到端设计、验证全覆盖。

 

除沧海芯片外,腾讯自研的 AI 推理芯片”紫霄“,采用自研存算架构和自研加速模块,可以提供高达 3 倍的计算加速性能和超过 45%的整体成本节省,目前也已在内部业务中投用;高性能网络芯片“玄灵”,助力云计算场景实现虚拟化零损耗。

 

基于底层软硬件技术的持续突破,腾讯正持续探索最优性能和最佳性价比,助力更多的企业和开发者云上创新。

 

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-04-21 18:195780

评论

发布
暂无评论
发现更多内容

BZZ节点挖矿系统搭建,BZZ矿机分币系统

Dubbo SPI

青年IT男

dubbo

ARTS- 日常打卡5

pjw

React Hooks - 如何安全地使用state

蛋先生DX

大前端 React React Hooks JavaScrip 6月日更

我对技术潮流的一点看法

Phoenix

基于 BDD 理论的 Nebula 集成测试框架重构(上篇)

NebulaGraph

Spring Boot FatJar类加载机制简要分析

luojiahu

Spring Boot 类加载 ClassLoader FatJar

🏆大势所趋,迈向认识WebRTC的第一步,加油!

洛神灬殇

WebRTC RTC RTC征文大赛 6月日更

面试系列-2 redis列表场景分析实践

李阿柯

php 面试 redis cluster

【Vue2.x 源码学习】第二篇 - Vue的初始化流程

Brave

源码 vue2 6月日更

“扯皮”终结者,区块链帮农民工计薪水

CECBC

Redis数据结构

邱学喆

数据库 redis 跳跃表

react源码解析4.源码目录结构和调试

全栈潇晨

React Hooks react源码

5分钟速读之Rust权威指南(十五)

wzx

rust

HarmonyOS 2正式发布 硬件生态品牌HarmonyOS Connect一同亮相

科技汇

致恰达耶夫,致鸿蒙

脑极体

持续测试 | 让测试更自由:在 CODING 中实践自动化执行用例

CODING DevOps

DevOps 自动化测试 持续测试

分治(详解残缺棋盘 —— Java代码实现)

若尘

算法 分治 java代码 6月日更

关于第四次财富狂潮的思考,区块链如猛虎出笼?

CECBC

VSPD9.0基础 建立一对互联的虚拟串口,进行串口通信的测试

万里无云万里天

IoT 6月日更 VSPD

【Flutter 专题】114 图解自定义 ACEProgressPainter 对比进度图

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 6月日更

OpenKruise v0.9.0 版本发布:新增 Pod 重启、删除防护等重磅功能

阿里巴巴云原生

容器 运维 云原生 k8s

情指勤一体化指挥调度平台搭建,情报研判分析系统搭建

Hello Python! 第一天学 Pyhton 语言

在即

6月日更

k8s 插件管理工具之krew使用

雪雷

6月日更

深圳首辆数字人民币主题观光巴士亮相

CECBC

你们公司的数据库出过问题么?

escray

学习 极客时间 朱赟的技术管理课 6月日更

微博评论的高性能高可用计算架构设计

唐高为

面试系列-3 限流场景实践

李阿柯

php lua redis 面试 限流算法

你真的了解 “开源” 么?请查收【保姆级】开源百科

程序员鱼皮

Java c++ Python GitHub 开源

手把手教你在IDEA中配置Maven

打工人!

Java maven 6月日更

腾讯披露自研芯片“沧海”最新进展_语言 & 开发_Tina_InfoQ精选文章