写点什么

腾讯披露自研芯片“沧海”最新进展

  • 2023-04-21
    北京
  • 本文字数:1753 字

    阅读完需:约 6 分钟

腾讯披露自研芯片“沧海”最新进展

腾讯自研芯片“沧海”已经广泛应用到实际环境,并斩获 8 项世界第一。

 

4 月 15 日,莫斯科国立大学举办的 MSU 硬件视频编码比赛成绩揭晓。经过数月的严格测试,腾讯自研的编解码芯片“沧海”包揽了所参加的两个赛道 8 项评分的全部第一。据了解,沧海芯片已在业务场景中投用数万片,服务腾讯自研业务及公有云客户。

 

MSU 是视频压缩领域最具影响力的顶级赛事,迄今已连续举办了十七届,吸引了包括亚马逊、英伟达、Intel、AMD、字节、快手、阿里和腾讯在内的国内外知名企业参与。

 

具体来看,SSIM (结构相似性)、PSNR(峰值信噪比)和 VMAF(视频多方法评估融合)等多项评价指标,沧海芯片大幅领先行业 GPU 等标品硬件。值得一提的是,在 120fps 的高帧率档位上,在同等画质下沧海较行业领先 ASIC 水平能再节省 10%码率。

 

作为全真互联时代的交互模式和关键技术,音视频背后的编解码能力至关重要。基于自研芯片与软件的联合调优,腾讯云的音视频编解码能力已达业界领先水平。

 




瞄准编解码领域核心难题

 

多媒体业务进入音视频直播时代,4K/8K 的超高清内容对云计算基础设施提出了难题。如何在降低成本的同时,最大化还原画质、实现低延迟,是全真互联时代面临的难题。业界已有的通用处理器,并非针对数据中心转码场景定制开发,部署中很难兼顾真实场景的全方位挑战。

 

2019 年初,腾讯蓬莱实验室、香农实验室联合启动编解码芯片”沧海“研发。对硬件编解码的算法、架构和工程进行深度攻关,向高画质、低延迟、低成本的“不可能三角”发起挑战。

 

基于自身在底层软硬件架构和音视频领域的多年积累,研发团队对每个模块的计算任务都作了并行拆解。通过分配不同的计算单元,从而叠加大量处理任务;为沧海芯片内置视频编码加速专用功能模块,让流水控制逻辑更纯粹,减少重复计算和分支判断,带来更低的功耗和成本。

 

沧海芯片的编码器设计中完整实现了高精度运动搜索、全率失真优化、高效自适应量化等所有主流编码工具,并融合腾讯云软件编码器码率控制等方面的领先技术,压缩率高于市面标品 35%以上。

 

在硬件架构上,通过将视频预分析计算单元进一步卸载到硬件中,沧海芯片大幅减少了高密度转码场景下任务对 CPU 性能的依赖,将转码性能提升到更强。通过灵活的多核扩展架构、高性能编码流水线、层级化 Memory 布局,沧海芯片能满足高吞吐、低时延和实时性要求。

 

根据 MSU 实测数据,从各项指标看,在同码率下,相较于业界 GPU 等标品硬件,沧海能大幅改善画面质量;在 120fps 的高帧率档位上,同等质量下,沧海比行业领先水平进一步节省 10%以上的码率;另外,沧海芯片的单帧 1080p 的编码耗时仅 4 毫秒,吞吐性能几乎不受到编码参数、视频类型的影响。

 

已在业务场景规模应用

 

去年 3 月,沧海芯片顺利“点亮”,目前已经量产并投用数万片,在云游戏、直点播等场景中,面向腾讯自研业务和公有云客户提供服务。

 

在直播平台中,观看人数小于 200 人的中长尾直播是主体,沧海芯片能帮助节省大量计算成本;在 4K/8K 超高清、高帧率场景中,相对软件编码,沧海芯片能实现低延时的高质量转码。

 

腾讯丰富的多媒体应用场景,提供了充分的分析和验证条件,让沧海芯片迭代出更有针对性的场景解决方案。

 

例如,针对云游戏场景,沧海芯片的瑶池板卡,可以灵活配比不同厂商 GPU。针对视频转码场景,沧海芯片提供单机 1024 路的高密转码能力,将转码成本降至最低。

 

软硬件的联合调优,也为腾讯云媒体处理(MPS)带来了领先的产品优势。现在,腾讯云能提供音画质增强、云原生录制、实时特效渲染、智能编辑、内容分析理解等服务,为用户提供更低成本、更低延时、更极致压缩的处理效果。

 

在去年专业流媒体技术社区 SLC 发布的报告中,腾讯云 MPS 超越亚马逊 AWS、微软 Azure 等国际云厂商,摘得三大场景下性能全部最优。

 

芯片是硬件中最核心的部分。面向业务需求强烈的场景,腾讯有着长期的芯片研发规划和投入,结合算力场景,推动自研芯片规模落地。目前,腾讯已经实现芯片端到端设计、验证全覆盖。

 

除沧海芯片外,腾讯自研的 AI 推理芯片”紫霄“,采用自研存算架构和自研加速模块,可以提供高达 3 倍的计算加速性能和超过 45%的整体成本节省,目前也已在内部业务中投用;高性能网络芯片“玄灵”,助力云计算场景实现虚拟化零损耗。

 

基于底层软硬件技术的持续突破,腾讯正持续探索最优性能和最佳性价比,助力更多的企业和开发者云上创新。

 

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2023-04-21 18:195745

评论

发布
暂无评论
发现更多内容

第八周课后练习

jizhi7

第八周-总结

jizhi7

记一次神奇的MySQL死锁

废材姑娘

spring MySQ

访问者模式及其在Java Parser中的应用

maijun

第五周作业第1题

走走,停停……

Python最会变魔术的魔术方法,我觉得是它!

Python猫

mongodb 源码实现系列 - mongodb详细表级操作及详细时延统计实现原理(快速定位表级时延抖动)

杨亚洲(专注MongoDB及高性能中间件)

数据库 mongodb 性能调优 源码刨析 分布式数据库mongodb

Spring Boot 过滤器

噜噜猫

Spring Boot

还在手写Operator?是时候使用Kubebuilder了

Java架构师迁哥

排查指南 | 关于 mPaaS-iOS 小程序打不开问题的解决方案

蚂蚁集团移动开发平台 mPaaS

小程序 mPaaS

shell脚本的使用该熟练起来了,你说呢?(篇四)

良知犹存

shell脚本编写

你心目中高级程序员的印象是什么样子的?

Java架构师迁哥

金融科技 | 建设中台能力,助力开放生态

xcbeyond

金融科技 中台战略 中台架构

API研发效能提升实战

Geek_40a463

研发效能 API研发

阿里P8大佬带你全面了解—MySQL锁:03.InnoDB行锁

比伯

Java MySQL 编程 架构 程序人生

Python进阶——什么是描述符?

Kaito

Python

架构探索:事务处理二

而立斋

Java并发编程:任务执行器Executor接口

码农架构

Java并发

架构探索:事务处理三

而立斋

学习笔记4

Qx

ISP芯片:如何让数字之眼“看清”真实世界?

脑极体

甲方日常 67

句子

工作 随笔杂谈 日常

跨越“数字鸿沟”,日本老年智能化服务的解法

脑极体

双十二好物推荐:「mPaaS 安全加固」带你看看别人家的应用

蚂蚁集团移动开发平台 mPaaS

安全 mPaaS 应用

架构之书:传道与《设计模式》

lidaobing

架构 设计模式

无可限量的数字经济

CECBC

数字经济

年轻程序员不讲武德,做表竟然拖拉拽

雯雯写代码

程序员

区块链技术在旅游业中的应用探索

CECBC

旅游

以太公约系统开发详情丨以太公约源码案例

系统开发咨询1357O98O718

以太公约系统开发介绍

GaussDB(DWS)磁盘维护:vacuum full执行慢怎么办?

华为云开发者联盟

数据库 数据 DWS

架构探索:事务处理总结

而立斋

腾讯披露自研芯片“沧海”最新进展_语言 & 开发_Tina_InfoQ精选文章