写点什么

“这是我迄今见过的最大提速”:FFmpeg 开发者因手写汇编再提速 100 倍而自豪

  • 2025-08-20
    北京
  • 本文字数:1210 字

    阅读完需:约 4 分钟

“这是我迄今见过的最大提速”:FFmpeg 开发者因手写汇编再提速 100 倍而自豪

FFmpeg 项目背后的开发者们再次声称,通过运用手写汇编代码的艺术,性能得到了重大提升。在应用了 最新 的补丁后,用户应该能在跨平台开源媒体转码应用程序中看到“100 倍的速度提升”。



“这是迄今为止我见过的最大提速”


去年 11 月,我们报道了 FFmpeg 性能提升的消息,该提升可以使某些操作速度提高多达 94 倍。最新的手写汇编补丁将应用程序的“rangedetect8_avx512”性能提高了 100 倍。如果你的现代处理器不支持 AVX512,那么使用 rangedetect8_avx2 代码路径仍然可以看到 64% 的提升。


你将在哪里感受到这些速度提升?在一些后续的推文中,FFmpeg 开发者承认“这是一个单一的功能,现在快了 100 倍,而不是整个 FFmpeg。”他们后来进一步解释说,根据你的系统,可能享受到 100% 速度提升的功能是“一个不常用的过滤器”。


这个功能的不常用意味着它直到现在才被开发者优先考虑。但我们也知道,过滤器代码是使用 SIMD(单指令,多数据)处理概念进行重新编码的,以极大地改善当今强大芯片上的并行处理。


显然,编译器——将高级语言代码转换成汇编(机器)代码的程序——仍然无法与手写汇编程序竞争。或者你可以说,“编译器的寄存器分配器很糟糕”,正如 FFmpeg 今天在推特上所说的那样。



(图片来源:FFmpeg)


汇编语言的福音传道者


回顾 20 世纪 80 年代和 90 年代家庭计算的黄金时代,当时固定规格系统的生命周期为 5 年——并且严格限制了处理资源——手写汇编代码优化在加速计算机、游戏和其他软件的业务中扮演了更重要的角色。


FFmpeg 或许是为数不多的“汇编福音传道者”之一。开发团队甚至还经营着一 所“学校”。


FFmpeg 工具和库可以在 Linux、Mac OS X、Microsoft  Windows、BSDs、Solaris 等系统上运行。最受欢迎的视频播放器软件之一,VLC,使用了 FFmpeg 项目中的 libavcodec 和 libavformat 库。


原文链接:


https://www.tomshardware.com/software/the-biggest-speedup-ive-seen-so-far-ffmpeg-devs-boast-of-another-100x-leap-thanks-to-handwritten-assembly-code


声明:本文为 InfoQ 翻译整理,不代表平台观点,未经许可禁止转载。


今日好文推荐


180 天狠赚 5.7 亿,8 人团队全员财富自由,最大功臣是 Claude 和 Gemini


颠覆 Cursor,AI 编程不再需要 IDE!用并行智能体重构开发范式,MongoDB CEO 高调站台


弃 Python 拥抱 JVM,Spring 之父 20 年后再造“革命性框架”:我从未如此确信一个新项目的必要性


从 3 个月业余项目到全球第一语言!Python 之父坦言:当年“将就”的代码,如今全都真香了


会议推荐


首届 AICon 全球人工智能开发与应用大会(深圳站)将于 8 月 22-23 日正式举行!本次大会以 “探索 AI 应用边界” 为主题,聚焦 Agent、多模态、AI 产品设计等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自头部企业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!



2025-08-20 17:2211852

评论 1 条评论

发布
用户头像
100倍和100%是不同的数量级吧,100%只是一倍而已。
2025-08-22 09:18 · 北京
回复
没有更多了

浅谈国产数据库多租户方案:提升云计算与SaaS的资源管理效率

猫头虎

数据库

OpenManus:开源版 Manus,无需邀请码,5 分钟极速体验!

阿里巴巴云原生

阿里云 云原生

Metasploit Pro 4.22.7-2025042101 发布 - 专业渗透测试框架

sysin

Metasploit

金仓数据库同城双中心灾备方案

金仓技术

KingBase 金仓数据库

12种API认证全场景解析:从Basic到OAuth2.0,哪个认证最适合你的业务?

数据追梦人

Full GC 频率优化实战

vivo互联网技术

Java 后端 垃圾回收 系统优化

征程 6 VIO Frame buffer管理

地平线开发者

自动驾驶; 算法工具链 地平线征程6

NetScaler 13.1 Build 58.21 发布 - 混合多云应用交付控制器

sysin

NetScaler

捷途纵横G700品鉴会:潮改共创,解锁豪华越野的无限可能

科技热闻

CST表面等离子极化激元SPP --- 光脊波导与缝隙波导的转换

思茂信息

cst CST软件 CST Studio Suite

十几行代码实现 Manus,Spring AI Alibaba Graph 快速预览

阿里巴巴云原生

阿里云 云原生

HCLSoftware推出解决方案

财见

什么是安全密钥,它是如何工作的

运维有小邓

单点登录 多因素身份验证 安全密钥

深入研究:Shopee商品详情API接口详解

tbapi

Shopee shopee API shopee商品详情接口

AI与智能能源管理:如何通过AI优化能源分配和消耗?

天津汇柏科技有限公司

人工智能 AI

基于DeepSeek的故障定位大揭秘

乒乓狂魔

故障定位 AIOPS 可观测

高防IP是如何防护DDoS攻击和CC攻击的

网络安全服务

IP 带宽 高防服务器 高防IP DDoS 攻击

动态更新技术重构中国互联网:前端热更新的效率革命与生态演进

xuyinyin

月薪3K测试 vs 30K测开:差距在这3个技能​

测试人

软件测试

立马耀:通过阿里云 Serverless Spark 和 Milvus 构建高效向量检索系统,驱动个性化推荐业务

阿里云大数据AI技术

大数据 spark 阿里云 Serverless EMR

Apipost免费版、企业版和私有化部署详解

数据追梦人

加密叙事危机:当「传说」构建让位于营销狂欢

TechubNews

Markdown 所见即所得(WYSIWYG)编辑器的研究

yuanyxh

前端 Typora Markdown 编辑器

什么是商业分析报告,怎么制作?AI智能体使用攻略盘点!

职场工具箱

人工智能 项目分析报告 AIGC AI智能体 AI 智能体

《Operating System Concepts》阅读笔记:p777-p777

codists

操作系统

大模型向量数据库去重的N种实现方案!

王磊

MES系统数据采集功能:自动化设备数据采集

万界星空科技

数据采集 mes 设备 设备管理 设备数据采集

政企产品经理AI工作流分享:需求->产品的敏捷实现(深度长文)

Ben的AI实验室

AI 产品经理 工作流 GPT DeepSeek

Amazon Q 从入门到精通 – 集成企业代码库

亚马逊云科技 (Amazon Web Services)

蚂蚁数科开源虚拟机DTVM 开启区块链AI开发时代

科技热闻

BOE(京东方)发布行业首个可持续发展品牌“ONE”:以开放创新科技之力守护人类未来

科技热闻

“这是我迄今见过的最大提速”:FFmpeg 开发者因手写汇编再提速 100 倍而自豪_编程语言_Mark Tyson_InfoQ精选文章