写点什么

WDT:多 TCP 链路的数据传输开源库

  • 2015-07-27
  • 本文字数:998 字

    阅读完需:约 3 分钟

作为国际著名的社交网站, Facebook 与开源项目一直关系密切。目前,其设立的开源项目个数已经超过200 个。这些开源项目在为广大开发人员提供便利的同时,也为Facebook 带来了各方面丰厚的回报。近日,Facebook 又公布了一个开源项目——超高速数据传输工具(Warp speed Data Transfer,WDT)。接下来,本文就对WDT 项目进行简要介绍。

从2004 年上线开始,Facebook 迅速发展。时至今日,Facebook 每月的活跃用户量超过20 亿。在西方的万圣节,Facebook 每天所接收到的照片数量更是多达20 几亿张。为了满足用户的巨大需求,该公司先后在美国俄勒冈州和北卡罗来纳州等多个地方建立了数据中心。那么,如何在数据中心内部的主机之间以及数据中心之间进行高效的数据传输就成了迫切需要解决的问题。为此,Facebook 设立了WDT 项目。

WDT 可以被视为一个嵌入式的库或者命令行工具,其目的是在尽量减少资源(CPU/ 内存等)消耗的情况下,利用多个 TCP 路径提高两个系统之间传送文件的效率。为了提高代码的可移植性,Facebook 尽量减少了 WDT 的依赖关系。由此,代码的编译时间也大量减少,并使得项目轻量化。此外,WDT 没有采用异常,以保证传输效率和代码的易于集成。

在传输机制方面,WDT 采用了阻塞式线程 IO,保证在任何点都会有线程在读和写。这样,数据就可以被缓冲在双向传输道路上,使得最小内核 / 用户空间切换的情况下,每个子系统仍然处于忙碌状态。正是这样的双向传输机制进一步保证了系统吞吐率的最大化。

目前,WDT 代码已经托管在 GitHub 中。其代码中包含了一个小的命令行工具 wcp.sh,用来测试传输性能。据透露,在Facebook 内部传输系统之间的RocksDB 快照时,WDT 通过长距离和高延迟的传输链路提供了高达600MB/s 的传输速率。相比于之前高度优化的基于HTTP 的传输方案,WDT 传输速率约是其3 倍左右,且系统资源消耗更少。在没有进行节流控制的情况下,WDT 可以轻易使得40Gb/s 的网卡饱和,并得到近乎理论的链路传输速度(大于4GB/s)。

未来,Facebook 会借助开源社区继续对WDT 项目进行改进。其关注点包括重新构建代码来使用无需复制的流/ 缓存流水线和处理乱序的报文等。


感谢徐川对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群InfoQ 好读者)。

2015-07-27 08:4510431
用户头像

发布了 268 篇内容, 共 136.4 次阅读, 收获喜欢 24 次。

关注

评论

发布
暂无评论
发现更多内容

客户案例 | 通过流程智能帮助国际餐饮巨头企业快速开万店

望繁信科技

数字化转型 智慧餐饮 流程挖掘 流程智能 望繁信科技

"数据集成国产化:谷云科技的零代码ETL平台与行业创新"

谷云科技RestCloud

ETL 数据集成 ETLCloud

代购系统:跨境电子商务的创新解决方案

Noah

NFTScan 正式上线 Sei NFTScan 浏览器和 NFT API 数据服务

NFT Research

NFT NFT\ NFTScan

数字化供应链平台:优化运营、驱动创新的未来之路

天津汇柏科技有限公司

数字化转型 供应链

软件测试学习笔记丨Python 基本数据类型

测试人

软件测试

通过搭建 24 点小游戏应用实战,带你了解 AppBuilder 的技术原理

Baidu AICLOUD

大模型 AI 原生云 AI原生应用 AppBuilder

AIGC系统中聊天小助手卡片小组件嵌套设计实践

京东科技开发者

和鲸101加持,高效SAAS服务赋能暨大经管交叉学科数据人才培养

ModelWhale

人工智能 大数据 经管 暨南大学

电商商品数据采集的智能化:淘宝/天猫商品详情API接口的AI应用

技术冰糖葫芦

API Explorer API 接口 API 策略 pinduoduo API

深度剖析集团型企业在新质生产力和数字化转型过程中面临的身份管理问题(四)

芯盾时代

iam 统一身份认证 身份和访问管理 统一身份管理平台

还能报名!风靡硅谷开发者的Unstructured Data Meetup杭州站与您6月15日见面!

Zilliz

从游戏场景看,ByteHouse存算分离架构如何实现降本增效

字节跳动数据平台

数据库 大数据 云原生 Clickhouse 数仓

和鲸101领航北中医:助力健康医疗AI实验室建设,培养交叉数据人才

ModelWhale

人工智能 北中医 健康医学

一文带你搞清楚Python的多线程和多进程

华为云开发者联盟

Python 华为云 华为云开发者联盟 企业号2024年6月PK榜

突破瓶颈:如何优化 LLMs 的落地成本和延迟

Baihai IDP

程序员 AI LLMs 企业号 6 月 PK 榜 Agents

为什么我的项目Debug运行没问题,编译成Release包就报错?

京东科技开发者

构建电商竞品分析工具:以京东商品数据为例

tbapi

京东 竞品分析 京东商品列表数据接口 京东数据接口

MySQL 示例数据库大全

Simon

MySQL

从源码分析 vllm + Ray 的分布式推理流程

阿里技术

Databend 开源周报第 148 期

Databend

国内首家!悦数图数据库全项完成中国信通院图数据库性能测试

悦数图数据库

数据库 信创 图数据库 知识图谱 悦数图数据库

WDT:多TCP链路的数据传输开源库_Meta_张天雷_InfoQ精选文章