写点什么
创作场景
- 记录自己日常工作的实践、心得
- 发表对生活和职场的感悟
- 针对感兴趣的事件发表随笔或者杂谈
- 从 0 到 1 详细介绍你掌握的一门语言、一个技术,或者一个兴趣、爱好
- 或者,就直接把你的个人博客、公众号直接搬到这里
登录/注册
收录了 roce 频道下的 50 篇内容

本文介绍低开销高性能的RoCE网络的设计方法。
RDMA,其全称为Remote Direct Memory Access(远程内存直接访问),是新一代数据中心高速网络互联的基础协议之一。RDMA协议来自于高性能计算领域,它改进了传统的TCP/IP协议栈在高速网络下的诸多缺点,使得网络通信数据传输不再经过内核或CPU,取而代之的则是直接通过网卡读写内存来进行,从而在应用上能够充分利用万兆以上的网络带宽。

在大规模数据中心中部署 RoCEv2,首先面临的问题是如何保证 RDMA 的可靠传输。

为实现资源的高效利用和轻量隔离,很多流行的大型云应用都在逐渐使用容器化。同时,很多数据密集型应用(例如,数据分析和深度学习框架)正在或希望采用RDMA来提高网络性能。行业趋势表明,这两种场景不可避免地会发生冲突。在本文中,我们介绍了FreeFlow,一个为容器云设计的基于软件的RDMA虚拟化框架。FreeFlow纯粹使用基于软件的方法,利用商用RDMA NICs实现了虚拟RDMA网络。

本文主要探索GPU单机多卡和多机多卡两种场景下的通信技术,并对部分技术进行实测

从服务网格及网络性能优化分析、网络性能优化技术介绍、网络性能优化思路三个方面论述

数字时代的洪流中,我们习惯于将透明、开放与持续的公众互动视为科技巨头的标配。它们在社交媒体上制造话题,在宏大的发布会上定义潮流,用无处不在的算法编织我们日常生活的每一个细节。然而,在这片由流量和声量构筑的喧嚣之下,潜藏着一个截然不同的存在—


在每一个伟大企业的背后,都有一段关于远见与坚持的创世神话。Palantir的故事,始于2003年斯坦福大学一间朴素的会议室。

随着2025世界人工智能大会在上海成功举办,人工智能的热潮正方兴未艾,AI正成为推动传统制造业升级的核心引擎。
