写点什么

使用 OVS-DPDK 加速滴滴云网络

  • 2019 年 9 月 16 日
  • 本文字数:1764 字

    阅读完需:约 6 分钟

使用 OVS-DPDK 加速滴滴云网络

在基于现有 OVS-DPDK 开源软件基础上,滴滴云技术团队通过创新性的改进,实现了 ms 级别的热升级, 同时保持现有的高性能转发能力。

滴滴云初期采⽤学习 OpenStack 的思路,采用内核态的 OVS 实现了SDN OverLay 网络。这个实践过程中,我们也遇到了一些问题,可以归纳为以下几个⽅面:


  • 性能不高

  • ⽆法热升级

  • 开发难度⼤

  • 维护成本高


原型设计

针对这些问题,经过技术调研,也参考了国内外同⾏的已有解决方案,在过程中和 Intel 团队紧密合作,我们采用 OVS-DPDK 进⾏开发部署,并最终取得了不错的效果。如下是数据流模型:



数据层面的几个重要改造

1. 底层:⽹卡硬件相关

  • 基于 VF 的数据流改造


借助硬件将 OverLay 的流量与宿主机的其他⽹络流量进⾏分离。通过 flow classification 命令将前者导⼊到 VF 上,而后者仍然是通过 PF 口到内核进行处理,保持原有处理逻辑不变。OVS- DPDK 只接管 VF⽹口,⽽不触碰 PF 口上的非 SDN OverLay⽹络流量。这样既简化了OVS-DPDK 的处理逻辑,同时也避免了因 OVS-DPDK 本身的稳定性,而影响其他⾮SDN⽹络模块的稳定性。


2. 中间层:OVS 报⽂处理

  • 无状态的转发功能


⽬前,我们对计算节点⽹络层面的需求,可以分为两大类:VM 流量的转发和 VM 网络的安全监控。其中后者是内部开发的,暂时略过。


针对 VM 流量转发的这个需求,⼜拆解为两部分:


OverLay 外层头的处理,和内层报文的转发。借助 OVS-DPDK 的 flow 表实现这两部分功能。因为没有启⽤conntrack 功能,因此我们这部分的实现是⽆状态的。这个拆解,特别是无状态的特性,在热升级的时候取得了不错的效果。



  • OVS 单网桥


之前参考 OpenStack 的模型,我们使⽤了br-int,br-tunnel 两个网桥。在这个模型里,OVS⽹桥的使⽤方式跟传统的 Bridge 使⽤⽅式差别不大,没有充分发挥 OVS⽹桥的优势。


在我们的模型中,把两个网桥整合为一个网桥,将 vxlan⼝和 vhost-user 的⼝都放到⽤⼀个网桥上。VM 发出的报⽂经过 OVS 转发处理后,携带外层头信息进入 vxlan 驱动,经过 vxlan 网口的封装后,发送给 VF 网口。


根据我们的数据模型,进入 VF⼝的报⽂只可能是发往 VM 的 vxlan 类型的报文。这些报文,在被剥除 vxlan 头后,经过 vxlan⼝进⼊网桥,经过⽹桥转发到各个 VM 的 vport。


  • 降低与内核的耦合性


原有的 OVS 桥的路由和 ARP 表需要去内核查询,跟内核的耦合性很强。我们通过 SDN 控制器下发到 OVS-DPDK,来规避直接与内核的交互。这样⼀方⾯简化了Bridge 的配置(不用单独设置 IP 地址等),降低了内核的耦合性,另⼀方⾯也降低了热升级时候的复杂度。


3. 上层 vhost-user 与 VM 交互层

  • vhost-user 增强


我们使用的是 QEMU 作为 vhost-user 的 Server 端,OVS-DPDK 进程通过 unixsocket 连接到 QEMU。QEMU 默认仅支持一个这样的连接,改造 QEMU 后,使得 QEMU 支持两个主备倒换的连接,这样热升级的时候,可以通过控制 OVS-DPDK 端的开关,轻松的在新⽼两个进程间切换。


  • 内存模型采用 2M/4k。


尽量减少对现有 VM 的影响,为以后升级和迁移做准备。


方案优势


1. 升级时间短

业内⽬前的热升级方案基本都是秒级的,切换时间⽐较长。而在我们的框架下,每个 VM 的热升级时间大约 80ms 左右,极大的缩短了VM 的网络中断时间,基本做到⽤户无感知。


2. 可扩展性好

热升级过程中,VM⽹络中断时间跟 VM 规模无关。热升级的时候,我们逐个把 VM 的流量从⽼的 OVS-DPDK 进程里,切换到新的进程里。这种逐个切换的模式,使得单个 VM 的流量切换,不会影响其他的 VM 网络功能。即使上百个 VM,总的升级时间达到⼏秒甚至⼏十秒的情况下,单个 VM 的⽹络中断时间仍然是 80ms。


3. 故障恢复快

我们热升级的模型中采⽤的是两个独⽴的 OVS-DPDK 进程,因此提前启动一个新的 OVS-DPDK 进程作为后备进程,这个进程完成所有热升级相关的初始化,比如初始化 vf2。这样当原有 OVS-DPDK 进程 Crash 后,新的进程可以做快速的切换,实验室环境下,单 VM 测试可以做到跟热升级时间差不多。


附上测试数据

性能:单核性能 400wpps 左右


热升级:单 VM 网络中断时间 80ms 左右


DPDK version:17.11


OVS version:2.9.0


QEMU version:2.9


CPU:Intel® Xeon® CPU E5-2630 v4 @ 2.20GHz kernel:3.10.0-514.16.1.el7.x86_64


NIC:Ethernet Controller X710 for 10GbE SFP+ 1572


本文转载自公众号滴滴技术(ID:didi_tech)。


原文链接:


https://mp.weixin.qq.com/s/j-c1blhm_dNqc2wRw3TSSw


2019 年 9 月 16 日 10:02975

评论

发布
暂无评论
发现更多内容

Vue进阶(八十五):vue-router Hash模式跳转及懒加载

No Silver Bullet

Vue 路由 8月日更

良心!鹅厂强推的SpringCloud、Nginx高并发编程

Java~~~

Java nginx spring 架构 面试

卧 底 人 类 高 质 量 A I 公 司

白洞计划

在GitHub发布秒获百万访问!就凭这份Java程序性能优化实战笔记?

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

封笔之作!阿里P8手写的Java高手是怎样练成的原理方法与实践笔记

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

vivo全球商城时光机 - 大型促销活动保障利器

vivo互联网技术

电商平台 优惠券 亿级架构设计 促销系统

不愧是阿里内部“SpringCloudAlibaba学习笔记”这细节讲解,神了

Java 程序员 架构 微服务 计算机

Github上标星250k的阿里Java面试复盘手册,看完竟如此的无敌?

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

2021预备秋招:Java面试必看的1000道面试解析,助你通过大厂面试

Java 程序员 架构 面试 后端

阿里P8整理出SQL笔记:收获不止SOL优化抓住SQL的本质

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

五分钟搞定Docker安装ElasticSearch

咔咔

Docker 死磕Elasticsearch

接口管理进阶-环境变量的使用

CodeNongXiaoW

大前端 测试 后端 接口文档 接口管理

Python代码阅读(第22篇):从源字典映射出新字典

Felix

Python 编程 Code Programing 阅读代码

GitHub惊现!全网首份开源的深入理解JVMG1GC的算法与实现手册

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

阿里被转载上100W次的Java面试题教程!已助我拿下9家大厂offer

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

八家知名大厂联合手写的Java面试手册刚上线!竟就到达巅峰?

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

Github惊现神作,这份算法宝典让你横扫各大厂算法面试题

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

啥?阿里DBA团队总监把MySQL 性能调优 金字塔,写进了800页笔记?

Java~~~

Java MySQL 数据库 架构 面试

阿里内部流传的JDK源码剖析手册!GitHub已获上千万的访问量

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

【Google Cloud】「Contact Center AI」引领我们走向高度智能客服的时代

浩宇天尚

话题王者 8月日更 Contact Center AI Google Cloud

技术干货 | 应用性能提升 70%,探究 mPaaS 全链路压测的实现原理和实施路径

蚂蚁集团移动开发平台 mPaaS

压测 网关 移动开发 mPaaS

脱钩!打工人都觉得香的Java程序员306道面试秘笈,爆肝

Java~~~

Java spring 架构 面试 微服务

阿里五位大佬总结操作系统+程序员必知硬核知识离线版pdf火了

Java~~~

Java 架构 面试 操作系统 网络

牛皮了!华为世界顶级Linux大牛总结出了3788页进阶笔记

Java~~~

Java Linux 架构 面试 运维

千金难求!火遍GitHub的这份阿里Java面试汇总已上热搜

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

MySQL到ClickHouse的高速公路-MaterializeMySQL引擎

华为云数据库小助手

sql GaussDB dba 华为云数据库 DAS

宇宙级计算机大佬吐血整理出2224页计算机系统文档(离线版)

Java~~~

Java 架构 面试 TCP 操作系统

爆料!前华为微服务专家纯手打500页落地架构实战笔记,已开源

Java~~~

Java spring 架构 面试 微服务

2W字!详解20道Redis经典面试题!(珍藏版)

Java redis 架构 后端 计算机

IM技术分享:万人群聊消息投递方案的思考和实践

JackJiang

即时通讯 IM 群聊

使用 OVS-DPDK 加速滴滴云网络_文化 & 方法_张军伟_InfoQ精选文章