写点什么

基于 Kata Containers 与 iSulad 的云容器实践解析

  • 2019-04-16
  • 本文字数:2371 字

    阅读完需:约 8 分钟

基于Kata Containers与iSulad的云容器实践解析

在 4 月 9 号结束的 OpenStack 基金会董事会议上,董事们投票批准了 Kata Containers 成为基金会旗下第一个新的顶级开放基础设施(Open Infrastructure)项目,这是该项目的一个重要里程碑。


作为 Kata Containers 的初创成员之一,华为拥有 Kata Containers 架构委员会五席位之一和三位 maintainer,贡献了支持 CNI 网络接口、Host Cgroups 等特性,参与核心代码重构,并已提交上百个 patch,代码贡献量超过 3 万行,全球排名稳定保持在前四。


2017 年,华为 EulerOS iSula 技术团队成功将 Kata Containers 集成到 iSula 容器平台,并于 18 年初应用于华为云容器服务,推出基于 iSulad 容器引擎 + Kata Containers 的商用容器服务——华为云容器实例 CCI(Cloud Container Instance),也是业界首个 Serverless 架构的云容器服务,正是得益于 Kata Containers,使之前一直困扰用户的容器安全问题迎刃而解。


本文将重点介绍基于 iSulad 容器引擎和 Kata Containers 如何打造安全、高性能的云容器实例服务。


首先了解华为 iSula 容器平台,这是华为自研的容器平台,支持双容器引擎和五种不同的容器模式。



双引擎为:


  • docker 引擎:目前流行的 docker 容器引擎,在 Linux 上基于 namespace 及 cgroups 实现应用之间的隔离,使用 Go 语言编写而成。

  • iSulad 容器引擎:使用 C 语言编写而成的华为纯自研容器引擎,相比 docker 引擎突出的优点是性能高,资源占用小,在边缘计算等资源受控场景下有着非常耀眼的表现。


五种容器形态为:


  • 应用容器:即大家熟知的 docker containers。

  • 系统容器:在容器大浪潮中,各种不同类型的业务纷纷进行容器化,期望利用容器“build, ship and run”的能力最大化生产效率。相比微服务应用,传统的基于 systemd 的重型业务更加难以容器化,系统容器应运而生。系统容器内置 systemd 作为 init 进程,可帮助传统业务更轻松完成容器化改造和使用。

  • 轻量化容器:基于 LXC 打造的轻量化容器占用内存资源极少,主要用于 CT 或边缘计算等资源受控场景。

  • 高性能低时延容器:使用 unikernel 技术将应用与定制化内核打包,一方面可以大大减小攻击面增强安全性,同时大幅度提高了应用的运行性能。高性能低延时容器可以为定制化场景提供最佳方案。

  • Kata 容器:融合传统虚拟化技术与容器技术创造的高安全性容器,一方面兼容了繁荣的容器生态,一方面解决了传统容器隔离性不足的安全隐患,这也是华为云容器实例这种 Serverless 架构下,用户最为关心的问题。


iSula 在集成 Kata Container 优秀特性的同时,还会针对业务场景进行定制化改造。性能问题一直是大多数开源项目被诟病的地方,尤其是在超大型商业应用环境下尤为明显。Kata Containers 也不例外,虽然 Kata 社区提供的技术方案已经可以很好地兼容 docker、containerd 及 crio 等容器运行时,但出于性能等方面的考虑,iSula 并未直接使用社区方案,而是采用了性能更高的自研发方案。使用 iSula 自研方案,可以极大缩短软件栈的深度,减少 RPC 调用开销,更好配合华为云自有高性能网络及存储资源,使得华为云容器服务能为用户提供更高性能的网络及存储方案。


以网络为例,社区开源网络方案如下所示:



Calico、Canal 等开源网络软件会将创建的 veth 网口插入容器的 namespace 中,在 Kata 的场景下,容器的 Network Namespace 中还有一层虚拟化层,需要使用 Linux tap 设备而无法直接使用 veth 网卡。因而,Kata 提供了几种网络模型用于兼容容器生态中的多种网络方案,包括:


  • Bridge 模式:使用 Linux bridge 将 veth 与 VM 的 tap 设备桥接起来。

  • Macvtap 模式:创建母设备为 veth 的 macvtap 供 VM 使用。

  • TC 模式:使用 Linux TC 在 veth 和 tap 设备之间做流量的双向转发。


Kata 默认的几种网络模型可以保证开源容器 CNI 网络方案无需修改开箱即用,这种方式足够智能,但灵活性稍显不足,因而华为向社区贡献了一种新的模式:


  • None 模式:Kata 不做任何猜测,不智能创建网卡,网络需要用户使用新增的 kata-network 命令手动创建。


使用 none 模式给予了用户最大选择权和灵活性,但需要用户自行改造 CNI 网络插件,相比其他模式有一定使用门槛。好处在于由 CNI 插件可以直接为容器增删网卡/路由,绕过了 veth 网卡,缩短了网络拓扑路径长度,为网络性能的提升提供了更大空间。


None 模式配合华为自研的容器网络方案,可以保证为容器应用提供最佳网络性能。


了解过 iSula,再来看看华为云容器实例(CCI)服务,CCI 是基于 Serverless 架构的 Kubernetes 容器服务。



真正的 Serverless 容器服务中,集群管理由云服务提供商承担,客户只需要关注每个应用的容器实例即可。在这种情况下,云服务提供商需要考虑如何在统一管理面下保证每个用户的安全。


CCI 服务所属的 Kubernetes 集群直接部署在裸金属服务器之上,底层是 Kata Containers,中间靠 iSula 容器平台连接。依靠 Kata Containers 的强隔离特性,多个租户之间的容器运行环境强隔离,不同租户之间的容器不感知、不可见,可以在同一台裸金属服务器上混合部署而安全无虞,若使用 docker 容器通常认为是存在安全风险的。


同时,CCI 这种将 Kubernetes 直接部署在裸金属服务器上的混合多租模式,配合 Kata Containers 技术可以最大化资源利用率,降低性能开销,使得用户的内存开销小于 64MB,容器实例启动时间小于 600ms,从而可以为用户提供高性能低价位的容器服务。借助 iSula 优化过的网络和存储能力,CCI 可以在网络和存储基础资源之上,提供更优性能。


除此以外,基于 iSula 提供的 GPU 直通功能,CCI 通过该技术提供的 GPU 容器,用户可直接在容器中使用 nvidia 的各型号 GPU 进行 AI 计算,使得 CCI 也成为市面上第一个提供 GPU 算力的 Serverless Kubernetes 容器服务,并且做到 32 块 GPU 线性加速比超过 0.95,128 块 GPU 线性加速比超过 0.8,在图像识别、自然语言处理、语音识别等领域被广泛使用。


2019-04-16 14:0611787

评论

发布
暂无评论
发现更多内容

找 ChatGPT 写 SQL? 不如试试 PromQL,三行解决复杂时序场景查询

Greptime 格睿科技

sql 云原生 时序数据库 PromQL 可观测

Elasticsearch 利用 Enrich Processor 实现 MYSQL Join 的操作,支持 Nested 类型,具体应用。

alexgaoyh

MySQL elasticsearch ES 多表join enrich processor

【SpringBoot】简述springboot项目启动数据加载内存中的三种方法

No8g攻城狮

springboot spring-boot

代码分享 | 情人节表白黑科技

鼎道智联

代码 情人节 爱心代码

《自定义工作流配置,springboot集成activiti,前端vue,完整版审批单据》

金陵老街

自动驾驶过冬,需要点燃“降本增效”的炉火

脑极体

自动驾驶

为什么选择免费文件共享方法上的托管文件传输

镭速

腾讯架构师极力推荐:Java多线程与Socket实战微服务框架

小小怪下士

Java 程序员 socket 多线程

关于 OAuth 你又了解哪些?

API7.ai 技术团队

api 网关 Oauth APISIX

参加大数据培训有什么好处

小谷哥

热点面试题:协商缓存和强缓存的理解及区别?

沉浸式趣谈

JavaScript https 面试题 HTTP 前端面试题

文本数据标注已上线,支持文本分类、实体识别|ModelWhale 版本更新

ModelWhale

人工智能 机器学习 云计算 数据分析 编程建模

初学者前端培训机构需要注意什么

小谷哥

软件测试/测试开发 | Web测试方法与技术之JavaScript 讲解

测试人

软件测试 自动化测试 测试开发 Web自动化测试 web测试

广告商、影视剧和晚会用的流行歌曲,版权都是怎么买的?

曲多多(嗨翻屋)版权音乐

音乐 三体 版权 影视 热点

打造IM生态,WorkPlus个性定制让企业业务管理再升级

BeeWorks

为什么工厂要投资设备智能维护管理技术?

PreMaint

设备管理 设备预测性维护

大数据培训的方法有哪些

小谷哥

您有一个MatrixOne Beta Program专属权益待领取

MatrixOrigin

MatrixOrigin MatrixOne betaprogram MO企划

java培训与线上自学哪个比较好?

小谷哥

高性能网络SIG月度动态:SMC 与 IBM 就扩展协议达成一致,virtio 支持 XDP 新特性

OpenAnolis小助手

开源 高性能网络 virtio 龙蜥sig smc

基于Prometheus和Grafana实现对SpringBoot 应用的监控

皮特王

监控 Grafana Prometheus 大屏展示 告警平台

设计模式-组合模式和建筑者模式详解

C++后台开发

数据结构 设计模式 组合模式 后端开发 Linux服务器开发

私有化即时通讯软件可以保证员工的通讯安全吗?

BeeWorks

RESTful API 为何成为顶流 API 架构风格?

API7.ai 技术团队

API APISIX REST API

线下学习前端培训机构怎么选?

小谷哥

架构训练营模块五作业

gigifrog

架构训练营

携手共进丨九科信息入围PKS体系生态企业展播

九科Ninetech

如何通过极狐GitLab 平滑落地 Java 增量代码规范?

极狐GitLab

Java DevOps 代码规范 极狐GitLab checkstyle

基于Kata Containers与iSulad的云容器实践解析_容器_华为云原生团队_InfoQ精选文章