2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

微服务架构中使用的分布式调度器

  • 2017-08-22
  • 本文字数:1189 字

    阅读完需:约 4 分钟

在 MicroXchg 2017 柏林大会上,DigitalOcean 的微服务可扩展性专家 Martin Campbell 针对如何使用分布式调度器运行基于微服务的架构做了一个演讲。在演讲中,Campbell 着重介绍了在他们在部署过程中遇上的一些问题,以及在他们是如何权衡选用 Kubernetes、Nomad 和 Mesos 等产品的。

演讲的关键要点包括:

  • 分布式调度器使得用户可将集群理解为单一的物理机。
  • 分布式调度器简化了 DevOps,大大降低了普遍存在于基于微服务架构中的操作复杂性。
  • 没有任何现有产品可以完美地运行有状态服务,因此最好不要使用现有产品去运行这类服务。
  • 在网络分区的情况下,即便有些过程所在的主机节点不能与主服务器通信,容错的分布式调度器也应该保持所有进程的运行。

Campbell 首先指出,操作系统内核就是一种集中式调度器,因为它在单一计算机上实现了对多个进程的管理。他进而阐述了分布式调度在概念上与集中式调度器是类似的,差别在于它是跨集群中各机器工作的,而非工作于单一机器上。“我们可以与整个数据中心通信,就像是面对单台物理机一样。”

分布式调度器尤其适用于微服务架构。Cambell 认为这是考虑到那些额外的操作开销,这些操作开销是由不断得以扩展和部署的多个服务所导致的。

对于如何选择多种分布式调度器的问题,Campbell 首先介绍了他在 Mesos 上的实战经验。当使用 Mesos 时,用户不需操心进程所在的实际物理机,因为 Mesos 是基于对 CPU 和 RAM 等资源的限额处理做部署的。Mesos 还提供了一个仪表盘,可像查看单一物理机那样方便地实现数据中心的可视化。

Campbell 指出,Mesos 的主要问题在于它对网络分区的处理方式。如果一个进程不能与 Mesos 的主服务器通信,那么该进程就会被杀掉。在 Campbell 看来,这并非是一种好的设计方式,事实上,因为网络分区普遍存在于分布式系统中,在这种情况下应该继续保持应用的运行。他以 Kafka 为例说明了这种行为会导致数据的丢失。虽然 Kafka 是一种分布式消息总线,在设计上考虑了弹性问题,但是分区还是可以导致丢失几乎全部的单一节点及数据。

Campbell 最终弃用了 Mesos,他先是转向 Nomad 作为替代。Nomad 的优点在于,它具有自身的 Gossip 协议,允许服务器在同一数据中心中及跨数据中心间的相互通信。在网络分区的情况下,同一分区中的服务会保持功能及通信,并在分区识别时成为最终一致的。但是由于 Campbell 并不了解有任何在生产环境中运行 Nomad 的应用,因而不想冒险迁移到 Nomad 上。

他最终选定了 Kubernetes。尽管 Kubernetes 类似于 Mesos,Campbell 还是从中发现一些独到之处。最主要是,Kubernetes 对网络分区处理机制不同,并不会在上述情况下杀死实例。它也提供了仪表盘,让用户易于了解集群的状态,减少了处理应用中的抽象层级。

该演讲的视频可以在线完整观看,其中详细地介绍了Campbell 正在处理的应用架构及各种调度器。

查看英文原文: Distributed Schedulers with Microservice Architectures

2017-08-22 19:002992
用户头像

发布了 227 篇内容, 共 80.6 次阅读, 收获喜欢 28 次。

关注

评论

发布
暂无评论
发现更多内容

OpenTiny2024年终总结~

OpenTiny社区

开源 前端 低代码 组件库 OpenTiny

Docker Compose 实战:如何使用 Docker Compose 进行多容器应用编排

测吧(北京)科技有限公司

测试

【YashanDB知识库】审计表UNIFIED_AUDIT_TRAIL出现YAS-00220 utf8 sequence is wrong

YashanDB

数据库 yashandb

Nacos 3.0 Alpha 发布,在安全、泛用、云原生更进一步

阿里巴巴云原生

阿里云 云原生 nacos

DeepSeek 最新推理模型 R1-Lite:一场数学题的死胡同之旅

测吧(北京)科技有限公司

测试

CAD图层管理器是干什么的?怎么使用?

在路上

cad CAD看图软件 CAD看图王

从模拟数据到场景复现,剖析 MySQL Online DDL 异常报错之谜

袋鼠云数栈

重启“APP工厂”,张一鸣要做AI时代的爱迪生?

Alter

唯品会API接口深度解析:商品详情与关键词搜索商品的使用方法及代码示例

代码忍者

唯品会商品API接口

和鲸科技入选数健委数字健康新质生产力服务平台首批企业,推动医疗数智化发展

ModelWhale

人工智能 大数据 医疗

暴跌的「优必选」,持续融资、高估值的人形机器人创企

机器人头条

科技 人形机器人 优必选 具身智能

黄仁勋:通用机器人的ChatGPT时刻即将到来!马斯克:YES!!

机器人头条

英伟达 科技 ces 人形机器人 具身智能

数百名研发人员使用通义灵码,33% 新增代码由 AI 生成,信也科技研发模式焕新升级

阿里云云效

阿里云 云原生 通义灵码

使用火语言RPA批量创建指纹浏览器,并给每个指纹浏览器设置不同的代理IP

火语言RPA

【YashanDB知识库】YCM托管YashanDB报错 /home/yashan/.yasboot/.env is not existed

YashanDB

数据库 yashandb

探索模型驱动测试框架:GraphWalker 的自动化测试用例生成

测吧(北京)科技有限公司

测试

DeepSeek-V3模型对软件测试行业的影响

测试人

软件测试

致全体用户:2024 年,TapData 的五周年,我们在海内外市场埋下了两颗新的种子

tapdata

实时数据 金融数字化 物化视图 TapView

【YashanDB知识库】kettle做增量同步,出现报错:Unrecognized VM option 'MaxPermSize-256m'

YashanDB

数据库 yashandb

数百名研发人员使用通义灵码,33% 新增代码由 AI 生成,信也科技研发模式焕新升级

阿里巴巴云原生

阿里云 云原生

【YashanDB知识库】YashanDB run.log中有slow log queue is full信息

YashanDB

数据库 yashandb

【YashanDB知识库】YCM上告警项怎么修改

YashanDB

数据库 yashandb

如何在SpringBoot/MySQL事务中并行执行多条SQL?

秃头小帅oi

模型驱动测试 (MBT):从概念到实践的全面解析

测吧(北京)科技有限公司

测试

微服务架构中使用的分布式调度器_DevOps & 平台工程_Andrew Morgan_InfoQ精选文章