架构周报| 如何将运维的报警做成运营的报警

阅读数:1214 2017 年 3 月 8 日

话题:语言 & 开发架构运维

经典案例

  • 京东从 OpenStack 切换到 Kubernetes 的经验之谈:2016 年底,京东新一代容器引擎平台 JDOS2.0 上线,京东从 OpenStack 切换到 Kubernetes。到目前为止,JDOS2.0 集群 2w+Pod 稳定运行,业务按 IDC 分布分批迁移到新平台,目前已迁移 20%,计划 Q2 全部切换到 Kubernetes 上,业务研发人员逐渐适应从基于自动部署上线切换到以镜像为中心的上线方式。JDOS2.0 统一提供京东业务,大数据实时离线,机器学习(GPU)计算集群。从 OpenStack 切换到 Kubernetes,这中间又有哪些经验值得借鉴呢?
  • 如何将运维的报警做成运营的报警:做运维的同学都知道,运维一定离不开 Zabbix、Nagios 之类的监控软件。目前,类似的软件在监控和数据采集方面已经做到了极致,但是在报警处理上并没有很完美的解决方案,比方说,经常出现高质量报警湮没在海量报警之中等情况。本文不探讨监控系统的配置优化,只探讨监控系统按照它的逻辑发出报警之后我们该做点什么。

前沿趋势

  • 将微服务浓缩为函数:Adrian Cockcroft 在 microXchg 大会上讨论了无服务器架构:在柏林举行的 microXchg 微服务大会上,Adrian Cockcroft 做了题为“将微服务浓缩为函数”的演讲。演讲的关键要点包括:网络速度的提升、二进制协议的使用、配置管理和容器技术等使得部署包含多种微服务的应用程序成为可能;由无服务器架构技术带来的机会为在数据中心运行快速开发的函数即服务带来了更多的可能。
  • 一个创业公司的 API 网关落地实践:HelloFresh 是一家食品电商初创公司,用户根据选定的菜谱下单,HelloFresh 把菜谱所需要的食材送至用户家中。来自 HelloFresh 的技术负责人Ítalo Lelis 在博客上分享了 HelloFresh 的 API 网关落地实践,本文为该博文的译文,并已获得原网站的翻译授权。在这篇文章里,作者和大家分享我们的基础设施所经历的一次重大迁移,这次迁移保证了以后的路我们可以走得更快、更灵活,也更安全。

大会动态

  • HTTPS 性能优化实践:HTTPS 能够有效地保护用户隐私,防止内容劫持,是一个非常安全的协议。但是目前依然有 70% 以上的网站没有部署 HTTPS。为什么呢?本文根据罗成在 2016ArchSummit 全球架构师(北京)峰会上的演讲整理而成,ArchSummit 深圳站即将在 2017 年 7 月 7 日开幕,更多专题讲师信息请到官网查询。

人文管理

  • “互联网 +”时代,互联网企业与传统企业该如何融合?:随着互联网、云计算、大数据、人工智能等新兴技术的快速发展,互联网 + 模式在未来中国经济发展中所占的比重正在逐步加大。它颠覆了传统的业务形态、商业模式和思维模式,使得传统企业的转型迫在眉睫。然而,面对转型,很多企业完全是一头雾水。转型,关乎着一个企业的存亡,不转型又只能坐等被市场淘汰。
  • 到底什么是数据科学家?:随着“数据驱动”的价值越来越明显,越来越多的企事业开始组建或扩大数据分析队伍,“数据科学家”这个职位也越来越被大家关注。那么到底“数据科学家”具备什么样的技能,能做哪些事?很多希望实现“数据驱动”的企业对数据科学家的期望比较笼统,并且在不断修正中,这很正常,那么,怎样才能更好地为这一职位做好准备?