收录了 slo 频道下的 50 篇内容
在线服务的目标应该是提供与业务需求匹配的可用服务。此流程的关键部分应该涉及组织中的不同团队,例如,从业务开发团队到工程团队。
如何更好的聚焦改进
随着 Kubernetes 逐渐成为云计算的标准,企业中的 Kubernetes 应用正成为主流。
本文要点:数据驱动决策系列文章概述了数据驱动决策如何支持软件交付中的三大活动——产品管理、开发和运维。
软件企业对可靠运营大规模服务的需求在不断增长。这种需求可以通过不同的方式来满足。谷歌为此提出了一种方法,也就是所谓的站点可靠性工程(SRE),这是一门将软件工程技术应用在运营上的学科。
本文分享的故事讲述了一项小更改是如何影响整个系统的,并讨论了对系统建立全局视角以更好地理解更改对系统影响的重要性。
数据驱动决策系列文章概述了数据驱动决策如何支持软件交付中的三大活动—产品管理、开发和运维。软件交付组织可以应用假设、CD指标和SRE的SLI/SLO来改善有效性、效率和服务可靠性水平。
如果不详细了解服务中各种行为的重要程度,并且不去度量这些行为的正确性的话,就无法正确运维这个系统,更不要说可靠地运维了。那么,不管是对外服务,还是内部API,我们都需要制定一个针对用户的服务质量目标,并且努力去达到这个质量目标。
PaX/Grsecurity是在OS安全上的一个开创性的贡献,没有PaX/Grsecurity的GNU/Linux的安全性只能防御脚本小子,过去的14年里Pax/Grsecurity为Linux内核做出了巨大出贡献的贡献,但到今天Linux内核社区都不愿意承认。在Anarchist看来,这样的Linux内核社区正是数字军火商,斯拉夫兵工厂甚至NSA所喜欢的。
定义服务的SLI和SLO,通过全局系统呈现、处理所有服务的SLI/SLO,从而帮助SRE实践在系统中的落地。本文介绍了Facebook(Meta)在这方面的实践。
Gergely在Uber公司内负责支付系统的运营。他在这篇文章里分享了许多通用的经验,对运营大型分布式系统的方法给出了指导。
系统越大,墨菲“什么可能出错,就会出错”的定律就越会体现。
服务器资源利用率较低,IT 基础设施的总拥有成本(TCO)逐年上涨,一直是困扰很多企业的难题。随着云原生技术的发展,Kubernetes 逐渐成为数据中心的一项基础设施,将在 / 离线业务统一使用 Kubernetes 调度编排日渐成熟。
InfoQ于近日获悉首届JRubyConf大会即将召开,大会举办时间紧随11月在旧金山举办的RubyConf之后,而地点也在旧金山。借此机会,InfoQ采访了JRuby的项目领导Charles Nutter以了解关于此次盛会的一些细节信息及其对整个JRuby社区的重要意义。
Ounce实验室近日提出了与Spring MVC相关的两个潜在安全问题。这两个问题会影响到使用Spring MVC构建的应用,其产生的原因都与服务器端对客户端参数的处理有关。InfoQ深入分析了这两个问题并与Ounce实验室展开了一番讨论。
曾被看作Spring2.1的Spring2.5,最近已经发布了其RC1版本。InfoQ采访了Spring框架的首席开发者Juergen Hoeller来了解关于这个版本的更多信息。
Hibernate是一个基于Java的对象/关系(O/R)映射框架,今天发布了3.3版。InfoQ采访了项目领导者Steve Ebersole以了解该发布的一些情况及它向Hibernate增加的新特性。
GigSpaces最近发布了他们的极限应用平台(XAP)的6.0版,它是一个软件底层构造平台,可以让应用程序扩展到分布式环境中。InfoQ对GiaSpace的Geva Perry和Nati Shalom进行了采访,以了解更多关于这一版本以及其中变化的信息。
Sun最近宣布了发布Java 6版OpenJDK的计划,它将以OpenJDK 7的代码作为基础来创建向后兼容的Java 6的实现版本。InfoQ通过与Sun的Joseph Darcy对话获得了关于此决定的更多信息。