收录了 python高级运维 频道下的 50 篇内容
正所谓成也萧何,败也萧何。不一样的角度,解读携程之殇。 运维自动化越是充分的公司,隐藏的风险就越大。 运维自动化真的包治百病?然后就过上了幸福快乐的生活? 528携程之殇的独特思考。
着眼于运维领域宏观的变化趋势,以期能给运维同仁带来帮助。首先,总结具体运维实践,自用容器化、使用厂商云后的两类运维是怎样的?然后,探讨SRE概念以及列举了互联网领军公司的SRE落地。最后,分析了正在兴起的智能化运维并对其影响做了简单的展望。
很多企业都认识到自动化运维的重要性,这是走向规模扩大化的必经之路,同时可以减轻运维工程师的负担。一个完善的运维系统应该是怎么样的?运维系统实现全面自动化应该怎么做,从哪里开始? 带着上述问题,InfoQ对蘑菇街运维经理赵成进行了专访。赵成有着八年的运维经验,积累了非常丰富的电信级和互联网业务研发和运维经验。
目前业界真正的智能化运维的落地实践其实并不多,大多还是停留在自动化甚至人工化阶段,然而智能化运维是大势所趋,对于大公司来说,更是尤为重要。阿里大数据SRE团队历时2年时间完成了Tesla这一智能化运维体系的设计、开发和落地。基于此,我们采访了阿里Tesla体系负责人熊胜(池枫),希望能带给大家对智能化运维的一些新的思考。
本次分享主要跟大家讨论在混和云业务模式下,自动化运维的架构需要做哪些调整与变化。
DevOps的概念建立在建立团队之间协作文化的基础上,这些团队过去一直在相对孤岛中运作。
过去一年的是各种新的运维技术和理念交相辉映的一年。技术和理念落地的过程中,也就是理想和现实碰撞的时候,往往具有戏剧性。有的技术破壳而出,迎来快速发展。有的则遇到了瓶颈,在艰难的爬坡。
本文总结容器云的运维方法的共同特性,将其称为“容器运维模式”。
基于 Apache APISIX 的自动化运维平台架构设计及应用场景
本文提到的异常检测特指在运维领域中对时序数据的异常检测,目的是为了发现时序数据中状态的变化。
O’Reilly在线学习平台上最新的使用率数据显示以下五个技术领域的发展趋势。
本文介绍智能运维中的智能算法。
本文转载自技术琐话公众号
今天,AWS 发布了 Model Server for Apache MXNet (MMS) 版本 0.2,这是一个打包深度学习模型和为模型提供服务的开源库,适用于进行大规模预测。
随着Hadoop基础设施的复杂性和规模越来越大,团队越来越难以应对管理如此庞大系统时需要承担的各种职责。
改造存储层的过程中, Clobotics 对 Ceph、SeaweedFS 和 JuiceFS 等文件系统方案进行了比较,最终选择使用 JuiceFS。
为国育贤,为高精尖产业发展提供人才智力保障。
本文由ArchSummit大会演讲整理而来。演讲嘉宾是奇虎360高级系统工程师王浩宇。奇虎360公司是业务驱动型,业务线众多、差异大、迭代周期快,Web平台部为业务线提供虚拟机、数据库、负载均衡等基础设施资源。运维要帮助公司的业务线兄弟解决很多问题后,产品才能上线,比如:如何帮助业务线快速部署运行环境?业务集群如何快速扩容?集群服务器如何快速切换环境?如何支持业务团队自主定制和操控集群环境。这些都得益于自主设计、开发的一些管理工具和系统,本文与大家分享在这方面的经验。
低代码的开发模式对传统企业来说是一个非常好的补充。
本次分享介绍技术人员收到担任产品经理遇到各种难题。