收录了 高级运维 频道下的 50 篇内容
“高效运维最佳实践”是InfoQ在2015年推出的精品专栏,由触控科技运维总监萧田国撰写,InfoQ 总编辑崔康策划。
正所谓成也萧何,败也萧何。不一样的角度,解读携程之殇。 运维自动化越是充分的公司,隐藏的风险就越大。 运维自动化真的包治百病?然后就过上了幸福快乐的生活? 528携程之殇的独特思考。
“哎哎,小刘,那个很多客服反馈这个业务挂了怎么回事,赶紧看看。”
本次分享介绍Watcher平台产生的背景和原因,架构的设计和演化,以及我们在开发和运维过程中遇到的问题及解决方案。
做运维的同学都知道,运维一定离不开Zabbix、Nagios之类的监控软件。目前,类似的软件在监控和数据采集方面已经做到了极致,但是在报警处理上并没有很完美的解决方案,比方说,经常出现高质量报警湮没在海量报警之中等情况。本文不探讨监控系统的配置优化,只探讨监控系统按照它的逻辑发出报警之后我们该做点什么。
APMCon2016由极客邦、InfoQ和听云联合主办,将于8月18日~19日在北京新云南皇冠假日酒店召开,目前已经确认26位演讲嘉宾,来自美国的Java/JVM 性能咨询专家Monica Beckwith、LinkedIn Staff Software Engineer庄振运、AppDynamics首席数据科学家赵宇辰,以及阿里巴巴、腾讯、美团、京东、360等国内外一线互联网公司的技术专家将给大家带来精彩的演讲分享。
距离QCon北京2013(4月25-27)还有两个月,现在大会已经确认了超过70%的讲师及演讲内容,8折购票即将在本月底截止。本文还重点介绍了本届QCon大会关于企业级开发的疑难问题、复杂系统下的持续部署,和大型互联网公司运维经验的演讲信息。
由InfoQ主办的ArchSummit全球架构师峰会即将于7月18-19日在深圳举行,此次会议重点解析九个当前最受关注的领域,包括:SNS、移动互联网、金融、大数据、智能硬件、自动化运维、游戏、电商架构、云计算等。让我们提前了解其中的运维、电商专题。
随着业务的快速发展,运维体系也逐步的完善起来。业务的稳定性和服务质量也在监控、可用性等体系的相互环抱下健康地成长。所有的问题、故障及影响稳定性的因素都在可控、可收敛的范围内,一切都向着好的方向发展。 这一切的背后真的和看起来一样美好吗?实则不然,业务的高速发展势必会留下种种隐患和问题。
近日,百度工程师@肖平_Jacky发布了一条微博,立刻引来大量的评论和转发,阿里、腾讯、百度、新浪等公司的运维工程师纷纷发表了自己的观点,从很多不同的方面进行了深入的探讨。
本文介绍利用Prometheus为核心来构建大数据集群监控平台的经验。
诚邀您共同见证——PISA(Pandora Intelligent Service Analysis),并与汽车、金融等行业大咖探讨数智化下的决胜之道!
ArchSummit深圳2014大会今日在万科国际会议中心盛大开幕,10个热门专题、40场演讲精彩呈现。
2023年5月27日,中国信息通信研究院(以下简称“中国信通院”)混沌工程实验室主办,华为云计算有限公司、腾讯云计算(北京)有限责任公司协办、InfoQ极客传媒支持的混沌工程实验室深圳站沙龙成功举办。
ArchSummit深圳2014大会将于7月18日开幕,目前讲师已经全部确认,9个热门专题、36场精彩演讲即将呈现,InfoQ中文站整理了讲师和演讲名单,让读者先睹为快。
今年8月18-19号,我们(InfoQ)将联合听云在北京联合主办第一届APMCon全球应用性能管理&监控技术大会,大会邀请了来自Twitter、支付宝、腾讯、京东、网易、新浪、天猫、1号店等公司的技术负责人,共同探讨APM相关的性能优化、技术方案以及架构细节,为更多的行业从业者传递应用架构优化和创新内容。
为期两天的ArchSummit深圳2014大会在万科国际会议中心圆满结束,42位讲师、700多位听众共同参与了本次包含10个热门专题、41场精彩演讲的华南技术盛会,目前演讲的幻灯片已经开放下载,演讲视频也将在近期陆续上线。ArchSummit全球架构师峰会(北京站)将于2014年12月19-20日在北京国际会议中心召开,期待您的参加。
互联网时代,大多数企业都面临着IT构架转型的阵痛。电商老大阿里曾更早地面临这样的问题,2008年为了改变现状,阿里逐渐开始研发中间件产品,中间件产品不仅为当初的阿里分布式系统奠定了重要基础,并且从未曾停止过优化升级;如今,中间件已经成为阿里云进入企业级市场的重要武器。中间件对阿里云起着什么样的作用又为什么如此重要?InfoQ就中间件的技术实现对阿里中间件高级产品专家赵林进行了采访。
稳定性是运维工作的基石。故障,也就是稳定性问题是悬在各位运维从业者头上的一把达摩利斯克之剑。稳定性一旦出现问题,运维的其它工作基本也就算前功尽弃了。那么如何提升稳定性是所有运维从业者都绕不开的话题。 那么出现了稳定性问题怎么办?
本文介绍容量管理中的过载保护。