聚焦大模型浪潮下软件工程的创新洞见与实践 |QCon主题演讲大咖来袭 了解详情
写点什么

高级运维

收录了 高级运维 频道下的 50 篇内容

运维 2.0:危机前的自我拯救 | 高效运维最佳实践 (04)

“高效运维最佳实践”是InfoQ在2015年推出的精品专栏,由触控科技运维总监萧田国撰写,InfoQ 总编辑崔康策划。

运维自动化之殇 | 高效运维最佳实践 05

正所谓成也萧何,败也萧何。不一样的角度,解读携程之殇。 运维自动化越是充分的公司,隐藏的风险就越大。 运维自动化真的包治百病?然后就过上了幸福快乐的生活? 528携程之殇的独特思考。

华为云文档数据库服务DDS监控告警全新优化
华为云文档数据库服务 DDS 监控告警全新优化

“哎哎,小刘,那个很多客服反馈这个业务挂了怎么回事,赶紧看看。”

去哪儿网监控报警平台的设计和演化
去哪儿网监控报警平台的设计和演化

本次分享介绍Watcher平台产生的背景和原因,架构的设计和演化,以及我们在开发和运维过程中遇到的问题及解决方案。

如何将运维的报警做成运营的报警

做运维的同学都知道,运维一定离不开Zabbix、Nagios之类的监控软件。目前,类似的软件在监控和数据采集方面已经做到了极致,但是在报警处理上并没有很完美的解决方案,比方说,经常出现高质量报警湮没在海量报警之中等情况。本文不探讨监控系统的配置优化,只探讨监控系统按照它的逻辑发出报警之后我们该做点什么。

Java 性能调优、LinkedIn 容器部署、阿里移动性能调优——首届 APMCon 精彩演讲先睹为快

APMCon2016由极客邦、InfoQ和听云联合主办,将于8月18日~19日在北京新云南皇冠假日酒店召开,目前已经确认26位演讲嘉宾,来自美国的Java/JVM 性能咨询专家Monica Beckwith、LinkedIn Staff Software Engineer庄振运、AppDynamics首席数据科学家赵宇辰,以及阿里巴巴、腾讯、美团、京东、360等国内外一线互联网公司的技术专家将给大家带来精彩的演讲分享。

QCon 北京:多语言持久性企业开发、复杂系统下的持续部署,8 折售票即将截止

距离QCon北京2013(4月25-27)还有两个月,现在大会已经确认了超过70%的讲师及演讲内容,8折购票即将在本月底截止。本文还重点介绍了本届QCon大会关于企业级开发的疑难问题、复杂系统下的持续部署,和大型互联网公司运维经验的演讲信息。

ArchSummit 全球架构师峰会前瞻:运维、电商专题早知道

由InfoQ主办的ArchSummit全球架构师峰会即将于7月18-19日在深圳举行,此次会议重点解析九个当前最受关注的领域,包括:SNS、移动互联网、金融、大数据、智能硬件、自动化运维、游戏、电商架构、云计算等。让我们提前了解其中的运维、电商专题。

业务高速发展的运维困局,如何保证系统稳定性?

随着业务的快速发展,运维体系也逐步的完善起来。业务的稳定性和服务质量也在监控、可用性等体系的相互环抱下健康地成长。所有的问题、故障及影响稳定性的因素都在可控、可收敛的范围内,一切都向着好的方向发展。 这一切的背后真的和看起来一样美好吗?实则不然,业务的高速发展势必会留下种种隐患和问题。

拥抱故障,你可以吗?

近日,百度工程师@肖平_Jacky发布了一条微博,立刻引来大量的评论和转发,阿里、腾讯、百度、新浪等公司的运维工程师纷纷发表了自己的观点,从很多不同的方面进行了深入的探讨。

监控大规模Hadoop集群,Prometheus完胜Zabbix?
监控大规模 Hadoop 集群,Prometheus 完胜 Zabbix?

本文介绍利用Prometheus为核心来构建大数据集群监控平台的经验。

七牛云产品发布会 | 以“PISA”之名开启智能运维新时代
七牛云产品发布会 | 以“PISA”之名开启智能运维新时代

诚邀您共同见证——PISA(Pandora Intelligent Service Analysis),并与汽车、金融等行业大咖探讨数智化下的决胜之道!

全球顶尖技术会议 ArchSummit 深圳 2014 盛大开幕

ArchSummit深圳2014大会今日在万科国际会议中心盛大开幕,10个热门专题、40场演讲精彩呈现。

混沌工程实验室稳保行动·深圳站活动成功举办
混沌工程实验室稳保行动·深圳站活动成功举办

2023年5月27日,中国信息通信研究院(以下简称“中国信通院”)混沌工程实验室主办,华为云计算有限公司、腾讯云计算(北京)有限责任公司协办、InfoQ极客传媒支持的混沌工程实验室深圳站沙龙成功举办。

ArchSummit 深圳 2014 大会讲师全部确认,报名进入最后阶段

ArchSummit深圳2014大会将于7月18日开幕,目前讲师已经全部确认,9个热门专题、36场精彩演讲即将呈现,InfoQ中文站整理了讲师和演讲名单,让读者先睹为快。

全球首届 APMCon,带你给“应用性能”把把脉

今年8月18-19号,我们(InfoQ)将联合听云在北京联合主办第一届APMCon全球应用性能管理&监控技术大会,大会邀请了来自Twitter、支付宝、腾讯、京东、网易、新浪、天猫、1号店等公司的技术负责人,共同探讨APM相关的性能优化、技术方案以及架构细节,为更多的行业从业者传递应用架构优化和创新内容。

ArchSummit 深圳 2014 大会圆满结束,幻灯片开放下载

为期两天的ArchSummit深圳2014大会在万科国际会议中心圆满结束,42位讲师、700多位听众共同参与了本次包含10个热门专题、41场精彩演讲的华南技术盛会,目前演讲的幻灯片已经开放下载,演讲视频也将在近期陆续上线。ArchSummit全球架构师峰会(北京站)将于2014年12月19-20日在北京国际会议中心召开,期待您的参加。

专访阿里云高级专家赵林:从 0 到 1,中间件的研发运维之路

互联网时代,大多数企业都面临着IT构架转型的阵痛。电商老大阿里曾更早地面临这样的问题,2008年为了改变现状,阿里逐渐开始研发中间件产品,中间件产品不仅为当初的阿里分布式系统奠定了重要基础,并且从未曾停止过优化升级;如今,中间件已经成为阿里云进入企业级市场的重要武器。中间件对阿里云起着什么样的作用又为什么如此重要?InfoQ就中间件的技术实现对阿里中间件高级产品专家赵林进行了采访。

提升运维稳定性的利器——故障复盘

稳定性是运维工作的基石。故障,也就是稳定性问题是悬在各位运维从业者头上的一把达摩利斯克之剑。稳定性一旦出现问题,运维的其它工作基本也就算前功尽弃了。那么如何提升稳定性是所有运维从业者都绕不开的话题。 那么出现了稳定性问题怎么办?

百度智能监控系统的过载保护实践
百度智能监控系统的过载保护实践

本文介绍容量管理中的过载保护。

高级运维专题_资料-InfoQ中文网