收录了 系统工程师 频道下的 50 篇内容
任务顺利完成的关键。计算场景中。集群训练的技术选型,工程实践等方面上提供最前沿的参考。听众受益本期嘉宾
分布式系统工程师、《RabbitMQ实战》合著者Alvaro Videla在2017伦敦QCon上回顾了分布式系统理论。主题涵盖将分布式系统从不同维度进行分类,例如时间模型、故障模式。并讨论这些类别的选型考虑因素。
万物皆Embedding!
常言道:“未知攻,焉知防”。知彼知己者,百战不殆;不知彼而知己,一胜一负;不知彼,不知己,每战必殆。
队列仍然是解决许多分布式系统问题的重要工具,如果你觉得队列的受欢迎程度有所下降,那反映的并不是队列的发展颓势,而是这种模式已成为一种可靠、成熟的技术。
ChatGPT4 通过了数据库系统工程师考试。这次考试使用了2021年的真实试卷,上午的笔试题全部为选择题,总分75分(45分通过)。ChatGPT3.5 考了49分(勉强通过),ChatGPT4 拿到67分(高分通过)。
本文主要介绍了月之暗面在训推混部集群中的实践经验,重点探讨如何快速定位并隔离故障,实现任务的高效恢复,从而提升系统整体稳定性,以及如何在资源有限的情况下最大化利用率,避免浪费,进一步将该思路应用于强化学习任务的训练中。给关注大规模模型训练的同行们提供了一些可靠的技术思考与实践参考。
本文探讨了各种类型的软件工程师的自我定位问题。
电商广告面临的技术挑战和解决之道。
操作系统自研有多难?强大如Meta,也只能暂时退避三舍。
机器学习工程师将会被谁取代?
“12月28日10:00将进行前沿探索论坛——《布局前沿技术,探索人类美好未来》。人工智能技术对于征服人类社会面临的一些最重大的挑战提供了颠覆性的发展机遇,目前人工智能技术在最前沿的科研领域有何创新探索,未来的发展趋势是什么,在可靠性和安全性方面有哪些突破,这都是备受专业人士关注的话题。
“12月28日10:00将进行云原生基础设施论坛——《打造助力行业智能化升级的下一代基础设施》。云原生是打造现代化人工智能基础设施的基石,也被称作加速企业数字化智能化转型的最佳路径。
你要有强烈的好奇心,超高的学习效率,更需要拥有把算法和实际业务结合起来的能力,这样才有机会成为一名优秀的AI架构师!
聊聊正在迅速崛起的AI工程师
IOPS、低延迟和稳定数据访问性能的存储系统,但是传统存储方案普遍存在硬件层面和软件层面的限制,存储系统很难同时兼顾,针对传统存储方案面临问题。
本文提供了来自eBay和Snowflake等大公司的经验教训,为遗留系统、性能验证和回滚规划提供了解决方案。它强调了系统性准备和清晰沟通的重要性,它们可应对挑战并确保在大规模升级中实现零停机。
在2013年11月6日的香港OpenStack峰会主题演讲上,奇虎360的系统工程师张玉放介绍了他们内部使用OpenStack的一些情况。
本问答环节于9月在旧金山举行,来自的混沌大会,探讨了混沌工程的好处和挑战。本文还提供了新兴的良好实践,并包含了入门的先决条件、建议和技巧。
作为 AWS 企业战略家,我拥有与全球各地面对着各种业务和技术难题的高管们会面的特权。