架构
溯源架构发展的脉络,关注科技企业的架构实践,帮助传统行业、中小型企业找到可供参考的架构
- 全部
- SOA
- 微服务
- 业务架构
- 框架
- 领域驱动设计
- 多云/混合云
- 其他

Meta 详细阐述基于 LLM 级训练、混合并行计算与知识迁移的 GEM 广告模型
Meta 发布了有关其生成式广告模型(GEM)的详细信息,这是一个旨在改善其平台广告推荐能力的基础模型。

IBM Research 在 Hugging Face 平台上推出开源可配置的代理框架 CUGA
IBM Research 在 Hugging Face Spaces 平台上发布了 CUGA(可配置通用代理),使得人们更容易通过开放模型和真实工作流评估其面向企业的代理框架。

oRPC 发布 1.0 版本,支持 OpenAPI 和端到端类型安全
oRPC 1.0 是一款前沿的 TypeScript 库,用于构建类型安全的 API,现已提供稳定、可用于生产的解决方案,并完整集成 OpenAPI。其核心特性包括企业级的类型安全性、对复杂类型(如 Date 和 File)的原生支持,以及与 React、Vue、Solid、Svelte 等主流前端框架的无缝集成。凭借卓越的性能表现和详尽的迁移指南,oRPC 已成为现代 API 开发的理想方案。

下一代搜索:通过 MCP 实现 AI 与 OpenSearch 的融合
在本文中,我们将探讨 MCP 如何在 AI 代理和 OpenSearch 之间建起一座桥梁从而创建智能搜索应用。我们还将探讨从关键词搜索到代理搜索的演变,了解架构组件, 并通过实际的案例演示具体的实现方法。

AlphaEvolve 作为面向算法优化的 Agentic 系统正式进入谷歌云
谷歌云宣布了 AlphaEvolve 的私有预览版,这是一款由 Gemini 提供支持的编码 Agent,旨在发现并优化复杂工程和科学问题的算法。该系统现在可以通过谷歌云上的早期访问计划获得,其目标是那些由于巨大的搜索空间而导致传统蛮力或手动优化方法难以应对的场景。

Lyft 采用 AWS SageMaker 与 Kubernetes 混合架构重构其机器学习平台
Lyft 将其机器学习平台 LyftLearn 重构为一个混合系统:将离线工作负载迁移至 AWS SageMaker,同时继续使用 Kubernetes 处理在线模型推理。该决策在运维复杂度最高的环节采用托管服务,在控制权至关重要的环节保留自定义基础设施,这样为统一平台战略提供了一种务实的替代方案。

Yelp 发布大规模管理 S3 服务器访问日志的方案
文章系统性地梳理了 Yelp 在日志体量、存储开销以及查询性能方面遇到的挑战。

TornadoVM 2.0 为 Java 提供自动 GPU 加速和 LLM 支持
TornadoVM 项目最近达到了 2.0 版本,这是这个开源项目的一个重要里程碑,该项目旨在为 Java 提供异构硬件运行时。这个版本可能会特别吸引在 JVM 上开发 LLM 解决方案的团队。

打破孤岛:Netflix 推出 Upper 元模型实现内容工程一致性
Netflix 推出 Upper,这是一个统一的领域建模框架,内置于其统一数据架构(UDA)中,旨在标准化其不断扩展的内容工程系统中的领域定义。

AWS Lambda 托管实例:无服务器的灵活性与 EC2 成本模型的完美结合
释放 AWS Lambda 托管实例的强大能力,无缝融合无服务器函数与 Amazon EC2,实现卓越的性能与成本效益。该解决方案专为稳态工作负载设计,可自动管理实例、显著减少冷启动,并支持多并发执行。

Discord 如何将其机器学习平台从单 GPU 工作流扩展到共享 Ray 集群
这些改进让大型模型能够实现每日重训,并带来了关键广告排序指标 200% 的提升。

Karrot 通过在亚马逊云科技上部署全新可扩展的特征平台将转化率提升 70%
Karrot 将其传统的推荐系统替换为一个可扩展的架构。新架构利用了亚马逊云科技提供的各种服务。该公司希望解决先前解决方案中存在的紧耦合、可扩展性和可靠性差等挑战,并为此选择了一种基于可扩展云服务构建的分布式事件驱动架构。

Azure API Management Premium v2 正式发布:简化的私有网络连接与 VNet 注入
该版本采用了全新的架构,将流量管理从客户的 VNet 中移除。

Reddit 将其评论功能的后端从 Python 迁移为 Go 微服务
Reddit 重建了它的核心后端,将评论、账户、帖子和 Subreddits 从传统的 Python 单体迁移到了 Go 微服务。

烧钱,能解决 AI 存储的焦虑吗?
存储短缺带来的焦虑,在 2026 年仍将延续。

InfraTalk 第三期金句
一边是全球性短缺与成本上行,一边是企业存不起、买不起的现实焦虑。存储荒,已经成为产业共同面对的关键议题。

InfraTalk 第三期直播完整版|模型训推需求升级,AI 存储如何解题?
一边是全球性短缺与成本上行,一边是企业存不起、买不起的现实焦虑。存储荒,已经成为产业共同面对的关键议题。

从一次灾难性的微服务迁移恢复过程中汲取的五个重要教训
她的五个来之不易的教训揭示了成功的架构恢复同样依赖于感知管理和团队动态,而不仅仅是技术实力。

降本 30%、提效 200%!解密星巴克日志平台的极致升级优化之道
所有日志涉及的环境组件统一都迁移至云原生祼金属 k8s 平台引擎之上

SAM 3 推出更强大的分割架构,面向现代视觉工作流程
Meta 发布了 SAM 3,这是其 Segment Anything Model 的最新版本,也是自项目首次亮相以来最大的一次更新。

工商银行软件开发中心研发管理系统权限体系的探索与实践
用户涵盖产品经理、架构师、项目经理、开发人员、测试人员等多种岗位角色


架构师(2025 年第二季)
本期特别专题:架构师视角的软件技术栈与语言新秩序。推荐文章:当代码遇上大模型:智能编程助手的架构设计与工程实践

Grafana Labs 发布 Mimir 3.0,推出全新架构以提升性能
本次版本采用全新的架构,将读写操作彻底分离,大幅提升了在大规模指标场景下的性能、可靠性和成本效率。

英伟达 Run:ai 没做到的,被华为开源方案实现了
为推动 AI 行业化落地,Flex:ai 选择了更彻底的开源路线

从静态到自适应:Airbnb 键值存储系统应对流量峰值的控制机制
Airbnb 升级了其多租户键值存储 Mussel 的流量管理架构,用一个完全自适应的资源感知系统取代了针对每个客户端的静态速率限制。这次重新设计是为了在流量高峰期间仍然能够保持服务质量,保护关键工作流程,并确保成千上万的租户之间能够公平地使用其服务。

Monzo 基于 BigQuery 和微服务的实时欺诈检测架构
Monzo 是英国的一家数字银行。为了跟上日益复杂的诈骗行为和不断增长的支付量,他们重新设计了防欺诈平台。这个反应式系统旨在实时检测欺诈交易,快速部署新的控制措施,提供详细的性能监控,并尽可能降低热点支付路径的延迟。

如何使用领域驱动设计和变革走私进行社会技术设计
领域驱动设计(DDD)能够改进社会技术设计,以应对人类系统中的组织动态和决策复杂性,Xin Yao 在 OOP 会议上解释道。她展示了如何通过“变革走私(change smuggling)”提供一种实用的方法来启动小型、安全的失败探测,促使社会技术变革有机地、通过对话地出现。

Azure Front Door 中断:单控制平面缺陷暴露了架构的脆弱性
最近 Azure Front Door(AFD)发生了 9 小时的故障,原因是软件缺陷导致的控制平面配置更改错误,该错误绕过了安全检查,导致了巨大的爆炸半径,并通过身份耦合影响了 M365 和 Entra ID,暴露了集中式边缘结构中重要的架构反模式。

团队授权:分散化的架构决策
在当今快速发展的技术环境中,集中式架构决策可能成为高效交付和创新的瓶颈。通过自己的故事,我们将分享分散决策如何改善团队之间的一致性,加快决策速度,并培养一种主人翁文化。

星巴克中国一体化可观测性重构:从日志检索到指标驱动,构建低成本、高可用的可观测体系
“我们在不引入重型流式计算(如 Flink)的前提下,采用 Vector 将访问日志指标化的方式,联动并用指标与日志。”








