架构
溯源架构发展的脉络,关注科技企业的架构实践,帮助传统行业、中小型企业找到可供参考的架构
- 全部
- SOA
- 微服务
- 业务架构
- 框架
- 领域驱动设计
- 多云/混合云
- 其他

亚马逊云科技和谷歌云预览安全多云网络
在一项令人惊讶的举措中,亚马逊云科技(AWS)和谷歌云最近合作简化多云网络,引入了一个通用标准,并利用“AWS 互联 - 多云”和“谷歌云的跨云互联”。这个新选项使得组织更容易管理和保护跨两个云的工作负载,预计 Azure 将在 2026 年加入。

AI 时代,软件架构师的角色该如何重新定位
本文通过“三个回路”模型,探讨架构师如何在效率、治理与责任之间重新定位自身价值。

Pinecone 在公开预览中引入专用读取节点,用于可预测的向量工作负载
Pinecone 最近公布了专用读节点(Dedicated Read Nodes,DRN)的公开预览版本,这是其向量数据库的一种新的容量模式,旨在为高吞吐量应用(如十亿向量语义搜索、推荐系统和关键任务 AI 服务)提供可预测的性能和大规模成本。此功能建立在 Pinecone 现有的无服务器按需模型之上,为企业提供了稳定的硬件资源,以应对持续的高查询量,而无需担心基于使用量的定价中的固有可变性。

构建可扩展的流媒体基础设施:因为观众不会等到明天
在流媒体领域,挑战是即时的:用户现在就在观看电视节目,而不是计划明天再看。当系统在黄金时段发生故障时,根本没有恢复窗口;观众会立即离开,并可能一去不返。一年半前,ProSiebenSat.1 Media SE 面临着为国际用户扩展流媒体应用的挑战。

Toad:一个统一管理所有大语言模型的 CLI 工具,承诺在用户体验上优于现有方案
这款新近公开发布的工具,旨在为多个代码智能体提供一个统一、“美观”的终端界面,并通过 智能体通信协议。

亚马逊云科技推出 NAT Gateway 的区域级可用性支持
这一新能力允许开发者在一个 VPC 中创建单个 NAT Gateway,并自动跨多个可用区(AZ)运行。

Meta 详细阐述基于 LLM 级训练、混合并行计算与知识迁移的 GEM 广告模型
Meta 发布了有关其生成式广告模型(GEM)的详细信息,这是一个旨在改善其平台广告推荐能力的基础模型。

IBM Research 在 Hugging Face 平台上推出开源可配置的代理框架 CUGA
IBM Research 在 Hugging Face Spaces 平台上发布了 CUGA(可配置通用代理),使得人们更容易通过开放模型和真实工作流评估其面向企业的代理框架。

oRPC 发布 1.0 版本,支持 OpenAPI 和端到端类型安全
oRPC 1.0 是一款前沿的 TypeScript 库,用于构建类型安全的 API,现已提供稳定、可用于生产的解决方案,并完整集成 OpenAPI。其核心特性包括企业级的类型安全性、对复杂类型(如 Date 和 File)的原生支持,以及与 React、Vue、Solid、Svelte 等主流前端框架的无缝集成。凭借卓越的性能表现和详尽的迁移指南,oRPC 已成为现代 API 开发的理想方案。

下一代搜索:通过 MCP 实现 AI 与 OpenSearch 的融合
在本文中,我们将探讨 MCP 如何在 AI 代理和 OpenSearch 之间建起一座桥梁从而创建智能搜索应用。我们还将探讨从关键词搜索到代理搜索的演变,了解架构组件, 并通过实际的案例演示具体的实现方法。

AlphaEvolve 作为面向算法优化的 Agentic 系统正式进入谷歌云
谷歌云宣布了 AlphaEvolve 的私有预览版,这是一款由 Gemini 提供支持的编码 Agent,旨在发现并优化复杂工程和科学问题的算法。该系统现在可以通过谷歌云上的早期访问计划获得,其目标是那些由于巨大的搜索空间而导致传统蛮力或手动优化方法难以应对的场景。

Lyft 采用 AWS SageMaker 与 Kubernetes 混合架构重构其机器学习平台
Lyft 将其机器学习平台 LyftLearn 重构为一个混合系统:将离线工作负载迁移至 AWS SageMaker,同时继续使用 Kubernetes 处理在线模型推理。该决策在运维复杂度最高的环节采用托管服务,在控制权至关重要的环节保留自定义基础设施,这样为统一平台战略提供了一种务实的替代方案。

Yelp 发布大规模管理 S3 服务器访问日志的方案
文章系统性地梳理了 Yelp 在日志体量、存储开销以及查询性能方面遇到的挑战。

TornadoVM 2.0 为 Java 提供自动 GPU 加速和 LLM 支持
TornadoVM 项目最近达到了 2.0 版本,这是这个开源项目的一个重要里程碑,该项目旨在为 Java 提供异构硬件运行时。这个版本可能会特别吸引在 JVM 上开发 LLM 解决方案的团队。

打破孤岛:Netflix 推出 Upper 元模型实现内容工程一致性
Netflix 推出 Upper,这是一个统一的领域建模框架,内置于其统一数据架构(UDA)中,旨在标准化其不断扩展的内容工程系统中的领域定义。

AWS Lambda 托管实例:无服务器的灵活性与 EC2 成本模型的完美结合
释放 AWS Lambda 托管实例的强大能力,无缝融合无服务器函数与 Amazon EC2,实现卓越的性能与成本效益。该解决方案专为稳态工作负载设计,可自动管理实例、显著减少冷启动,并支持多并发执行。

Discord 如何将其机器学习平台从单 GPU 工作流扩展到共享 Ray 集群
这些改进让大型模型能够实现每日重训,并带来了关键广告排序指标 200% 的提升。

Karrot 通过在亚马逊云科技上部署全新可扩展的特征平台将转化率提升 70%
Karrot 将其传统的推荐系统替换为一个可扩展的架构。新架构利用了亚马逊云科技提供的各种服务。该公司希望解决先前解决方案中存在的紧耦合、可扩展性和可靠性差等挑战,并为此选择了一种基于可扩展云服务构建的分布式事件驱动架构。

Azure API Management Premium v2 正式发布:简化的私有网络连接与 VNet 注入
该版本采用了全新的架构,将流量管理从客户的 VNet 中移除。

Reddit 将其评论功能的后端从 Python 迁移为 Go 微服务
Reddit 重建了它的核心后端,将评论、账户、帖子和 Subreddits 从传统的 Python 单体迁移到了 Go 微服务。

烧钱,能解决 AI 存储的焦虑吗?
存储短缺带来的焦虑,在 2026 年仍将延续。

InfraTalk 第三期金句
一边是全球性短缺与成本上行,一边是企业存不起、买不起的现实焦虑。存储荒,已经成为产业共同面对的关键议题。

InfraTalk 第三期直播完整版|模型训推需求升级,AI 存储如何解题?
一边是全球性短缺与成本上行,一边是企业存不起、买不起的现实焦虑。存储荒,已经成为产业共同面对的关键议题。

从一次灾难性的微服务迁移恢复过程中汲取的五个重要教训
她的五个来之不易的教训揭示了成功的架构恢复同样依赖于感知管理和团队动态,而不仅仅是技术实力。

降本 30%、提效 200%!解密星巴克日志平台的极致升级优化之道
所有日志涉及的环境组件统一都迁移至云原生祼金属 k8s 平台引擎之上

SAM 3 推出更强大的分割架构,面向现代视觉工作流程
Meta 发布了 SAM 3,这是其 Segment Anything Model 的最新版本,也是自项目首次亮相以来最大的一次更新。

工商银行软件开发中心研发管理系统权限体系的探索与实践
用户涵盖产品经理、架构师、项目经理、开发人员、测试人员等多种岗位角色


架构师(2025 年第二季)
本期特别专题:架构师视角的软件技术栈与语言新秩序。推荐文章:当代码遇上大模型:智能编程助手的架构设计与工程实践

Grafana Labs 发布 Mimir 3.0,推出全新架构以提升性能
本次版本采用全新的架构,将读写操作彻底分离,大幅提升了在大规模指标场景下的性能、可靠性和成本效率。

英伟达 Run:ai 没做到的,被华为开源方案实现了
为推动 AI 行业化落地,Flex:ai 选择了更彻底的开源路线







