架构

关注
收录了架构频道下的 30417 篇内容
溯源架构发展的脉络,关注科技企业的架构实践,帮助传统行业、中小型企业找到可供参考的架构
  • 全部
  • SOA
  • 微服务
  • 业务架构
  • 框架
  • 领域驱动设计
  • 多云/混合云
  • 其他
  • 全部
  • 文章
  • 视频
  • 话题
  • 电子书
SIMA 2利用Gemini和自我改进技术在未见过的3D和逼真世界中进行泛化
SIMA 2 利用 Gemini 和自我改进技术在未见过的 3D 和逼真世界中进行泛化

DeepMind 的研究人员推出了 SIMA 2,这是一个建立在 Gemini 基础模型上的通用智能体,可以理解并在多个 3D 虚拟游戏环境中行动。

Authress如何设计以增强弹性并成功应对亚马逊云科技的重大宕机事件
Authress 如何设计以增强弹性并成功应对亚马逊云科技的重大宕机事件

身份和认证服务公司 Authress 分享了其在重大云基础设施中断期间保持运营的策略,比如 2025 年 10 月亚马逊云科技(AWS)的大规模中断,这次中断影响了众多主要服务。Authress 首席技术官 Warren Parad 解释说,公司的弹性架构采用了依赖于多区域部署和最小化对 AWS 控制平面服务的依赖等策略。

Cloudflare 开源 tokio‑quiche,简化 QUIC 和 HTTP/3 的 Rust 实现
Cloudflare 开源 tokio‑quiche,简化 QUIC 和 HTTP/3 的 Rust 实现

Cloudflare 开源 tokio-quiche,这是一个异步 QUIC 和 HTTP/3 Rust 库,它将 Cloudflare 经过实战检验的 quiche 实现与 Tokio 运行时封装在一起,旨在简化高性能 QUIC 应用程序的开发。

超越应用层的基准测试:Uber如何评估基础设施变更与云服务单元
超越应用层的基准测试:Uber 如何评估基础设施变更与云服务单元

Uber 分享了 Ceilometer 的细节,这是他们内部的一个自适应基准测试框架,旨在评估应用级指标之外的基础设施性能。

优步采用Amazon OpenSearch进行语义搜索,以更好地捕捉用户意图
优步采用 Amazon OpenSearch 进行语义搜索,以更好地捕捉用户意图

为了提升搜索与推荐的用户体验,优步(Uber)从 Apache Lucene 迁移到了 Amazon OpenSearch,以支持大规模向量搜索并更精准地捕捉用户搜索意图。此次迁移带来了若干基础设施方面的挑战,优步的工程师通过针对性的解决方案逐一将其克服。

超越胜率:Spotify如何在产品实验中量化学习成果
超越胜率:Spotify 如何在产品实验中量化学习成果

Spotify 在其 Confidence 实验平台之上引入了学习实验(EwL)指标,以衡量有多少测试提供了决策就绪的洞察,而不仅仅是“获胜”的次数。EwL 捕获了跨产品团队学习的数量和质量,帮助他们在规模上做出更快、更明智的产品决策。

Python Workers重装上阵:Wasm快照与原生uv工具支持
Python Workers 重装上阵:Wasm 快照与原生 uv 工具支持

在 Python Workers 方面,Cloudflare 通过近乎即时的冷启动、更广泛的软件包兼容性,以及借助 uv 包管理器简化的工作流程,彻底革新了无服务器的性能。借助内存快照和 WebAssembly 技术,Cloudflare 大幅缩短了启动时间,使 Python 成为 AI 和数据科学应用的理想选择。

Nuxt引入了原生请求取消和异步处理器提取以提升性能
Nuxt 引入了原生请求取消和异步处理器提取以提升性能

Nuxt 4.2 通过原生支持数据抓取的中止控制、改进的错误处理和实验性的 TypeScript 支持,显著提升了开发者体验。凭借最高达 39% 的打包体积缩减和更简洁的 app 目录结构,该版本在性能与项目组织方面实现了全面增强,进一步巩固了 Nuxt 作为基于 Vue.js 构建全栈 Web 应用的首选框架地位。

亚马逊云科技和谷歌云预览安全多云网络
亚马逊云科技和谷歌云预览安全多云网络

在一项令人惊讶的举措中,亚马逊云科技(AWS)和谷歌云最近合作简化多云网络,引入了一个通用标准,并利用“AWS 互联 - 多云”和“谷歌云的跨云互联”。这个新选项使得组织更容易管理和保护跨两个云的工作负载,预计 Azure 将在 2026 年加入。

AI 时代,软件架构师的角色该如何重新定位
AI 时代,软件架构师的角色该如何重新定位

本文通过“三个回路”模型,探讨架构师如何在效率、治理与责任之间重新定位自身价值。

Pinecone在公开预览中引入专用读取节点,用于可预测的向量工作负载
Pinecone 在公开预览中引入专用读取节点,用于可预测的向量工作负载

Pinecone 最近公布了专用读节点(Dedicated Read Nodes,DRN)的公开预览版本,这是其向量数据库的一种新的容量模式,旨在为高吞吐量应用(如十亿向量语义搜索、推荐系统和关键任务 AI 服务)提供可预测的性能和大规模成本。此功能建立在 Pinecone 现有的无服务器按需模型之上,为企业提供了稳定的硬件资源,以应对持续的高查询量,而无需担心基于使用量的定价中的固有可变性。

构建可扩展的流媒体基础设施:因为观众不会等到明天
构建可扩展的流媒体基础设施:因为观众不会等到明天

在流媒体领域,挑战是即时的:用户现在就在观看电视节目,而不是计划明天再看。当系统在黄金时段发生故障时,根本没有恢复窗口;观众会立即离开,并可能一去不返。一年半前,ProSiebenSat.1 Media SE 面临着为国际用户扩展流媒体应用的挑战。

Toad:一个统一管理所有大语言模型的 CLI 工具,承诺在用户体验上优于现有方案
Toad:一个统一管理所有大语言模型的 CLI 工具,承诺在用户体验上优于现有方案

这款新近公开发布的工具,旨在为多个代码智能体提供一个统一、“美观”的终端界面,并通过 智能体通信协议。

亚马逊云科技推出 NAT Gateway 的区域级可用性支持
亚马逊云科技推出 NAT Gateway 的区域级可用性支持

这一新能力允许开发者在一个 VPC 中创建单个 NAT Gateway,并自动跨多个可用区(AZ)运行。

Meta详细阐述基于LLM级训练、混合并行计算与知识迁移的GEM广告模型
Meta 详细阐述基于 LLM 级训练、混合并行计算与知识迁移的 GEM 广告模型

Meta 发布了有关其生成式广告模型(GEM)的详细信息,这是一个旨在改善其平台广告推荐能力的基础模型。

IBM Research在Hugging Face平台上推出开源可配置的代理框架CUGA
IBM Research 在 Hugging Face 平台上推出开源可配置的代理框架 CUGA

IBM Research 在 Hugging Face Spaces 平台上发布了 CUGA(可配置通用代理),使得人们更容易通过开放模型和真实工作流评估其面向企业的代理框架。

oRPC发布1.0版本,支持OpenAPI和端到端类型安全
oRPC 发布 1.0 版本,支持 OpenAPI 和端到端类型安全

oRPC 1.0 是一款前沿的 TypeScript 库,用于构建类型安全的 API,现已提供稳定、可用于生产的解决方案,并完整集成 OpenAPI。其核心特性包括企业级的类型安全性、对复杂类型(如 Date 和 File)的原生支持,以及与 React、Vue、Solid、Svelte 等主流前端框架的无缝集成。凭借卓越的性能表现和详尽的迁移指南,oRPC 已成为现代 API 开发的理想方案。

下一代搜索:通过MCP实现AI与OpenSearch的融合
下一代搜索:通过 MCP 实现 AI 与 OpenSearch 的融合

在本文中,我们将探讨 MCP 如何在 AI 代理和 OpenSearch 之间建起一座桥梁从而创建智能搜索应用。我们还将探讨从关键词搜索到代理搜索的演变,了解架构组件, 并通过实际的案例演示具体的实现方法。

AlphaEvolve作为面向算法优化的Agentic系统正式进入谷歌云
AlphaEvolve 作为面向算法优化的 Agentic 系统正式进入谷歌云

谷歌云宣布了 AlphaEvolve 的私有预览版,这是一款由 Gemini 提供支持的编码 Agent,旨在发现并优化复杂工程和科学问题的算法。该系统现在可以通过谷歌云上的早期访问计划获得,其目标是那些由于巨大的搜索空间而导致传统蛮力或手动优化方法难以应对的场景。

Lyft采用AWS SageMaker与Kubernetes混合架构重构其机器学习平台
Lyft 采用 AWS SageMaker 与 Kubernetes 混合架构重构其机器学习平台

Lyft 将其机器学习平台 LyftLearn 重构为一个混合系统:将离线工作负载迁移至 AWS SageMaker,同时继续使用 Kubernetes 处理在线模型推理。该决策在运维复杂度最高的环节采用托管服务,在控制权至关重要的环节保留自定义基础设施,这样为统一平台战略提供了一种务实的替代方案。

Yelp 发布大规模管理 S3 服务器访问日志的方案
Yelp 发布大规模管理 S3 服务器访问日志的方案

文章系统性地梳理了 Yelp 在日志体量、存储开销以及查询性能方面遇到的挑战。

TornadoVM 2.0为Java提供自动GPU加速和LLM支持
TornadoVM 2.0 为 Java 提供自动 GPU 加速和 LLM 支持

TornadoVM 项目最近达到了 2.0 版本,这是这个开源项目的一个重要里程碑,该项目旨在为 Java 提供异构硬件运行时。这个版本可能会特别吸引在 JVM 上开发 LLM 解决方案的团队。

打破孤岛:Netflix推出Upper元模型实现内容工程一致性
打破孤岛:Netflix 推出 Upper 元模型实现内容工程一致性

Netflix 推出 Upper,这是一个统一的领域建模框架,内置于其统一数据架构(UDA)中,旨在标准化其不断扩展的内容工程系统中的领域定义。

AWS Lambda 托管实例:无服务器的灵活性与 EC2 成本模型的完美结合
AWS Lambda 托管实例:无服务器的灵活性与 EC2 成本模型的完美结合

释放 AWS Lambda 托管实例的强大能力,无缝融合无服务器函数与 Amazon EC2,实现卓越的性能与成本效益。该解决方案专为稳态工作负载设计,可自动管理实例、显著减少冷启动,并支持多并发执行。

Discord 如何将其机器学习平台从单 GPU 工作流扩展到共享 Ray 集群
Discord 如何将其机器学习平台从单 GPU 工作流扩展到共享 Ray 集群

这些改进让大型模型能够实现每日重训,并带来了关键广告排序指标 200% 的提升。

Karrot通过在亚马逊云科技上部署全新可扩展的特征平台将转化率提升70%
Karrot 通过在亚马逊云科技上部署全新可扩展的特征平台将转化率提升 70%

Karrot 将其传统的推荐系统替换为一个可扩展的架构。新架构利用了亚马逊云科技提供的各种服务。该公司希望解决先前解决方案中存在的紧耦合、可扩展性和可靠性差等挑战,并为此选择了一种基于可扩展云服务构建的分布式事件驱动架构。

Azure API Management Premium v2 正式发布:简化的私有网络连接与 VNet 注入
Azure API Management Premium v2 正式发布:简化的私有网络连接与 VNet 注入

该版本采用了全新的架构,将流量管理从客户的 VNet 中移除。

Reddit将其评论功能的后端从Python迁移为Go微服务
Reddit 将其评论功能的后端从 Python 迁移为 Go 微服务

Reddit 重建了它的核心后端,将评论、账户、帖子和 Subreddits 从传统的 Python 单体迁移到了 Go 微服务。

烧钱,能解决 AI 存储的焦虑吗?
烧钱,能解决 AI 存储的焦虑吗?

存储短缺带来的焦虑,在 2026 年仍将延续。

InfraTalk第三期金句
InfraTalk 第三期金句

一边是全球性短缺与成本上行,一边是企业存不起、买不起的现实焦虑。存储荒,已经成为产业共同面对的关键议题。

  • 用户头像
    关注

    InfoQ高级编辑

  • 用户头像
    关注

    暂无签名

  • 用户头像
    关注

    暂无签名

    百川智能预训练数据策略的探索与实践
    百川智能预训练数据策略的探索与实践

    张宇鹏 | 百川智能 算法专家

    立即下载
    云上百万大数据任务的自动优化实践

    杨少华 | 贝联珠贯 大数据技术负责人

    立即下载
    大模型助力软件研发人机协同进化实践

    车婷婷 | 百度 研发工具负责人

    立即下载