下载 InfoQ App >
随时随地获取最新技术资讯
6 月
26 - 27
2026
AICon人工智能开发与应用大会|上海
多智能体协同|模型推理优化|AI 原生数据架构|可信 AI 与治理|具身智能与物理 AI
🔥9折优惠立减580元!
8 月
21 - 22
2026
AICon人工智能开发与应用大会|深圳
Agentic AI|Agentic UI|AI 工业化落地|AI 工程化与极致效能
🔥8折优惠立减1160元!
10 月
22 - 24
2026
QCon全球软件开发大会|上海
Al Agent |Vibe Coding|智能可观测|推理基建|模型攻防|AI x创造力
🔥8折优惠立减1360元!
4月16
- 6月30
2026
代码通过即拿奖💵
OpenCloudOS 40+ 超热门 AI 工具等你来贡献
⬆️火速认领,先到先得

演讲人:顺丰集团CIO 刘潭仁、深信服科技CIO 宋东林、极客邦创始人&CEO 霍太稳
演讲人:余欣纬
演讲人:嘉宾:顺丰集团CIO 刘潭仁、深信服科技CIO 宋东林、极客邦科技创始人&CEO 霍太稳

随着越来越多的人在日常生活中使用 AI 工具,像千问这样的 AI 应用正在迅速成为一种新的线上购物方式,智能体也成为商家的新获客渠道。

比起“基础设施出现故障”,人们似乎更愿意相信“模型降智了”。

“华为云并不愿意简单用收入总量、Token 总量或算力规模与其他厂商比较。”

“企业技术栈正变得越来越碎片化”

6 月 5 日,第四届世界科学智能大赛正式进入复赛阶段,初赛赛程收官。本届大赛共吸引来自 32 个国家和地区的 17977 名选手报名参赛,参赛群体涵盖清华大学、北京大学、复旦大学、中国科学技术大学、帝国理工学院、南洋理工大学等海内外知名高校学生,中核集团、国家电投、腾讯、阿里等领军企业及众多创新企业的一线研发人员,参赛规模与行业影响力较上届持续攀升

借助广度优先引擎,Shopify 将 GraphQL 执行速度提升了 15 倍。

过去,这类场景面临的挑战通常被归为“语音识别”问题——只需把声音转成文字。但当大模型深度介入后,问题性质发生了根本性改变。

“GPU 富人”也出来找算力了。

Claude Code 引入动态工作流,用于并行代理协调。

这次的 Summit 是 Snowflake 办过最大的一届——现场两万多人,七百多位演讲嘉宾、五百多场分论坛。主题为: Making AI Real for Business(让 AI 在业务里真的有用)。

本次硅谷行,以参加 Snowflake Summit 为主展开,联合极客邦、TGO 鲲鹏会深度合作共同发起硅谷参访奇遇团。最初我们只是计划一场仅七人的小型核心出行、观展学习。

昨天下午,我在 Snowflake 的办公室参加了一场华人技术圈的聚会。三四十个人,开放麦,谁想讲就把话筒接过去。坐在那屋子里的,多是中国在硅谷最能打的一批技术人——做支付的、做数据库的、做 AI 视频的、还有美国各大名校的中国学生,履历单拎一个出来都很硬。

本文的核心观点是:要构建一个可靠且高速的自动化未来,我们必须停止扩展以 DOM 为中心的抽象模型,转而建立一种基于感知和意图的新测试范式。

ClickHouse 现已 集成了一个 重新设计的、由倒排索引 (inverted indexes) 驱动的全文搜索功能。但与传统搜索引擎不同的是,匹配的文档会直接送入其原有的向量化分析引擎 (vectorized analytical engine),该引擎在过滤、聚合和大规模扫描方面已 表现出色。

安全研究员 Piyush Gupta 发现,在 AWS HTTP API 的 API 路径末尾添加一个斜杠,即可完全绕过 Lambda 授权程序的身份验证。

“今天 Agent 毫无疑问是每一家模型所发力的重点。”

对企业而言,数据库技术选型一直是一道头疼的难题。随着业务场景的不断分化,一套通用的数据库方案已经很难同时满足业务需求。有些场景希望数据库足够轻量、部署简单、成本可控;有些场景希望数据库能伸能缩、扩容平滑;有些场景希望数据库生态完整、工具齐全。

发布文章 +【月更】标签参与活动,赢得 InfoQ 定制好礼

年限本身不能证明什么。真正能证明一个人的,是他有没有在这些年里形成可复用的经验、可展示的作品、可迁移的能力,以及可被别人信任的结果。

世界模型火了。但其实际概念一直众说纷纭,让人摸不着头脑。

近日,开发平台 GitLab 宣布已裁减约 14% 的员工,约 350 人,这是其上个月详细披露的广泛重组计划的一部分。

拖尾请求指的是完成时间异常缓慢但最终成功完成的请求。在扇出(fan-out)架构中,它们才是 p99 延迟的主要来源。重试机制则会向已经备受压力的后端增加额外负载,从而使问题进一步恶化。 在一个包含 100 个下游服务的扇出架构中,如果每个服务的拖尾请求率为 1%,那么 63% 的顶层请求都会因为至少一个拖尾请求而被拖慢。因此,仅依赖单个服务的健康指标来诊断系统级尾部延迟往往具有误导性。 固定的请求对冲触发条件在测试环境中看起来效果显著,但在生产环境中往往难以长期奏效。因为负载变化、服务发布以及业务流量波动都会改变系统的延迟特征,这意味着触发条件需要持续人工调整,而现实中很少有团队能够长期维护这项工作。 DDSketch 提供了 O(1) 的分位数估计能力,并且内存占用恒定。它能够提供相对误差保证(±1%),非常适合实时追踪每台主机的延迟分布,每个请求仅增加约 35 纳秒的额外开销。 通过 Token Bucket(令牌桶)预算机制,将 Hedge 请求速率限制在总流量的一定比例以内,可以避免在真实故障期间出现负载翻倍的恶性循环。当所有请求都变慢时,Hedge 会自动停止,使服务能够以可控方式降级,而不是进一步放大问题。

2026 年初,小红书团队基于开源 Agent 框架 OpenClaw 启动 Seal 项目,核心选型逻辑:OpenClaw 具备多通道接入、技能(Skill)生态扩展、多 Agent 编排及企业级安全隔离能力。

本次分享将围绕“让 AI 写的黑盒代码也能安全上线”这一目标展开,重点介绍如何通过 Harness 体系建设,实现需求周期渗透率提升、链路 AI 采纳率提升,以及全链路迭代时长下降。

本次分享将围绕上海人工智能实验室在“安全即服务”方向的探索展开,介绍书安智能体操作系统在产业场景中的设计思路与实践经验

Vercel 推出开源 React 框架 Next.js 16.2 新版本,优化性能与调试体验、新增 AI 智能体配套工具,并完成 200 余项 Turbopack 修复优化。

架构变更案例拓展了架构决策记录(ADR)的设计思路,用于评估各项决策后续可能发生的变更,能够挖掘隐藏的预设条件,协助团队预估变更的撤回成本与可逆程度。

开启 Harness 后训练新范式

在 Summit 现场,极客邦创始人霍太稳 Kelvin、安克创新 CIO 龚银 Neil,以及数说故事创始人兼 CEO 徐亚波 Arber 围绕“AI 时代的组织升级”展开了一场长谈。三位嘉宾从 Snowflake Summit 的现场观察谈起,进一步讨论了 Agentic Enterprise、企业大脑、超级个人、蜂巢式组织、AI 时代 CTO 的新角色,以及中国企业在这一轮智能化浪潮中的机会。