下载 InfoQ App >
随时随地获取最新技术资讯
演讲人:Jeff Barr
演讲人:胡一川,汤威,邹明远,王东旭
演讲人:杨皓然(不瞋)
策划:王玮
策划:刘杨楠

最近发布的面向令牌的对象表示法(TOON)旨在成为一种支持模式识别的 JSON 替代方案,在保持相近精度的同时显著降低令牌消耗。虽然节省的令牌数量取决于数据结构,但部分基准测试表明,TOON 在某些场景下比 JSON 消耗的令牌少 40%,有可能节省大型语言模型(LLM)及推理成本。

最近,谷歌云推出了 Bigtable 分层存储的预览版。这项新功能允许开发人员在单个 Bigtable 实例中管理热数据和冷数据,在保证保所有数据可访问的同时优化成本。

敏捷方法早已淘汰了规范。我们真的需要让它死而复生吗?

本次版本采用全新的架构,将读写操作彻底分离,大幅提升了在大规模指标场景下的性能、可靠性和成本效率。

Cloudflare 最近经历了一次由数据库权限更新引起的全球中断,在其 CDN 和安全服务中引发了广泛的 5xx 错误。

Uno Platform 团队同步发布了两个重要更新:平台框架的 6.4 版本,以及其高级工具套件 Uno Platform Studio 的 2.0 版本。

快手科技副总裁、基础大模型及推荐模型负责人周国睿系统解析了推荐系统的范式革新、 OneRecV2 的 scaling 定制优化,以及 OneRec-Think 的“生成—理解”统一进展,为 AI 原生时代的推荐提供可复制的方法论。

扫码添加企微小助手,一键加入开发者专属企微群,即可免费获取讲师 PPT,助力学习高效进阶!

扫码添加企微小助手,一键加入开发者专属企微群,即可免费获取讲师 PPT,助力学习高效进阶!

扫码添加企微小助手,一键加入开发者专属企微群,即可免费获取讲师 PPT,助力学习高效进阶!

揭秘金融级 SRE 智能体内核:基于零侵扰 eBPF 与状态机化 LLM 推理的闭环自治实践。

InfoQ 荣幸邀请到了微软亚洲研究院机器学习组首席研究员刘炜清在 AICon 全球人工智能开发与应用大会上分享《MarS:由生成式基础模型驱动的金融市场仿真引擎》,他分享了团队在“AI for Finance”上的探索:通过构建基于订单级原生数据的金融基座模型与可自动迭代的 Agent 流程,实现了高保真市场模拟与高效决策优化。

为推动 AI 行业化落地,Flex:ai 选择了更彻底的开源路线

在应用 2025 年 7 月及之后发布的每月累积更新后,包括“开始 " 菜单、任务栏、文件资源管理器和系统设置在内的 Windows 11 主要核心功能出现故障。

艾伦人工智能研究所发布开源语言模型系列 Olmo 3,向研究人员与开发者完整开放模型全生命周期。

过去,AI Infra 基础设施的核心技术长期依赖国外开源框架(如 vLLM、SGLang、TensorRT-LLM 等)。随着 xLLM 等推理引擎的开源,将大大加速国产全栈 AI Infra 生态建设。

新的 AI 时代,组织形态应从“固态”向“液态”转型。

千问正在升级为阿里 C 端产品的核心 AI 引擎

200 家公司被曝仅 18 家真创新、38 家代码相似度超 90%,创始人只想“忽悠”到底?

Airbnb 升级了其多租户键值存储 Mussel 的流量管理架构,用一个完全自适应的资源感知系统取代了针对每个客户端的静态速率限制。这次重新设计是为了在流量高峰期间仍然能够保持服务质量,保护关键工作流程,并确保成千上万的租户之间能够公平地使用其服务。

谷歌推出了一个新平台 Code Wiki,旨在使软件文档与其所描述的代码始终保持同步。该系统为每个代码库生成一个结构化的维基——每次更改代码后会自动更新,并提供一个能够理解整个代码库的集成聊天界面。目前,面向开源项目的公开预览版旨在消除软件开发中最昂贵的其中一个瓶颈:阅读和理解现有代码。

生成式人工智能技术需要支持新的工作负载、流量模式和基础设施需求,并需要一套新的工具来应对 GenAI 时代。来自 Tetrate 的 Erica Hughberg 和来自彭博社的 Alexa Griffith 在 2025 年北美 KubeCon + CloudNativeCon 会议上讨论了构建大规模提供模型推理服务的 GenAI 平台所需的条件。

AI 算力发展进入关键拐点,智算集群被视为应对算力供给的关键方案。

事件驱动架构——现代分布式系统的支柱,在多云环境中面临一系列特别的挑战。

AI 算力行业的发展方向、面临的挑战和解决方案。

模力工场 021 周 AI 应用榜来了~

对于所有企业用户而言,Snowflake Cortex Agents 让“AI 驱动的数据交互”变得简单。用户只需在 Microsoft 365 Copilot 或 Microsoft Teams 里使用日常语言,就能对 Snowflake 中的数据进行搜索、分析并生成洞见。

我们将基于 Snowflake 平台构建一个 AI 智能体,手把手带你创建一个医疗健康智能体,该智能体能够通过查询数据库提供与临床试验相关问题的答案。

揭秘快手如何用大模型与多智能体,重构内容安全从“被动防御”到“主动免疫”的新范式。