下载 InfoQ App >
随时随地获取最新技术资讯
演讲人:Jeff Barr
演讲人:胡一川,汤威,邹明远,王东旭
演讲人:杨皓然(不瞋)
策划:王玮
策划:刘杨楠

AI 芯片迎来 “三国杀” 时代?

如何让 AI 真正理解创作意图,实现精准、可控的生成?

通过语音录入、拍摄手写订单以及图片上传等方式,让销售人员服务单个火锅店客户下单的时间,从 5 分钟直线缩短至几秒,效率提升近 30 倍

亚马逊宣布 Amazon Bedrock AgentCore Runtime 支持 A2A 协议,使基于不同框架构建的智能体能够相互通信。

苹果平台的开发人员在使用语言模型时经常面临一个碎片化的生态系统。AnyLanguageModel 是一个新发布的 Swift 包,它通过为本地和远程模型提供统一的 API 来简化集成。

让云、端基础设施也成为智能体落地的试炼场,帮助智能体从演示品真正走向规模化的新质生产力,成为像水和电一样的基础资源并自然流入千行百业与千家万户。

最近发布的面向令牌的对象表示法(TOON)旨在成为一种支持模式识别的 JSON 替代方案,在保持相近精度的同时显著降低令牌消耗。虽然节省的令牌数量取决于数据结构,但部分基准测试表明,TOON 在某些场景下比 JSON 消耗的令牌少 40%,有可能节省大型语言模型(LLM)及推理成本。

最近,谷歌云推出了 Bigtable 分层存储的预览版。这项新功能允许开发人员在单个 Bigtable 实例中管理热数据和冷数据,在保证保所有数据可访问的同时优化成本。

敏捷方法早已淘汰了规范。我们真的需要让它死而复生吗?

本次版本采用全新的架构,将读写操作彻底分离,大幅提升了在大规模指标场景下的性能、可靠性和成本效率。

Cloudflare 最近经历了一次由数据库权限更新引起的全球中断,在其 CDN 和安全服务中引发了广泛的 5xx 错误。

Uno Platform 团队同步发布了两个重要更新:平台框架的 6.4 版本,以及其高级工具套件 Uno Platform Studio 的 2.0 版本。

快手科技副总裁、基础大模型及推荐模型负责人周国睿系统解析了推荐系统的范式革新、 OneRecV2 的 scaling 定制优化,以及 OneRec-Think 的“生成—理解”统一进展,为 AI 原生时代的推荐提供可复制的方法论。

扫码添加企微小助手,一键加入开发者专属企微群,即可免费获取讲师 PPT,助力学习高效进阶!

扫码添加企微小助手,一键加入开发者专属企微群,即可免费获取讲师 PPT,助力学习高效进阶!

扫码添加企微小助手,一键加入开发者专属企微群,即可免费获取讲师 PPT,助力学习高效进阶!

揭秘金融级 SRE 智能体内核:基于零侵扰 eBPF 与状态机化 LLM 推理的闭环自治实践。

InfoQ 荣幸邀请到了微软亚洲研究院机器学习组首席研究员刘炜清在 AICon 全球人工智能开发与应用大会上分享《MarS:由生成式基础模型驱动的金融市场仿真引擎》,他分享了团队在“AI for Finance”上的探索:通过构建基于订单级原生数据的金融基座模型与可自动迭代的 Agent 流程,实现了高保真市场模拟与高效决策优化。

为推动 AI 行业化落地,Flex:ai 选择了更彻底的开源路线

在应用 2025 年 7 月及之后发布的每月累积更新后,包括“开始 " 菜单、任务栏、文件资源管理器和系统设置在内的 Windows 11 主要核心功能出现故障。

艾伦人工智能研究所发布开源语言模型系列 Olmo 3,向研究人员与开发者完整开放模型全生命周期。

过去,AI Infra 基础设施的核心技术长期依赖国外开源框架(如 vLLM、SGLang、TensorRT-LLM 等)。随着 xLLM 等推理引擎的开源,将大大加速国产全栈 AI Infra 生态建设。

新的 AI 时代,组织形态应从“固态”向“液态”转型。

千问正在升级为阿里 C 端产品的核心 AI 引擎

200 家公司被曝仅 18 家真创新、38 家代码相似度超 90%,创始人只想“忽悠”到底?

Airbnb 升级了其多租户键值存储 Mussel 的流量管理架构,用一个完全自适应的资源感知系统取代了针对每个客户端的静态速率限制。这次重新设计是为了在流量高峰期间仍然能够保持服务质量,保护关键工作流程,并确保成千上万的租户之间能够公平地使用其服务。

谷歌推出了一个新平台 Code Wiki,旨在使软件文档与其所描述的代码始终保持同步。该系统为每个代码库生成一个结构化的维基——每次更改代码后会自动更新,并提供一个能够理解整个代码库的集成聊天界面。目前,面向开源项目的公开预览版旨在消除软件开发中最昂贵的其中一个瓶颈:阅读和理解现有代码。

生成式人工智能技术需要支持新的工作负载、流量模式和基础设施需求,并需要一套新的工具来应对 GenAI 时代。来自 Tetrate 的 Erica Hughberg 和来自彭博社的 Alexa Griffith 在 2025 年北美 KubeCon + CloudNativeCon 会议上讨论了构建大规模提供模型推理服务的 GenAI 平台所需的条件。

AI 算力发展进入关键拐点,智算集群被视为应对算力供给的关键方案。