2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么
新发布的面向令牌的对象表示法(TOON)有望通过减少令牌消耗来降低大型语言模型的成本
新发布的面向令牌的对象表示法(TOON)有望通过减少令牌消耗来降低大型语言模型的成本

最近发布的面向令牌的对象表示法(TOON)旨在成为一种支持模式识别的 JSON 替代方案,在保持相近精度的同时显著降低令牌消耗。虽然节省的令牌数量取决于数据结构,但部分基准测试表明,TOON 在某些场景下比 JSON 消耗的令牌少 40%,有可能节省大型语言模型(LLM)及推理成本。

谷歌云推出Bigtable分层存储
谷歌云推出 Bigtable 分层存储

最近,谷歌云推出了 Bigtable 分层存储的预览版。这项新功能允许开发人员在单个 Bigtable 实例中管理热数据和冷数据,在保证保所有数据可访问的同时优化成本。

规范驱动开发:瀑布模型回潮
规范驱动开发:瀑布模型回潮

敏捷方法早已淘汰了规范。我们真的需要让它死而复生吗?

Grafana Labs 发布 Mimir 3.0,推出全新架构以提升性能
Grafana Labs 发布 Mimir 3.0,推出全新架构以提升性能

本次版本采用全新的架构,将读写操作彻底分离,大幅提升了在大规模指标场景下的性能、可靠性和成本效率。

Cloudflare全球停机追踪到内部数据库更改
Cloudflare 全球停机追踪到内部数据库更改

Cloudflare 最近经历了一次由数据库权限更新引起的全球中断,在其 CDN 和安全服务中引发了广泛的 5xx 错误。

Uno Platform 6.4 与 Uno Platform Studio 2.0:.NET 10、VS2026 与 Agentic AI
Uno Platform 6.4 与 Uno Platform Studio 2.0:.NET 10、VS2026 与 Agentic AI

Uno Platform 团队同步发布了两个重要更新:平台框架的 6.4 版本,以及其高级工具套件 Uno Platform Studio 的 2.0 版本。

抛弃“级联”架构!快手OneRec用大模型重构推荐系统,服务成本降至1/10
抛弃“级联”架构!快手 OneRec 用大模型重构推荐系统,服务成本降至 1/10

快手科技副总裁、基础大模型及推荐模型负责人周国睿系统解析了推荐系统的范式革新、 OneRecV2 的 scaling 定制优化,以及 OneRec-Think 的“生成—理解”统一进展,为 AI 原生时代的推荐提供可复制的方法论。

MongoDB 存储引擎解密:底层原理 + 游戏行业落地优化案例| 腾讯云数据库 DBTalk
MongoDB 存储引擎解密:底层原理 + 游戏行业落地优化案例| 腾讯云数据库 DBTalk

扫码添加企微小助手,一键加入开发者专属企微群,即可免费获取讲师 PPT,助力学习高效进阶!

破解游戏行业高并发冲击难题:MongoDB精细化限流与无损迁移架构| 腾讯云数据库 DBTalk
破解游戏行业高并发冲击难题:MongoDB 精细化限流与无损迁移架构| 腾讯云数据库 DBTalk

扫码添加企微小助手,一键加入开发者专属企微群,即可免费获取讲师 PPT,助力学习高效进阶!

赋能游戏回档极致体验:揭秘腾讯 MongoDB 按 Key 闪回技术| 腾讯云数据库 DBTalk
赋能游戏回档极致体验:揭秘腾讯 MongoDB 按 Key 闪回技术| 腾讯云数据库 DBTalk

扫码添加企微小助手,一键加入开发者专属企微群,即可免费获取讲师 PPT,助力学习高效进阶!

SRE 智能体在金融核心系统的落地实践:DeepFlow 智能体的设计与思考|AICon北京
SRE 智能体在金融核心系统的落地实践:DeepFlow 智能体的设计与思考|AICon 北京

揭秘金融级 SRE 智能体内核:基于零侵扰 eBPF 与状态机化 LLM 推理的闭环自治实践。

用AI“打开”金融市场黑盒:微软亚洲研究院如何构建订单级仿真引擎
用 AI“打开”金融市场黑盒:微软亚洲研究院如何构建订单级仿真引擎

InfoQ 荣幸邀请到了微软亚洲研究院机器学习组首席研究员刘炜清在 AICon 全球人工智能开发与应用大会上分享《MarS:由生成式基础模型驱动的金融市场仿真引擎》,他分享了团队在“AI for Finance”上的探索:通过构建基于订单级原生数据的金融基座模型与可自动迭代的 Agent 流程,实现了高保真市场模拟与高效决策优化。

英伟达Run:ai没做到的,被华为开源方案实现了
英伟达 Run:ai 没做到的,被华为开源方案实现了

为推动 AI 行业化落地,Flex:ai 选择了更彻底的开源路线

Win11 已近乎“残废”?微软承认多个核心功能崩盘,锅要甩给 AI 编程吗?
Win11 已近乎“残废”?微软承认多个核心功能崩盘,锅要甩给 AI 编程吗?

在应用 2025 年 7 月及之后发布的每月累积更新后,包括“开始 " 菜单、任务栏、文件资源管理器和系统设置在内的 Windows 11 主要核心功能出现故障。

Olmo 3 发布:模型开发与训练全程透明开放
Olmo 3 发布:模型开发与训练全程透明开放

艾伦人工智能研究所发布开源语言模型系列 Olmo 3,向研究人员与开发者完整开放模型全生命周期。

xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态
xLLM 社区重磅首秀,揭秘大模型推理全景图与开源 AI Infra 生态

过去,AI Infra 基础设施的核心技术长期依赖国外开源框架(如 vLLM、SGLang、TensorRT-LLM 等)。随着 xLLM 等推理引擎的开源,将大大加速国产全栈 AI Infra 生态建设。

工作场景AI化,一个月花100美元订阅AI工具值吗?
工作场景 AI 化,一个月花 100 美元订阅 AI 工具值吗?

新的 AI 时代,组织形态应从“固态”向“液态”转型。

阿里千问进入电脑桌面,与夸克AI浏览器深度融合
阿里千问进入电脑桌面,与夸克 AI 浏览器深度融合

千问正在升级为阿里 C 端产品的核心 AI 引擎

开发者怒扒200家AI公司,73%“套壳”拿融资、服务溢价甚至高达千倍!创始人直接认了:大家都在撒谎
开发者怒扒 200 家 AI 公司,73%“套壳”拿融资、服务溢价甚至高达千倍!创始人直接认了:大家都在撒谎

200 家公司被曝仅 18 家真创新、38 家代码相似度超 90%,创始人只想“忽悠”到底?

从静态到自适应:Airbnb键值存储系统应对流量峰值的控制机制
从静态到自适应:Airbnb 键值存储系统应对流量峰值的控制机制

Airbnb 升级了其多租户键值存储 Mussel 的流量管理架构,用一个完全自适应的资源感知系统取代了针对每个客户端的静态速率限制。这次重新设计是为了在流量高峰期间仍然能够保持服务质量,保护关键工作流程,并确保成千上万的租户之间能够公平地使用其服务。

谷歌推出Code Wiki:一个基于AI的持续交互式代码文档系统
谷歌推出 Code Wiki:一个基于 AI 的持续交互式代码文档系统

谷歌推出了一个新平台 Code Wiki,旨在使软件文档与其所描述的代码始终保持同步。该系统为每个代码库生成一个结构化的维基——每次更改代码后会自动更新,并提供一个能够理解整个代码库的集成聊天界面。目前,面向开源项目的公开预览版旨在消除软件开发中最昂贵的其中一个瓶颈:阅读和理解现有代码。

KubeCon NA 2025:探讨生成式AI时代的工具
KubeCon NA 2025:探讨生成式 AI 时代的工具

生成式人工智能技术需要支持新的工作负载、流量模式和基础设施需求,并需要一套新的工具来应对 GenAI 时代。来自 Tetrate 的 Erica Hughberg 和来自彭博社的 Alexa Griffith 在 2025 年北美 KubeCon + CloudNativeCon 会议上讨论了构建大规模提供模型推理服务的 GenAI 平台所需的条件。

万卡时代,企业需要怎样的算力集群?
万卡时代,企业需要怎样的算力集群?

AI 算力发展进入关键拐点,智算集群被视为应对算力供给的关键方案。

跨多云边界构建分布式事件驱动架构
跨多云边界构建分布式事件驱动架构

事件驱动架构——现代分布式系统的支柱,在多云环境中面临一系列特别的挑战。

InfraTalk直播第二期完整版|AI Infra如何以Agent为载体,构建算力的极致性价比方案
InfraTalk 直播第二期完整版|AI Infra 如何以 Agent 为载体,构建算力的极致性价比方案

AI 算力行业的发展方向、面临的挑战和解决方案。

在日常工作流程中将数据转化为智能 | 技术趋势
在日常工作流程中将数据转化为智能 | 技术趋势

对于所有企业用户而言,Snowflake Cortex Agents 让“AI 驱动的数据交互”变得简单。用户只需在 Microsoft 365 Copilot 或 Microsoft Teams 里使用日常语言,就能对 Snowflake 中的数据进行搜索、分析并生成洞见。

构建你的第一个 Snowflake 智能体:从概念到原型只需 3 步! | 技术实践
构建你的第一个 Snowflake 智能体:从概念到原型只需 3 步! | 技术实践

我们将基于 Snowflake 平台构建一个 AI 智能体,手把手带你创建一个医疗健康智能体,该智能体能够通过查询数据库提供与临床试验相关问题的答案。

人机协同构建10x组织效能和内容安全新范式|AICon北京
人机协同构建 10x 组织效能和内容安全新范式|AICon 北京

揭秘快手如何用大模型与多智能体,重构内容安全从“被动防御”到“主动免疫”的新范式。