2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么
开单效率暴增30倍!“数字销冠”的AI密码:飞桨+文心大模型双引擎驱动
开单效率暴增 30 倍!“数字销冠”的 AI 密码:飞桨 + 文心大模型双引擎驱动

通过语音录入、拍摄手写订单以及图片上传等方式,让销售人员服务单个火锅店客户下单的时间,从 5 分钟直线缩短至几秒,效率提升近 30 倍

亚马逊为 Bedrock AgentCore 引入 A2A 协议,打造可互操作的多智能体工作流
亚马逊为 Bedrock AgentCore 引入 A2A 协议,打造可互操作的多智能体工作流

亚马逊宣布 Amazon Bedrock AgentCore Runtime 支持 A2A 协议,使基于不同框架构建的智能体能够相互通信。

AnyLanguageModel:苹果平台本地和云端LLM的统一API
AnyLanguageModel:苹果平台本地和云端 LLM 的统一 API

苹果平台的开发人员在使用语言模型时经常面临一个碎片化的生态系统。AnyLanguageModel 是一个新发布的 Swift 包,它通过为本地和远程模型提供统一的 API 来简化集成。

无问芯穹完成近5亿元A+轮融资,加码Agentic Infra基础设施建设
无问芯穹完成近 5 亿元 A+ 轮融资,加码 Agentic Infra 基础设施建设

让云、端基础设施也成为智能体落地的试炼场,帮助智能体从演示品真正走向规模化的新质生产力,成为像水和电一样的基础资源并自然流入千行百业与千家万户。

新发布的面向令牌的对象表示法(TOON)有望通过减少令牌消耗来降低大型语言模型的成本
新发布的面向令牌的对象表示法(TOON)有望通过减少令牌消耗来降低大型语言模型的成本

最近发布的面向令牌的对象表示法(TOON)旨在成为一种支持模式识别的 JSON 替代方案,在保持相近精度的同时显著降低令牌消耗。虽然节省的令牌数量取决于数据结构,但部分基准测试表明,TOON 在某些场景下比 JSON 消耗的令牌少 40%,有可能节省大型语言模型(LLM)及推理成本。

谷歌云推出Bigtable分层存储
谷歌云推出 Bigtable 分层存储

最近,谷歌云推出了 Bigtable 分层存储的预览版。这项新功能允许开发人员在单个 Bigtable 实例中管理热数据和冷数据,在保证保所有数据可访问的同时优化成本。

规范驱动开发:瀑布模型回潮
规范驱动开发:瀑布模型回潮

敏捷方法早已淘汰了规范。我们真的需要让它死而复生吗?

Grafana Labs 发布 Mimir 3.0,推出全新架构以提升性能
Grafana Labs 发布 Mimir 3.0,推出全新架构以提升性能

本次版本采用全新的架构,将读写操作彻底分离,大幅提升了在大规模指标场景下的性能、可靠性和成本效率。

Cloudflare全球停机追踪到内部数据库更改
Cloudflare 全球停机追踪到内部数据库更改

Cloudflare 最近经历了一次由数据库权限更新引起的全球中断,在其 CDN 和安全服务中引发了广泛的 5xx 错误。

Uno Platform 6.4 与 Uno Platform Studio 2.0:.NET 10、VS2026 与 Agentic AI
Uno Platform 6.4 与 Uno Platform Studio 2.0:.NET 10、VS2026 与 Agentic AI

Uno Platform 团队同步发布了两个重要更新:平台框架的 6.4 版本,以及其高级工具套件 Uno Platform Studio 的 2.0 版本。

抛弃“级联”架构!快手OneRec用大模型重构推荐系统,服务成本降至1/10
抛弃“级联”架构!快手 OneRec 用大模型重构推荐系统,服务成本降至 1/10

快手科技副总裁、基础大模型及推荐模型负责人周国睿系统解析了推荐系统的范式革新、 OneRecV2 的 scaling 定制优化,以及 OneRec-Think 的“生成—理解”统一进展,为 AI 原生时代的推荐提供可复制的方法论。

MongoDB 存储引擎解密:底层原理 + 游戏行业落地优化案例| 腾讯云数据库 DBTalk
MongoDB 存储引擎解密:底层原理 + 游戏行业落地优化案例| 腾讯云数据库 DBTalk

扫码添加企微小助手,一键加入开发者专属企微群,即可免费获取讲师 PPT,助力学习高效进阶!

破解游戏行业高并发冲击难题:MongoDB精细化限流与无损迁移架构| 腾讯云数据库 DBTalk
破解游戏行业高并发冲击难题:MongoDB 精细化限流与无损迁移架构| 腾讯云数据库 DBTalk

扫码添加企微小助手,一键加入开发者专属企微群,即可免费获取讲师 PPT,助力学习高效进阶!

赋能游戏回档极致体验:揭秘腾讯 MongoDB 按 Key 闪回技术| 腾讯云数据库 DBTalk
赋能游戏回档极致体验:揭秘腾讯 MongoDB 按 Key 闪回技术| 腾讯云数据库 DBTalk

扫码添加企微小助手,一键加入开发者专属企微群,即可免费获取讲师 PPT,助力学习高效进阶!

SRE 智能体在金融核心系统的落地实践:DeepFlow 智能体的设计与思考|AICon北京
SRE 智能体在金融核心系统的落地实践:DeepFlow 智能体的设计与思考|AICon 北京

揭秘金融级 SRE 智能体内核:基于零侵扰 eBPF 与状态机化 LLM 推理的闭环自治实践。

用AI“打开”金融市场黑盒:微软亚洲研究院如何构建订单级仿真引擎
用 AI“打开”金融市场黑盒:微软亚洲研究院如何构建订单级仿真引擎

InfoQ 荣幸邀请到了微软亚洲研究院机器学习组首席研究员刘炜清在 AICon 全球人工智能开发与应用大会上分享《MarS:由生成式基础模型驱动的金融市场仿真引擎》,他分享了团队在“AI for Finance”上的探索:通过构建基于订单级原生数据的金融基座模型与可自动迭代的 Agent 流程,实现了高保真市场模拟与高效决策优化。

英伟达Run:ai没做到的,被华为开源方案实现了
英伟达 Run:ai 没做到的,被华为开源方案实现了

为推动 AI 行业化落地,Flex:ai 选择了更彻底的开源路线

Win11 已近乎“残废”?微软承认多个核心功能崩盘,锅要甩给 AI 编程吗?
Win11 已近乎“残废”?微软承认多个核心功能崩盘,锅要甩给 AI 编程吗?

在应用 2025 年 7 月及之后发布的每月累积更新后,包括“开始 " 菜单、任务栏、文件资源管理器和系统设置在内的 Windows 11 主要核心功能出现故障。

Olmo 3 发布:模型开发与训练全程透明开放
Olmo 3 发布:模型开发与训练全程透明开放

艾伦人工智能研究所发布开源语言模型系列 Olmo 3,向研究人员与开发者完整开放模型全生命周期。

xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态
xLLM 社区重磅首秀,揭秘大模型推理全景图与开源 AI Infra 生态

过去,AI Infra 基础设施的核心技术长期依赖国外开源框架(如 vLLM、SGLang、TensorRT-LLM 等)。随着 xLLM 等推理引擎的开源,将大大加速国产全栈 AI Infra 生态建设。

工作场景AI化,一个月花100美元订阅AI工具值吗?
工作场景 AI 化,一个月花 100 美元订阅 AI 工具值吗?

新的 AI 时代,组织形态应从“固态”向“液态”转型。

阿里千问进入电脑桌面,与夸克AI浏览器深度融合
阿里千问进入电脑桌面,与夸克 AI 浏览器深度融合

千问正在升级为阿里 C 端产品的核心 AI 引擎

开发者怒扒200家AI公司,73%“套壳”拿融资、服务溢价甚至高达千倍!创始人直接认了:大家都在撒谎
开发者怒扒 200 家 AI 公司,73%“套壳”拿融资、服务溢价甚至高达千倍!创始人直接认了:大家都在撒谎

200 家公司被曝仅 18 家真创新、38 家代码相似度超 90%,创始人只想“忽悠”到底?

从静态到自适应:Airbnb键值存储系统应对流量峰值的控制机制
从静态到自适应:Airbnb 键值存储系统应对流量峰值的控制机制

Airbnb 升级了其多租户键值存储 Mussel 的流量管理架构,用一个完全自适应的资源感知系统取代了针对每个客户端的静态速率限制。这次重新设计是为了在流量高峰期间仍然能够保持服务质量,保护关键工作流程,并确保成千上万的租户之间能够公平地使用其服务。

谷歌推出Code Wiki:一个基于AI的持续交互式代码文档系统
谷歌推出 Code Wiki:一个基于 AI 的持续交互式代码文档系统

谷歌推出了一个新平台 Code Wiki,旨在使软件文档与其所描述的代码始终保持同步。该系统为每个代码库生成一个结构化的维基——每次更改代码后会自动更新,并提供一个能够理解整个代码库的集成聊天界面。目前,面向开源项目的公开预览版旨在消除软件开发中最昂贵的其中一个瓶颈:阅读和理解现有代码。

KubeCon NA 2025:探讨生成式AI时代的工具
KubeCon NA 2025:探讨生成式 AI 时代的工具

生成式人工智能技术需要支持新的工作负载、流量模式和基础设施需求,并需要一套新的工具来应对 GenAI 时代。来自 Tetrate 的 Erica Hughberg 和来自彭博社的 Alexa Griffith 在 2025 年北美 KubeCon + CloudNativeCon 会议上讨论了构建大规模提供模型推理服务的 GenAI 平台所需的条件。

万卡时代,企业需要怎样的算力集群?
万卡时代,企业需要怎样的算力集群?

AI 算力发展进入关键拐点,智算集群被视为应对算力供给的关键方案。