写点什么
AI 的“脑回路”终于能看见了?OpenAI发布稀疏模型,让推理透明化
AI 的“脑回路”终于能看见了?OpenAI 发布稀疏模型,让推理透明化

神经网络正在推动最强大的人工智能系统,但我们仍无法真正“读懂”它们是如何得出答案的。最大的黑箱。的权重为 0。

2025中国企业AI办公数字化白皮书2025中国企业AI办公数字化白皮书
2025 中国企业 AI 办公数字化白皮书

深度解析企业智能办公数字化趋势、市场现状、产业链全景与落地实践案例

又一数据分析智能体重磅开源,现已登顶BIRD!非专业人员也能轻松查阅和分析数据
又一数据分析智能体重磅开源,现已登顶 BIRD!非专业人员也能轻松查阅和分析数据

SQL 全套论文、代码、模型和使用指南。该智能体技术可让非专业人员通过日常语言进行商业数据查询和分析,为企业数智化提供更精准可用的智能数据分析基座。

re:Invent特别企划之“五天五问”⑤《遗忘与行动》上线!
re:Invent 特别企划之“五天五问”⑤《遗忘与行动》上线!

天的信息总量,他们带走了多少?又有哪些收获?re:Invent 特别企划之“五天五问”正片上线,第五期话题聚焦《遗忘与行动》!

亚马逊云科技推出数据库节省计划,提供高达35%的成本降低和引擎灵活性
亚马逊云科技推出数据库节省计划,提供高达 35% 的成本降低和引擎灵活性

亚马逊云科技最近宣布了为其数据库服务推出数据库节省计划,包括 Aurora、DynamoDB、DocumentDB 和 Neptune。

基于 SGlang RBG + Mooncake 打造生产级云原生大模型推理平台
基于 SGlang RBG + Mooncake 打造生产级云原生大模型推理平台

只有将高性能系统设计与云原生运维能力深度融合,才能让大模型推理真正从能用走向好用,从实验室走向生产级。

InfoQ Dev Summit 慕尼黑站:五个常见的 AI 安全误区被打破
InfoQ Dev Summit 慕尼黑站:五个常见的 AI 安全误区被打破

Jarmul 指出,当前的 AI 安全方法过度依赖技术手段,却忽视了根本性风险。

Snowflake 模型注册表——在 Snowflake 数据云与 AI 云自建部署 LLM 的便捷工具 | 技术实践
Snowflake 模型注册表——在 Snowflake 数据云与 AI 云自建部署 LLM 的便捷工具 | 技术实践

本文将探讨为何要让模型“靠近”数据、Snowflake 容器服务(SPCS)如何实现这一目标,以及如何通过 vLLM 等特定架构实现快速且经济高效的部署。

tRPC-Agent:腾讯多智能体框架的架构设计与业务实践 |AICon 北京
tRPC-Agent:腾讯多智能体框架的架构设计与业务实践 |AICon 北京

自主决策 + 图编排:揭秘腾讯 tRPC-Agent 的架构与业务价值。

Lambda持久函数与Werner Vogels的最后一次主题演讲:亚马逊云科技re:Invent 2025的亮点
Lambda 持久函数与 Werner Vogels 的最后一次主题演讲:亚马逊云科技 re:Invent 2025 的亮点

2025 年版的 re:Invent 最近在拉斯维加斯举行。正如预期的那样,AI 是主题演讲的重要焦点,但社区对无服务器领域的公告更感兴趣,包括 Lambda Managed Instances 和 Lambda Durable Functions。这次大会标志着亚马逊首席技术官 Werner Vogels 在 14 年后的最后一次主题演讲。

re:Invent特别企划 Drunk Coding 之「神」出「鬼」没奇妙夜 正片上线!
re:Invent 特别企划 Drunk Coding 之「神」出「鬼」没奇妙夜 正片上线!

你负责天马行空,Kiro 负责随性落地——敬那些被清醒时“最佳实践”所封印的原始灵感库。正片上线!

告别深夜改Bug!CodeGenie帮你快速“驯服”鸿蒙编译错误!
告别深夜改 Bug!CodeGenie 帮你快速“驯服”鸿蒙编译错误!

「编译报错 AI 修复」是 CodeGenie 团队在 AI 辅助编程领域的最新探索,期待在开发者社区听到你的真实体验。

从点播到直播:Netflix在1分钟内向一亿台设备推送直播流
从点播到直播:Netflix 在 1 分钟内向一亿台设备推送直播流

本文深入探讨了它的架构设计、低延迟流水线、自适应码率流媒体技术及运营监控体系,这些能力共同保障了全球范围内可靠、可扩展且高度同步的直播事件体验。

Discord 如何将其机器学习平台从单 GPU 工作流扩展到共享 Ray 集群
Discord 如何将其机器学习平台从单 GPU 工作流扩展到共享 Ray 集群

这些改进让大型模型能够实现每日重训,并带来了关键广告排序指标 200% 的提升。

打造人人都喜爱的支付宝,AI 驱动支付宝细分人群增长|AICon北京
打造人人都喜爱的支付宝,AI 驱动支付宝细分人群增长|AICon 北京

从通用架构到千人千面,AI 如何驱动支付宝细分人群增长。

用 AI 操作 GUI,飞猪以 GUI Agent 重塑流程自动化与交付效率 |AICon 北京
用 AI 操作 GUI,飞猪以 GUI Agent 重塑流程自动化与交付效率 |AICon 北京

告别传统 RPA:飞猪 GUI Agent 用 AI 重构 GUI 自动化新范式。

re:Invent特别企划之五天五问④《视野的合流》正片上线!
re:Invent 特别企划之五天五问④《视野的合流》正片上线!

视野的合流从不是同质化的复制,而是不同价值的共生——当每一种实践都被理解、每一份优势都被融合,AI 的创新之路,终将因共生而走得更稳、更远。

Svelte 团队成员开源新框架 Ripple,又一个想“改写前端”的框架?
Svelte 团队成员开源新框架 Ripple,又一个想“改写前端”的框架?

Ripple 是一个融合 React、SolidJS 与 Svelte 思路的新前端框架,以 TypeScript 为核心,提供细粒度响应式和编译式 JSX 语法,直连 DOM 并支持 AI 调试。

“决战紫金之巅”再结硕果!6 个项目签约,最高 500 万补贴助力发展!
“决战紫金之巅”再结硕果!6 个项目签约,最高 500 万补贴助力发展!

12 月 12 日,决战紫金之巅——云谷杯・2025 人工智能应用创新创业大赛总决赛暨闭幕式在云谷中心举办。

re:Invent特别企划之五天五问③《选择即创造》正片上线!
re:Invent 特别企划之五天五问③《选择即创造》正片上线!

AI 把工具递到面前,我们要选什么领域扎根?提供了无数的实现可能,但到底如何实现决定性一跃?re:Invent 特别企划之五天五问《选择即创造》正片上线!

Replit为多模型开发引入了新的AI集成
Replit 为多模型开发引入了新的 AI 集成

Replit 引入了 Replit AI 集成,该功能允许用户直接在 IDE 中选择第三方模型,并自动生成运行推理所需的代码。该更新删除了通常需要连接到外部 AI 服务的许多手动设置。开发人员无需配置 API 密钥、处理身份验证或编写样板请求代码,而是可以依靠 Replit 的环境在后台管理这些步骤。

IDC MarketScape: 容联云位居“中国AI赋能的联络中心”领导者类别
IDC MarketScape: 容联云位居“中国 AI 赋能的联络中心”领导者类别

容联云位居 IDC MarketScape 中国 AI 赋能的联络中心领导者类别。

Vike发布Photon平台,搭载新一代JavaScript部署基础设施并集成Cloudflare服务
Vike 发布 Photon 平台,搭载新一代 JavaScript 部署基础设施并集成 Cloudflare 服务

Vike 推出 Photon,这是一个可以在任何平台上部署 JavaScript 服务器的下一代基础设施。Photon 标志着开发人员在服务器部署与集成方式上的重大转变。

装机量超2000万、全球主流GPU与AI框架“开箱即用”!OpenCloudOS成AI时代优先选项
装机量超 2000 万、全球主流 GPU 与 AI 框架“开箱即用”!OpenCloudOS 成 AI 时代优先选项

尽管企业仍持续不断地加大硬件投入,但行业数据显示,GPU 有效利用率长期徘徊在 30% 以下。

JFrog推出“影子AI检测”功能,助力企业应对软件供应链中的隐性AI风险
JFrog 推出“影子 AI 检测”功能,助力企业应对软件供应链中的隐性 AI 风险

JFrog 推出“影子 AI 检测”功能,助力企业应对软件供应链中的隐性 AI 风险。

紧急补丁——React服务器函数中的严重漏洞CVE-2025-55182被主动利用
紧急补丁——React 服务器函数中的严重漏洞 CVE-2025-55182 被主动利用

11 月 29 日,Lachlan Davidson 报告了 React Server Components(RSC)中一个未经身份验证的远程代码执行(RCE)漏洞。该漏洞于 12 月 3 日公开披露,并被追踪为 CVE-2025-55182,具有最高严重性等级(10.0)。

OpenAI新的GPT-5.1模型更快、更具对话性
OpenAI 新的 GPT-5.1 模型更快、更具对话性

OpenAI 最近发布了他们 GPT-5 模型的升级。GPT-5.1 即时版,即默认的聊天模型,对指令遵循进行了改进。GPT-5.1 思考版,即推理模型,速度更快,给出的回应更易于理解。GPT-5.1-Codex-Max,即编程模型,经过训练使用压缩技术来执行长期运行的任务。