下载 InfoQ App >
随时随地获取最新技术资讯
演讲人:亚马逊云科技
演讲人:谢吉宝(唐三),贾安亚,王晓波 ,余锋(褚霸)
演讲人:Jeff Barr

腾讯 PCG 机器学习平台技术负责人袁镱分享了《一念 LLM 分布式推理优化实践》,他从 KV cache 全链路管理、算子封装与自研,到多维并行(PP/DP/EP)、MoE 负载均衡与 MLA、以及 PD 分离与多阶段流水线调度,给出了一套工程化解法。

全球最大 AI 初创企业之一或正筹备大型 IPO。

随着近期 Snowflake Intelligence 全面上市发布,前沿企业正从洞察迈向实质影响,实现智能的普及化访问,并在值得信赖的基础上获得行动信心。

Trae 架构师冯绪在 AICon 全球人工智能开发与应用大会·深圳站上分享了《Trae 插件在 Agent 代码编辑的落地实践》,他系统拆解 Apply 与 Search/Replace 的取舍、Cue 的智能补全机制,提供可复用的工程方法论。

这个加速器带来了显著的性能提升,与 CPU 执行相比速度提升了高达 100 倍,与 GPU 相比也提升了 10 倍。

存储短缺带来的焦虑,在 2026 年仍将延续。

在二手平台上有人挂出近 8000 元的价格,溢价超一倍

正在取代客服、重构程序员的工作模式…我们在直面 AI,也在通过 AI 重新面对世界。》,敬请期待!

谷歌发布 Private AI Compute。该系统旨在使用 Gemini 云模型处理 AI 请求,同时保护用户数据隐私。

大模型驱动用户研究 Agent 的业务实践与挑战。

Altman 今年买买买~

“但是,我们不想让用户和社区经历‘Bun,一家风投支持的初创公司苦苦探索变现模式’的戏码”

re:Invent 社交热潮来袭!捕捉开发者们结识新友、畅谈技术的珍贵瞬间~

当亚马逊云科技再次拿到行业叙事的“麦克”,云计算的演进主线被定义得更加具体——这一次,亚马逊云科技 CEO Matt Garman 在 Keynote 上的所有发布,几乎都是围绕 Agentic AI 的落地展开。

“一个正常运转的组织是如何能犯下如此多令人啼笑皆非的低级错误。”

Gemini 在数据上第一次“反超”了 ChatGPT。

我们把这次对话拆成两条贯穿全文的叙事线:一条是他的技术与世界观,另一条来自装机过程中的细节与吐槽。

随着我国老龄化进程持续加快,超 2.8 亿中老年人的健康管理需求日益迫切。如何让科技真正服务于“银发群体”,成为数字时代的重要课题。

狂欢上线!沉浸式围观 re:Invent 炸场名场面,每一张都藏着黑科技暴击!

每隔 3.5 个月,即可用一半参数量的模型实现当前最优性能。

“我就想让你做你觉得有趣、重要的事情”

由来自荣耀、华为与京东等企业的多位专家,从不同业务视角拆解搜广推系统在大模型时代的演进与难点。

re:Invent 特别企划之“五天五问”Day 1 异见与共识

这项新功能将云原生桌面虚拟化技术引入了现有的本地基础设施。

苹果此次人事调整之前,通用汽车、Meta、英特尔等多家企业也先后宣布其 AI 负责人离职。

该功能让开发人员能够连接到在 Cloudflare 账户中部署的生产资源,从而不必再使用本地模拟。

在人工智能加速渗透各行各业的 2025 年,企业如何构建高效、智能的数据基础设施成为核心议题。

以可信数据、模型、决策为支柱,从企业智能体迈向个人代理时代的洞见与实践。

re:Invent 首日,随机采访来自世界各地的开发者,听听他们的所见、所闻、所感~

模力工场 022 周 AI 应用榜来了~