写点什么
关键技术详解|腾讯一念 LLM 分布式推理优化实践
关键技术详解|腾讯一念 LLM 分布式推理优化实践

腾讯 PCG 机器学习平台技术负责人袁镱分享了《一念 LLM 分布式推理优化实践》,他从 KV cache 全链路管理、算子封装与自研,到多维并行(PP/DP/EP)、MoE 负载均衡与 MLA、以及 PD 分离与多阶段流水线调度,给出了一套工程化解法。

“为什么”的机遇:利用真正的商业智能,从信号到行动 | 技术趋势
“为什么”的机遇:利用真正的商业智能,从信号到行动 | 技术趋势

随着近期 Snowflake Intelligence 全面上市发布,前沿企业正从洞察迈向实质影响,实现智能的普及化访问,并在值得信赖的基础上获得行动信心。

从补全到 Agentic Edit:Trae 在代码编辑上的落地与进化
从补全到 Agentic Edit:Trae 在代码编辑上的落地与进化

Trae 架构师冯绪在 AICon 全球人工智能开发与应用大会·深圳站上分享了《Trae 插件在 Agent 代码编辑的落地实践》,他系统拆解 Apply 与 Search/Replace 的取舍、Cue 的智能补全机制,提供可复用的工程方法论。

谷歌全新推出的LiteRT加速器为骁龙平台安卓设备的AI工作负载注入强劲动力
谷歌全新推出的 LiteRT 加速器为骁龙平台安卓设备的 AI 工作负载注入强劲动力

这个加速器带来了显著的性能提升,与 CPU 执行相比速度提升了高达 100 倍,与 GPU 相比也提升了 10 倍。

烧钱,能解决 AI 存储的焦虑吗?
烧钱,能解决 AI 存储的焦虑吗?

存储短缺带来的焦虑,在 2026 年仍将延续。

豆包手机底层系统被曝是锤子SmartisanOS!官方深夜回应微信登录异常等
豆包手机底层系统被曝是锤子 SmartisanOS!官方深夜回应微信登录异常等

在二手平台上有人挂出近 8000 元的价格,溢价超一倍

AI 早已不是远方的科技,而是触手可及的 “在手之物”
AI 早已不是远方的科技,而是触手可及的 “在手之物”

正在取代客服、重构程序员的工作模式…我们在直面 AI,也在通过 AI 重新面对世界。》,敬请期待!

Private AI Compute通过硬件隔离与临时数据设计实现谷歌推理
Private AI Compute 通过硬件隔离与临时数据设计实现谷歌推理

谷歌发布 Private AI Compute。该系统旨在使用 Gemini 云模型处理 AI 请求,同时保护用户数据隐私。

模型驱动的用户研究 Agent:真实业务的实践与挑战 |AICon北京
模型驱动的用户研究 Agent:真实业务的实践与挑战 |AICon 北京

大模型驱动用户研究 Agent 的业务实践与挑战。

OpenAI 收购了自己的“甲方”公司
OpenAI 收购了自己的“甲方”公司

Altman 今年买买买~

“天才少年”5年0收入造JS核武!Claude天价收购Bun,Node.js生态地震,AI工具链战争正式打响!
“天才少年”5 年 0 收入造 JS 核武!Claude 天价收购 Bun,Node.js 生态地震,AI 工具链战争正式打响!

“但是,我们不想让用户和社区经历‘Bun,一家风投支持的初创公司苦苦探索变现模式’的戏码”

re:Invent 2025 世界开发者说-DAY2 | 同频共振:在re:Invent现场,大家都在聊些什么?
re:Invent 2025 世界开发者说 -DAY2 | 同频共振:在 re:Invent 现场,大家都在聊些什么?

re:Invent 社交热潮来袭!捕捉开发者们结识新友、畅谈技术的珍贵瞬间~

当亚马逊云科技拿到“麦克”,一年的云计算叙事都被改写了
当亚马逊云科技拿到“麦克”,一年的云计算叙事都被改写了

当亚马逊云科技再次拿到行业叙事的“麦克”,云计算的演进主线被定义得更加具体——这一次,亚马逊云科技 CEO Matt Garman 在 Keynote 上的所有发布,几乎都是围绕 Agentic AI 的落地展开。

Zig 退出 GitHub:微软对AI 的痴迷毁了它
Zig 退出 GitHub:微软对 AI 的痴迷毁了它

“一个正常运转的组织是如何能犯下如此多令人啼笑皆非的低级错误。”

Linux之父:AI泡沫“病态扭曲、迟早暴跌”、马斯克式代码行 KPI“愚蠢到不该待在科技圈”
Linux 之父:AI 泡沫“病态扭曲、迟早暴跌”、马斯克式代码行 KPI“愚蠢到不该待在科技圈”

我们把这次对话拆成两条贯穿全文的叙事线:一条是他的技术与世界观,另一条来自装机过程中的细节与吐槽。

“通义科技助老”小程序正式上线:AI科技赋能银发关怀,智慧守护健康晚年
“通义科技助老”小程序正式上线:AI 科技赋能银发关怀,智慧守护健康晚年

随着我国老龄化进程持续加快,超 2.8 亿中老年人的健康管理需求日益迫切。如何让科技真正服务于“银发群体”,成为数字时代的重要课题。

🚀亚马逊云科技 2025 re:Invent 高光时刻 - DAY2!
🚀亚马逊云科技 2025 re:Invent 高光时刻 - DAY2!

狂欢上线!沉浸式围观 re:Invent 炸场名场面,每一张都藏着黑科技暴击!

大模型每百天性能翻倍!清华团队“密度法则”登上 Nature 子刊
大模型每百天性能翻倍!清华团队“密度法则”登上 Nature 子刊

每隔 3.5 个月,即可用一半参数量的模型实现当前最优性能。

生成式推荐与广告大模型的真实落地挑战 |InfoQ《极客有约》
生成式推荐与广告大模型的真实落地挑战 |InfoQ《极客有约》

由来自荣耀、华为与京东等企业的多位专家,从不同业务视角拆解搜广推系统在大模型时代的演进与难点。

re:Invent 特别企划之“五天五问”Day 1 异见与共识
re:Invent 特别企划之“五天五问”Day 1 异见与共识

re:Invent 特别企划之“五天五问”Day 1 异见与共识

Azure Virtual Desktop通过Arc-Enabled Servers实现完全混合部署
Azure Virtual Desktop 通过 Arc-Enabled Servers 实现完全混合部署

这项新功能将云原生桌面虚拟化技术引入了现有的本地基础设施。

库克怒换苹果AI一号位:谷歌系不行、找微软高管救火!Siri藏“大雷”全靠OS团队翻盘?
库克怒换苹果 AI 一号位:谷歌系不行、找微软高管救火!Siri 藏“大雷”全靠 OS 团队翻盘?

苹果此次人事调整之前,通用汽车、Meta、英特尔等多家企业也先后宣布其 AI 负责人离职。

Cloudflare推出远程绑定功能,助力本地开发
Cloudflare 推出远程绑定功能,助力本地开发

该功能让开发人员能够连接到在 Cloudflare 账户中部署的生产资源,从而不必再使用本地模拟。

锚定企业AI落地五大挑战,联想凌拓存储产品矩阵再升级
锚定企业 AI 落地五大挑战,联想凌拓存储产品矩阵再升级

在人工智能加速渗透各行各业的 2025 年,企业如何构建高效、智能的数据基础设施成为核心议题。

明略科技创始人、CEO兼CTO吴明辉确认出席AICon北京站,分享可信 Agent 的规模化之路
明略科技创始人、CEO 兼 CTO 吴明辉确认出席 AICon 北京站,分享可信 Agent 的规模化之路

以可信数据、模型、决策为支柱,从企业智能体迈向个人代理时代的洞见与实践。

re:Invent 2025 世界开发者说-DAY1 | 初入奇境:现场哪些瞬间让大家眼前一亮?
re:Invent 2025 世界开发者说 -DAY1 | 初入奇境:现场哪些瞬间让大家眼前一亮?

re:Invent 首日,随机采访来自世界各地的开发者,听听他们的所见、所闻、所感~