QCon 全球软件开发大会,将于 12 月在上海召开。英特尔软件与先进技术事业部 / 首席工程师胡宁馨将发表题为《WebNN,Web 端侧推理的未来》主题分享,探讨 WebNN API 的 W3C 标准进度,对 CNN,Transformer 以及更广泛的生成式 AI (Generative AI) 模型的支持情况和计划,以及在 Chrome,Edge 等浏览器的实现进展。
胡宁馨,就职于 Intel 软件与先进技术事业部,专注于 Web 技术,W3C 机器学习工作组 Web Neural Network API (WebNN) 规范的发起者和联合编辑,Chromium 项目 Code Committer,WebNN 模块负责人。他在本次会议的演讲内容如下:
演讲:WebNN,Web 端侧推理的未来
AI PC 以及 AI Mobile 的新兴时代已经到来,越来越多的设备集成了强大的神经处理单元 NPU,以实现高效的人工智能加速,这对需要端侧推理的应用至关重要。除了通过 CPU 和 GPU 进行推理之外,Web Neural Network API (WebNN) 提供了 Web 应用访问此类专有 AI 加速器 NPU 的途径,以获得卓越性能及更低功耗。
本次演讲将会给大家分享 WebNN API 的 W3C 标准进度,对 CNN,Transformer 以及更广泛的生成式 AI (Generative AI) 模型的支持情况和计划,以及在 Chrome,Edge 等浏览器的实现进展。作为 JavaScript ML 框架的后端,WebNN 将会在几乎不更改前端代码的前提下,为 Web 开发者及他们的产品带来相较于 Wasm,WebGL 更为优异的性能体验。
演讲提纲:
当前 Web AI 发展概况
主流硬件加速器的发展(CPU,GPU,NPU)
WebNN 设计与架构
WebNN 代码演示
WebNN 浏览器(Chromium)实现
WebNN 机器学习框架集成(ONNXRuntime 和 TensorFlowLite)
WebNN Transformers 支持
WebNN 性能
听众收益点:
○ 了解 Web 平台对异构处理器的支持
○ 了解基于 Web 的机器学习模型硬件加速
○ 了解 Chromium 实现内部细节
除上述演讲外,QCon 上海还将围绕 GenAI和通用大模型应用探索、AI Agent 与行业融合应用的前景、LLM 时代的性能优化、智能化信创软件 IDE、面向人工智能时代的架构、性能工程:提升效率和创新的新方法等专题进行交流。
QCon 上海 2023,相约 12 月! 现在购票,享 9 折优惠,立减¥680!咨询购票请联系:18514549229(微信同手机号)。
公众号推荐:
跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。
评论