2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

英特尔软件与先进技术事业部 / 首席工程师胡宁馨确认出席 QCon 上海,分享 WebNN,Web 端侧推理的未来

  • 2023-12-08
    北京
  • 本文字数:882 字

    阅读完需:约 3 分钟

大小:461.05K时长:02:37
英特尔软件与先进技术事业部 / 首席工程师胡宁馨确认出席 QCon 上海,分享 WebNN,Web 端侧推理的未来

QCon 全球软件开发大会,将于 12 月在上海召开。英特尔软件与先进技术事业部 / 首席工程师胡宁馨将发表题为《WebNN,Web 端侧推理的未来》主题分享,探讨 WebNN API 的 W3C 标准进度,对 CNN,Transformer 以及更广泛的生成式 AI (Generative AI) 模型的支持情况和计划,以及在 Chrome,Edge 等浏览器的实现进展。


胡宁馨,就职于 Intel 软件与先进技术事业部,专注于 Web 技术,W3C 机器学习工作组 Web Neural Network API (WebNN) 规范的发起者和联合编辑,Chromium 项目 Code Committer,WebNN 模块负责人。他在本次会议的演讲内容如下:


演讲:WebNN,Web 端侧推理的未来


AI PC 以及 AI Mobile 的新兴时代已经到来,越来越多的设备集成了强大的神经处理单元 NPU,以实现高效的人工智能加速,这对需要端侧推理的应用至关重要。除了通过 CPU 和 GPU 进行推理之外,Web Neural Network API (WebNN) 提供了 Web 应用访问此类专有 AI 加速器 NPU 的途径,以获得卓越性能及更低功耗。


本次演讲将会给大家分享 WebNN API 的 W3C 标准进度,对 CNN,Transformer 以及更广泛的生成式 AI (Generative AI) 模型的支持情况和计划,以及在 Chrome,Edge 等浏览器的实现进展。作为 JavaScript ML 框架的后端,WebNN 将会在几乎不更改前端代码的前提下,为 Web 开发者及他们的产品带来相较于 Wasm,WebGL 更为优异的性能体验。


演讲提纲:


  1. 当前 Web AI 发展概况

  2. 主流硬件加速器的发展(CPU,GPU,NPU)

  3. WebNN 设计与架构

  4. WebNN 代码演示

  5. WebNN 浏览器(Chromium)实现

  6. WebNN 机器学习框架集成(ONNXRuntime 和 TensorFlowLite)

  7. WebNN Transformers 支持

  8. WebNN 性能


听众收益点:


○ 了解 Web 平台对异构处理器的支持

○ 了解基于 Web 的机器学习模型硬件加速

○ 了解 Chromium 实现内部细节


除上述演讲外,QCon 上海还将围绕 GenAI和通用大模型应用探索AI Agent 与行业融合应用的前景LLM 时代的性能优化智能化信创软件 IDE面向人工智能时代的架构性能工程:提升效率和创新的新方法等专题进行交流。


QCon 上海 2023,相约 12 月! 现在购票,享 9 折优惠,立减¥680!咨询购票请联系:18514549229(微信同手机号)。



2023-12-08 11:3011277
用户头像

发布了 89 篇内容, 共 49.2 次阅读, 收获喜欢 12 次。

关注

评论

发布
暂无评论
发现更多内容

云原生训练营毕业总结

9527

Go 语言快速入门指南:Go 转 JSON

宇宙之一粟

Go JSON序列化 1月月更

三行代码下载抖音视频

你?

有传闻说,写好总结可以升职加薪?

程序人生

没有区块链,就没有元宇宙

CECBC

大画 Spark :: 网络(2)-下篇-通过网络收取消息的过程

dclar

大数据 spark 源代码 Spark 源码

毕业设计项目

panxiaochun

架构实战营

关于项目中 Repository 层的思考

CRMEB

小白都能吃透 Java IOl 流,最骚最全笔记,没有之一!2️⃣

XiaoLin_Java

记一次安全漏洞分析

网络安全学海

黑客 网络安全 信息安全 渗透测试 安全漏洞

Salesforce架构师的10大原则

俞凡

架构 大厂实践 Salesforce

火狐浏览器一败涂地?

Jackpop

Weblogic-SSRF漏洞复现

喀拉峻

网络安全 安全 信息安全

LabVIEW条形码识别(实战篇—5)

不脱发的程序猿

图像识别 机器视觉 图像处理 LabVIEW 条形码识别

低代码实现探索(十九)低代码的意义

零道云-混合式低代码平台

2021年行摄回忆录

穿过生命散发芬芳

盘点2021 1月月更

基于Amazon ECS Fargate构建Apache Superset

亚马逊云科技 (Amazon Web Services)

存储

【SpringCloud技术专题】「Gateway网关系列」微服务网关服务的Gateway全流程开发实践指南(2.2.X)

码界西柚

SpringCloud SpringCloud Gateway API Gateway 1月月更

王者荣耀商城异地多活架构设计

ren

模块九作业:设计电商秒杀系统

危险游戏

架构实战营

程序员的快乐,只需要这7款工具!

Jackpop

低代码实现探索(十八)流程中参数的初始化设计

零道云-混合式低代码平台

简讯:明道云近期荣获的三项荣誉

明道云

架构实战营 - 毕业设计

随风King

「架构实战营」

虚拟数字人发展提速 多家银行宣布“造人”

CECBC

如何保证消息消费时的幂等性?

JavaEdge

1月月更

Go编译原理系列5(抽象语法树构建)

书旅

Go 后端 编译原理 编译语言

偷偷看了同事的代码找到了优雅代码的秘密

慕枫技术笔记

后端 1月月更

ReactNative进阶(十七):RefreshControl 组件实现刷新效果

No Silver Bullet

1月月更 ReactNative RefreshControl

架构营模块九作业

GTiger

架构实战营

加速数字经济发展,2022更需要云上创新的稳定器与推动力

脑极体

英特尔软件与先进技术事业部 / 首席工程师胡宁馨确认出席 QCon 上海,分享 WebNN,Web 端侧推理的未来_架构_徐晓博_InfoQ精选文章