李宏毅视频学习：BP算法_文化 & 方法_Alex-zhai_InfoQ精选文章

智能体刷屏的背后，是 AI 应用拐点的来临？AICon 北京站议程重磅公布，50+ 硬核分享不容错过了解详情 



 写点什么

登录/注册

李宏毅视频学习：BP算法

首先回顾梯度下降的流程：

BP 的一个核心方法就是运用 chain rule：

其中 [公式] 表示输出和真实 label 之间的差异，也就是 loss。

可以先拿上图的左上角部分分析，可将 loss 关于参数的导数通过 chain rule 分为两部分 [公式] 和 [公式] 。

下面分别来分析 forward pass 和 Backward pass：其中 forward pass 很好理解，就是连接权重的 input

比较难理解的是 Backward pass，其实也是一系列 chain rule。现在只有[公式] 和 [公式] 这两项是未知的，现在先假设这两项是已知的。

那么问题来了，怎么算[公式] 和 [公式] 这两项呢？这里分两种情况，第一种情况是当 [公式] 和 [公式] 后面直接通过激活函数得到输出时：这时候每一项都可以简单的算出来。

第二种情况不是 output 层的时候：其实就是根据递归的思想从后往前算。

所以 loss 关于某个参数 w 的微分形式为：

视频地址：https://www.bilibili.com/video/av48

本文转载自 Alex-zhai 知乎账号。

原文链接：https://zhuanlan.zhihu.com/p/84780891

评论

发布

暂无评论

MobPush智能推送系统的用户行为分析：驱动精准运营的核心引擎

MobTech袤博科技

DeepSeek冲击（含本地化部署实践）

京东科技开发者

报名开启丨Future.Industry 2025线上直播会议：探索AI、仿真与HPC的技术未来

Altair RapidMiner

AI HPC 知识图谱仿真 hyperworks

YashanDB共享集群

数据库 yashandb

企业要把DeepSeek部署到本地吗？

知识文档管理系统哪个好？对比25年主流11款

易成研发中心

文档管理系统

Vue3 基础概念与环境搭建

不在线第一只蜗牛

JavaScript vue.js

YashanDB实例架构

数据库 yashandb

53 倍性能提升！TiDB 全局索引如何优化分区表查询？

AI代码生成器如何降低系统复杂度

伤感汤姆布利柏

应用程序中的网络协议：原理、应用与挑战

运维有小邓

解剖DeepSeek四把刀，一场深到源码，大到行业，细到人心的手术盛宴

京东科技开发者

YashanDB主备高可用

数据库 yashandb

HarmonyOS 应用开发赋能套件：鸿蒙原生应用开发的 “神助攻”

HarmonyOS开发者

llama2 70B mindie推理开箱报错问题

瑞典头部直播方案供应商Intinor接入微帧视频编码，引领高清直播市场

微帧Visionular

HarmonyOS官网上线“稳定性”专栏助力更稳定流畅的鸿蒙原生应用开发

HarmonyOS开发者

Spring AI接入DeepSeek：快速打造微应用

京东科技开发者

设计模式3：代理、适配器、装饰器模式

设计模式代理模式

情人节用 DeepSeek+通义灵码玩花样！在 IDE 中使用满血版 DeepSeek R1 试试

阿里云云效

阿里云云原生通义灵码 AI程序员