如何理解神经网络里面的反向传播算法

如题所述

推荐答案 2015-12-02

　　反向传播算法（BP算法）主要是用于最常见的一类神经网络，叫多层前向神经网络，本质可以看作是一个general nonlinear estimator，即输入x_1 ... x_n 输出y，视图找到一个关系 y=f(x_1 ... x_n) （在这里f的实现方式就是神经网络）来近似已知数据。为了得到f中的未知参数的最优估计值，一般会采用最小化误差的准则，而最通常的做法就是梯度下降，到此为止都没问题，把大家困住了很多年的就是多层神经网络无法得到显式表达的梯度下降算法！

　　BP算法实际上是一种近似的最优解决方案，背后的原理仍然是梯度下降，但为了解决上述困难，其方案是将多层转变为一层接一层的优化：只优化一层的参数是可以得到显式梯度下降表达式的；而顺序呢必须反过来才能保证可工作——由输出层开始优化前一层的参数，然后优化再前一层……跑一遍下来，那所有的参数都优化过一次了。但是为什么说是近似最优呢，因为数学上除了很特殊的结构，step-by-step的优化结果并不等于整体优化的结果！不过，好歹现在能工作了，不是吗？至于怎么再改进（已经很多改进成果了），或者采用其他算法（例如智能优化算法等所谓的全局优化算法，就算是没有BP这个近似梯度下降也只是局部最优的优化算法）那就是新的研究课题了。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://66.wendadaohang.com/zd/Usx2piDn2xiiUUxsDn9.html

其他回答

第1个回答 2019-10-01

反向传播算法（Backpropagation）是目前用来训练人工神经网络（Artificial
Neural
Network，ANN）的最常用且最有效的算法。其主要思想是：
（1）将训练集数据输入到ANN的输入层，经过隐藏层，最后达到输出层并输出结果，这是ANN的前向传播过程；
（2）由于ANN的输出结果与实际结果有误差，则计算估计值与实际值之间的误差，并将该误差从输出层向隐藏层反向传播，直至传播到输入层；
（3）在反向传播的过程中，根据误差调整各种参数的值；不断迭代上述过程，直至收敛。
反向传播算法的思想比较容易理解，但具体的公式则要一步步推导，因此本文着重介绍公式的推导过程。
1.
变量定义
上图是一个三层人工神经网络，layer1至layer3分别是输入层、隐藏层和输出层。如图，先定义一些变量：
表示第层的第个神经元连接到第层的第个神经元的权重；
表示第层的第个神经元的偏置；
表示第层的第个神经元的输入，即：
表示第层的第个神经元的输出，即：
其中表示激活函数。
2.
代价函数
代价函数被用来计算ANN输出值与实际值之间的误差。常用的代价函数是二次代价函数（Quadratic
cost
function）：
其中，表示输入的样本，表示实际的分类，表示预测的输出，表示神经网络的最大层数。
3.
公式及其推导
本节将介绍反向传播算法用到的4个公式，并进行推导。如果不想了解公式推导过程，请直接看第4节的算法步骤。
首先，将第层第个神经元中产生的错误（即实际值与预测值之间的误差）定义为：
本文将以一个输入样本为例进行说明，此时代价函数表示为：
公式1（计算最后一层神经网络产生的错误）：
其中，表示Hadamard乘积，用于矩阵或向量之间点对点的乘法运算。公式1的推导过程如下：
公式2（由后往前，计算每一层神经网络产生的错误）：
推导过程：
公式3（计算权重的梯度）：
推导过程：
公式4（计算偏置的梯度）：
推导过程：
4.
反向传播算法伪代码
输入训练集
对于训练集中的每个样本x，设置输入层（Input
layer）对应的激活值：
前向传播：
，
计算输出层产生的错误：
反向传播错误：

相似回答

如何理解神经网络里面的反向传播算法答：反向传播算法（BP算法）主要是用于最常见的一类神经网络，叫多层前向神经网络，本质可以看作是一个general nonlinear estimator，即输入x_1 ... x_n 输出y，视图找到一个关系 y=f(x_1 ... x_n) （在这里f的实现方式就是神经网络）来近似已知数据。为了得到f中的未知参数的最优估计值，一般会...

反向传播是什么意思?答：反向传播，适合于多层神经元网络的一种学习算法，它建立在梯度下降法的基础上。BP网络的输入输出关系实质上是一种映射关系：一个n输入m输出的BP神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射，这一映射具有高度非线性。它的信息处理能力来源于简单非线性函数的多次复合，因此具有...

读懂反向传播算法(bp算法)答：我们知道神经网络都是有一个loss函数的。这个函数根据不同的任务有不同的定义方式，但是这个loss函数的目的就是计算出当前神经网络建模出来输出的数据和理想数据之间的距离。计算出loss之后，根据反向传播算法就可以更新网络中的各种参数以此使loss不断下降，即可使输出的数据更加理想。所以，现在的任务是，...

一文彻底搞懂BP算法:原理推导+数据演示+项目实战(上篇)答：下面是基于随机梯度下降更新参数的反向传播算法：单纯的公式推导看起来有些枯燥，下面我们将实际的数据带入图1所示的神经网络中，完整的计算一遍。我们依然使用如图5所示的简单的神经网络，其中所有参数的初始值如下：输入的样本为（假设其真实类标为"1"）：第一层网络的参数为：第二层网络的参数为：第...

如何理解神经网络里面的反向传播算法答：好拗口，好难理解啊，看下式：大体也就是这么个情况，具体的步骤为：1.利用前向传播算法，计算出每个神经元的输出 2.对于输出层的每一个输出，计算出其所对应的误差 3.计算出每个神经元的错误变化率即：4.计算CostFunction的微分，即：

神经网络基础6 - 反向传播答：学习反向传播，要先了解一下正向传播，举个例子，假设你在在超市买了 2 个 100 元一个的苹果，消费税是 10%，请计算支付金额，我们可以通过下面这个计算图求出最终的结果。图中有两个乘法节点，边上的数字从左到右流动，当数据流过乘法节点时，就会执行乘法操作，然后把计算的结果放到节点右边...

大家正在搜

bp神经网络反向传播算法卷积神经网络反向传播bp算法推导神经网络的反向传播神经网络反向传播公式的推导神经网络反向传播推导神经网络反向传播例题神经网络反向传播公式 bp神经网络反向传播误差反向传播神经网络