偏导数&梯度 Partial Derivatives & Gradient

偏导数的定义与几何意义

偏导数

切片(固定一个变化量后的几何图形)的斜率/切向量。

输入的微小变化 输出对应变化 ,则偏导数为

补充:向量场的偏导 ,则偏导数 对应附加向量的 分量在 方向上的变化,偏导数 对应附加向量的 分量在 方向上的变化

全微分

全微分(所有自变量微小变化后的输出变化量)

各输入分量独立产生微小变化时,输出的总变化量为各分量变化效果的线性叠加

Nabla 算子

Nabla 算子

只对右侧函数作用偏导。 作用于函数 后得到一个向量场,例如 是二维平面上的梯度向量场。

方向导数

输入沿向量 发生微小变化

方向导数

对应输出变化了

则得到方向导数

梯度

梯度

,函数输出上升最快的方向,模长为上升速度(从方向导数定义可得到)

链式法则

链式法则本质是两层线性变换的复合 如 ,内部函数的变化量线性变换一次,外部函数的变化量进行一次线性变换,体现为雅可比矩阵相乘:

更为一般的书写

链式法则: