type
status
date
slug
summary
tags
category
icon
password
Property
标量对向量求导
标量对向量求导,严格来说是实值函数对向量的求导。即定义实值函数 ,自变量是维向量,而输出是标量。对于一个给定的实值函数,如何求解呢?
首先想到的是基于矩阵求导的定义来做,由于所谓标量对向量的求导,其实就是标量对向量里的每个分量分别求导,最后把求导的结果排列在一起,按一个向量表示而已。那么可以将实值函数对向量的每一个分量来求导,最后找到规律,得到求导的结果向量。
首先看一个简单的例子: ,求解
根据定义,先对的第个分量进行求导,这是一个标量对标量的求导:
可见,对向量的第 个分量的求导结果就等于向量 的第 个分量。由于是分母布局,最后所有求导结果的分量组成的是一个 维向量。那么其实就是向量 。也就是说:
同样的思路,也可以直接得到:
同样的思路,也可以推导出:
再来看一个复杂一点点的例子: ,求解
对的第个分量进行求导如下:
这个第 个分量的求导结果稍微复杂些了,仔细观察一下,第一部分是矩阵的第列转置后和 相乘得到,第二部分是矩阵 的第 行和 相乘得到,排列好就是:
从上面可以看出,定义法求导对于简单的实值函数是很容易的,但是复杂的实值函数就算求出了任意一个分量的导数,要排列出最终的求导结果还挺麻烦的,因此需要找到其他的简便一些的方法来整体求导,而不是每次都先去针对任意一个分量,再进行排列。
标量对向量求导的一些基本法则
这些法则和标量对标量求导的过程类似
- 常量对向量的求导结果为0
- 线性法则:如果都是实值函数, 为常数,则:
- 乘法法则:如果都是实值函数,则:
要注意:如果不是实值函数,则不能这么使用乘法法则
- 除法法则:如果 都是实值函数,且 ,则:
标量对矩阵求导
标量对矩阵的求导问题,思路和标量对向量的求导是类似的,只是最后的结果是一个和自变量同型的矩阵。
以一个例子来说明: ,求解 是维向量, 是维向量, 是的矩阵
对矩阵 的任意一个位置的 求导,如下:
即求导结果在 位置的求导结果是 向量第 个分量和第个分量的乘积,将所有的位置的求导结果排列成一个 的矩阵,即为 ,这样最后的求导结果为:
简单的求导的确不难,但是如果是比较复杂的标量对矩阵求导,比如 ,对任意标量求导容易,排列起来还是蛮麻烦的,也就是遇到了和标量对向量求导一样的问题,定义法比较适合解决简单的问题,复杂的求导需要更简便的方法。
同时,标量对矩阵求导也有和对向量求导类似的基本法则
向量对向量求导
这里也同样给出向量对向量求导的定义法的具体例子。
先来一个简单的例子: ,其中 为的矩阵。 分别为 维向量。需要求导 ,根据定义,结果应该是一个 的矩阵
先求矩阵的第 行和向量的内积对向量的第 分量求导,用定义法求解过程如下:
可见矩阵 的第行和向量的内积对向量的第 分量求导的结果就是矩阵 的 位置的值。排列起来就是一个矩阵了,由于分子布局,所以排列出的结果是,而不是