差/微分方程和指数矩阵
2022-3-9
| 2023-8-2
0  |  阅读时长 0 分钟
type
status
date
slug
summary
tags
category
icon
password
Property
 

差分方程

开始, ,所有 ,本例是一个一阶差分方程组。
要解此方程,需要将展开为矩阵特征向量的线性组合,即
于是
继续化简原式, 。用矩阵的方式同样可以得到该式:
那么如果要求 ,则只需要将 变为 ,而系数 与特征向量 均不变。
当真的要计算 时,就可以使用
 
 
一个斐波那契数列(Fibonacci sequence)的例子:
这个数列并不是稳定数列,因此特征值并不都小于一,这样才能保持增长。而他的增长速度,则由特征值来决定。
已知,但这不是 的形式,而且我们只要一个方程,而不是方程组,同时这是一个二阶差分方程(就像含有二阶导数的微分方程,希望能够化简为一阶倒数,也就是一阶差分)。
使用一个小技巧,令 ,再追加一个方程组成方程组: ,再把方程组用矩阵表达得到 ,于是得到了 ,把二阶标量方程(second-order scalar problem)转化为一阶向量方程组(first-order system)。
 
矩阵是一个对称矩阵,所以它的特征值将会是实数,且他的特征向量将会互相正交。
观察 ,与斐波那契数列的递归式 比较,发现这两个式子在项数与幂次上非常相近。
用求根公式解特征值得 ,得到两个不同的特征值,一定会有两个线性无关的特征向量,则该矩阵可以被对角化。
 
观察这个数列是如何增长的,数列增长由什么来控制?——特征值
哪一个特征值起决定性作用?——较大的一个
在幂增长中趋近于 ,所以近似的忽略该项,剩下较大的项,可以说数量增长的速度大约是 。这种问题与求解 不同,这是一个动态的问题, 的幂在不停的增长,而问题的关键就是这些特征值。
 
求解特征向量
,因为有根式且矩阵只有二阶,直接观察 ,由于 ,则其特征向量为,即
 
最后,计算初始项 ,现在将初始项用特征向量表示出来 ,计算系数得
 
回顾整个问题,对于动态增长的一阶方程组,初始向量是 ,关键在于确定 的特征值及特征向量。特征值将决定增长的趋势,发散至无穷还是收敛于某个值。接下来需要找到一个展开式,把 展开成特征向量的线性组合。
再下来就是套用公式,即 次方表达式 ,则有 ,代入特征值、特征向量得
最终结果为 ,原式的通解为
 
 
 

微分方程

方程组,系数矩阵,初始条件
这个初始条件的意义可以看做在开始时一切都在 中,但随着时间的推移,将有 ,因为 项初始为正, 中的事物会流向 。随着时间的发展可以追踪流动的变化。
 
 
特征值与特征向量
,这是一个奇异矩阵,,另一个特征值可以从迹得到
求特征向量: 时,求的零空间,时,求 的零空间, 的零空间为
方程组的通解为: ,通解的前后两部分都是该方程组的纯解,即方程组的通解就是两个与特征值、特征向量相关的纯解的线性组合。
 
  • 差分:解时得到
  • 微分:解 得到
 
继续求
时, ,所以
最终结果:
 
稳定性:这个流动过程从 开始,初始值的一部分流入初始值 中,经过无限的时间最终达到稳态 。所以,要使得 ,则需要负的特征值。
如果特征值为复数呢?
,计算 ,其中的 部分为 ,因为这部分的模为 ,这个虚部就在单位圆上转悠。所以只有实数部分才是重要的。所以可以把前面的结论改为需要实部为负数的特征值。实部会决定最终结果趋近于,虚部不过是一些小杂音。
 
收敛态:需要其中一个特征值实部为,而其他特征值的实部皆小于
发散态:如果某个特征值实部大于 。上面的例子中,如果将 变为 ,特征值也会变号,结果发散。
 
进一步,如何直接判断任意二阶矩阵的特征值是否均小于零。
对于二阶矩阵 ,矩阵的迹为 ,如果矩阵稳定,则迹应为负数。但是这个条件还不够,有反例迹小于依然发散: ,迹为但是仍然发散。还需要加上一个条件,因为,所以还需要行列式为正数
 
 
总结:原方程组有两个相互耦合的未知函数, 相互耦合,而特征值和特征向量的作则就是解耦,也就是对角化(diagonalize)。回到原方程组 ,将 表示为特征向量的线性组合 ,代入原方程有 ,两边同乘以 。以特征向量为基,将 表示为 ,得到关于 的对角化方程组,新方程组不存在耦合,此时 ,这是一个各未知函数间没有联系的方程组,它们的解的一般形式为 ,则原方程组的解的一般形式为
 

指数矩阵

上面引出了 ,这种指数部分带有矩阵的情况称为指数矩阵(exponential matrix)。
将指数形式展开称为幂级数形式,就像 一样
展开成幂级数的形式为:
 
两个极具美感的泰勒级数:
把第二个泰勒级数写成指数矩阵形式,有 ,这个式子在非常小的时候,后面的高次项近似等于零,所以可以用来近似 的逆矩阵,通常近似为 ,当然也可以再加几项。第一个级数对我们而言比第二个级数好,因为第一个级数总会收敛于某个值,所以 总会有意义,而第二个级数需要特征值的绝对值小于 (涉及矩阵的幂运算)。
 
回到正题,需要证明 ,继续使用泰勒级数:
 
需要注意的是,的泰勒级数展开是恒成立的,但我们推出的版本却需要矩阵可对角化这个前提条件。
 

变为对角矩阵就是因为对角矩阵简单、没有耦合,
有了,再来看矩阵的稳定性可知,所有特征值的实部均为负数时矩阵收敛,此时对角线上的指数收敛为 。如果画出复平面,要使微分方程存在稳定解,则特征值存在于复平面的左侧(实部为负);要使矩阵的幂收敛于 ,则特征值存在于单位圆内部(模小于 ),这是幂稳定区域。
 
同差分方程一样,对于二阶情况,有
模仿差分方程的情形,构造方程组
写成矩阵形式有 ,令
继续推广,对于 阶微分方程 ,可以写作
这样就把一个五阶微分方程化为 一阶方程组了,然后就是求特征值、特征向量了
 
  • 数学基础
  • 高等代数
  • 矩阵对角化马尔科夫矩阵、傅里叶级数
    目录