算法复杂度 | 彩潭有鲤的札记

type

status

date

slug

summary

时间复杂度

时间复杂度（Time Complexity）：在问题的输入规模为的条件下，算法运行所需要花费的时间，可以记作为

我们将基本操作次数 作为时间复杂度的度量标准。换句话说，时间复杂度跟算法中基本操作次数的数量正相关。

基本操作 ：算法执行中的每一条语句。每一次基本操作都可在常数时间内完成。

基本操作是一个运行时间不依赖于操作数的操作。

比如两个整数相加的操作，如果两个数的规模不大，运行时间不依赖于整数的位数，则相加操作就可以看做是基本操作。反之，如果两个数的规模很大，相加操作依赖于两个数的位数，则两个数的相加操作不是一个基本操作，而每一位数的相加操作才是一个基本操作。

把上述算法中所有语句的执行次数加起来，可以用一个函数来表达语句的执行次数：

则时间复杂度的函数可以表示为：。它表示的是随着问题规模的增大，算法执行时间的增长趋势跟相同。是一种渐进符号，称作算法的 渐进时间复杂度（Asymptotic time complexity），简称为时间复杂度。

所谓「算法执行时间的增长趋势」是一个模糊的概念，通常要借助像上边公式中这样的「渐进符号」来表示时间复杂度。

渐进符号

「渐进符号」 实际上是专门用来刻画函数的增长速度的。简单来说，渐进符号只保留了最高阶幂，忽略了一个函数中增长较慢的部分，比如低阶幂、系数、常量。因为当问题规模变的很大时，这几部分并不能左右增长趋势，所以可以忽略掉。

经常用到的渐进符号有三种：、、

渐进紧确界符号：对于函数和，。存在正常量、和，使得对于所有时，有。

也就是说，如果函数，那么能找到两个正数、，使得被和夹在中间。

例如：，可以找到，，，使得对于所有，都有

渐进上界符号：对于函数和，。存在常量，，使得当时，有。

符号渐进地给出了一个函数的上界和下界，如果只知道一个函数的上界，可以使用符号。

渐进下界符号：对于函数和，。存在常量，，使得当时，有。

同样，如果只知道函数的下界，可以使用符号。

时间复杂度计算

渐进符号可以渐进地描述一个函数的上界、下界，同时也可以描述算法执行时间的增长趋势。在计算时间复杂度的时候，经常使用渐进上界符号。因为我们关注的通常是算法用时的上界，而不用关心其用时的下界。

求解时间复杂度一般分为以下几个步骤：

找出算法中的基本操作（基本语句）：算法中执行次数最多的语句就是基本语句，通常是最内层循环的循环体部分

计算基本语句执行次数的数量级：只需要计算基本语句执行次数的数量级，即保证函数中的最高次幂正确即可。像最高次幂的系数和低次幂可以忽略

用大 O 表示法表示时间复杂度：将上一步中计算的数量级放入渐进上界符号中

同时，在求解时间复杂度还要注意一些原则：

加法原则：总的时间复杂度等于量级最大的基本语句的时间复杂度

如果，，，则。

乘法原则：循环嵌套代码的复杂度等于嵌套内外基本语句的时间复杂度乘积

如果，，，则。

常数

一般情况下，只要算法中不存在循环语句、递归语句，其时间复杂度都为。

只是常数阶时间复杂度的一种表示方式，并不是指只执行了一行代码。只要代码的执行时间不随着问题规模的增大而增长，这样的算法时间复杂度都记为。

上述代码虽然有 4 行，但时间复杂度也是，而不是

线性

一般含有非嵌套循环，且单层循环下的语句执行次数为的算法涉及线性时间复杂度。这类算法随着问题规模的增大，对应计算次数呈线性增长。

sum += 1 的执行次数为次，所以这段代码的时间复杂度为

平方

一般含有双层嵌套，且每层循环下的语句执行次数为的算法涉及平方时间复杂度。这类算法随着问题规模的增大，对应计算次数呈平方关系增长

res += 1 在两重循环中，根据时间复杂度的乘法原理，这段代码的执行次数为次，所以其时间复杂度为

阶乘

阶乘时间复杂度一般出现在与「全排列」、「旅行商问题暴力解法」相关的算法中。这类算法随着问题规模的增大，对应计算次数呈阶乘关系增长。

上述代码中实现「全排列」使用了递归的方法。假设数组 arr 长度为 n，第一层 for 循环执行了 n 次，第二层 for 循环执行了 n - 1 次。以此类推，最后一层 for 循环执行了 1 次，将所有层 for 循环的执行次数累乘起来为次。则整个算法的 for 循环中基本语句的执行次数为次，所以对应时间复杂度为。

对数

对数时间复杂度一般出现在「二分查找」、「分治」这种一分为二的算法中。这类算法随着问题规模的增大，对应的计算次数呈对数关系增长。

上述代码中cnt = 1的时间复杂度为可以忽略不算。while循环体中cnt从 1开始，每循环一次都乘以2。当大于时循环结束。变量cnt 的取值是一个等比数列：，根据，可以得出这段循环体的执行次数为。所以这段代码的时间复杂度为。

线性对数

线性对数一般出现在排序算法中，例如「快速排序」、「归并排序」、「堆排序」等。这类算法随着问题规模的增大，对应的计算次数呈线性对数关系增长。

上述代码中外层循环的时间复杂度为，内层循环的时间复杂度为，且两层循环相互独立，则总体时间复杂度为

常见时间复杂度关系

根据从小到大排序，常见的算法复杂度主要有： < < < < < << <

最佳、最坏、平均时间复杂度

时间复杂度是一个关于输入问题规模 n 的函数。但是因为输入问题的内容不同，习惯将「时间复杂度」分为「最佳」、「最坏」、「平均」三种情况。这三种情况的具体含义如下：

最佳时间复杂度：每个输入规模下用时最短的输入所对应的时间复杂度。

最坏时间复杂度：每个输入规模下用时最长的输入所对应的时间复杂度。

平均时间复杂度：每个输入规模下所有可能的输入所对应的平均用时复杂度（随机输入下期望用时的复杂度）。

这段代码要实现的功能是：从一个整数数组nums中查找值为val的变量出现的位置。如果不考虑break语句，这个算法的时间复杂度是，其中 n 代表数组的长度。

但是如果考虑break语句，那么就需要考虑输入的内容了。如果数组中第 1 个元素值就是val，那么剩下n-1个数据都不要遍历了，那么时间复杂度就是，即最佳时间复杂度为。如果数组中不存在值为val的变量，那么就需要把整个数组遍历一遍，时间复杂度就变成了，即最差时间复杂度为。

最佳时间复杂度和最坏时间复杂度都是极端条件下的时间复杂度，发生的概率其实很小。为了能更好的表示正常情况下的复杂度，所以一般采用平均时间复杂度作为时间复杂度的计算方式。

还是刚才的例子，在数组nums中查找变量值为val的位置，总共有n + 1种情况：在数组的0 ~ n - 1 和不在数组中。将所有情况下，需要执行的语句累加起来，再除以n + 1，就可以得到平均需要执行的语句，即：。将公式简化后，得到的平均时间复杂度就是。

通常只有同一个算法在输入内容不同，不同时间复杂度有量级的差距时，才会通过三种时间复杂度表示法来区分。一般情况下，使用其中一种就可以满足需求了。

空间复杂度

空间复杂度（Space Complexity）：在问题的输入规模为的条件下，算法所占用的空间大小，可以记作为 S(n)。一般将 算法的辅助空间 作为衡量空间复杂度的标准。

除了执行时间的长短，算法所需储存空间的多少也是衡量性能的一个重要方面。而在「时间复杂度」中提到的渐进符号，也同样使用于空间复杂度的度量。空间复杂度的函数可以表示为，它表示的是随着问题规模的增大，算法所占空间的增长趋势跟相同。

相比于算法的时间复杂度计算来说，算法的空间复杂度更容易计算，主要包括「局部变量（算法范围内定义的变量）所占用的存储空间」和「系统为实现递归（如果算法是递归的话）所使用的堆栈空间」两个部分。

常数 O(1)

上述代码中使用 a、b、res 3 个局部变量，其所占空间大小并不会随着问题规模 n 的在增大而增大，所以该算法的空间复杂度为

线性O(n)

上述代码采用了递归调用的方式。每次递归调用都占用了1个栈帧空间，总共调用了n次，所以该算法的空间复杂度为

常见空间复杂度关系

根据从小到大排序，常见的算法复杂度主要有： < < < < 等