type
status
date
slug
summary
tags
category
icon
password
Property
错误处理
程序运行的过程中,如果发生了错误,可以事先约定返回一个错误代码,这样可以知道是否有错以及出错的原因。在操作系统提供的调用中,返回错误码非常常见。比如打开文件的函数
open()
,成功时返回文件描述符(一个整数),出错时返回-1
。用错误码来表示十分不便,因为函数返回的正常结果和错误码混在一起,调用者必须用大量的代码来判断是否出错:
一旦出错,还要一级一级上报,直到某个函数可以处理该错误(比如给用户输出一个错误信息),所以高级语言通常都内置了一套
try...except...finally...
的错误处理机制。try
当认为某些代码可能会出错时,就可以用
try
来运行这段代码,如果执行出错,则后续代码不会继续执行,而是直接跳转至错误处理代码,即except
语句块,执行完except
后,如果有finally
语句块,则执行finally
语句块,至此,执行完毕。从输出可以看到:当错误发生时,后续语句
print('result:', r)
不会被执行,except
由于捕获到ZeroDivisionError
,因此被执行。最后,finally
语句被执行。然后,程序继续按照流程往下走。错误有很多种类,如果发生了不同类型的错误,应该由不同的
except
来捕获不同类型的错误:int()
函数可能会抛出ValueError
,所以用一个except
捕获ValueError
,用另一个except
捕获ZeroDivisionError
。此外,如果没有错误发生,可以在
except
语句块后面加一个else
,当没有错误发生时,会自动执行else
语句:Python
的错误其实也是class
,所有的错误类型都继承自BaseException
,所以在使用except
时需要注意的是,它不但捕获该类型的错误,还把其子类也“一网打尽”:第二个
except
永远也捕获不到UnicodeError
,因为UnicodeError
是ValueError
的子类,如果有,也被第一个except
给捕获了。Python所有的错误都是从
BaseException
类派生的,常见的错误类型和继承关系:使用
try...except
捕获错误还有一个巨大的好处,就是可以跨越多层调用,比如函数main()
调用bar()
,bar()
调用foo()
,结果foo()
出错了,这时,只要main()
捕获到了,就可以处理:也就是说,不需要在每个可能出错的地方去捕获错误,只要在合适的层次去捕获错误就可以了。这样一来,就大大减少了写
try...except...finally
的麻烦。调用栈
如果错误没有被捕获,它就会一直往上抛,最后被
Python
解释器捕获,打印一个错误信息,然后程序退出。来看看err.py
:执行,结果如下:
出错并不可怕,可怕的是不知道哪里出错了,解读错误信息是定位错误的关键,上往下可以看到整个错误的调用函数链。
记录错误
如果不捕获错误,自然可以让
Python
解释器来打印出错误堆栈,但程序也被结束了。既然能捕获错误,就可以把错误堆栈打印出来,然后分析错误原因,同时,让程序继续执行下去。Python
内置的logging
模块可以非常容易地记录错误信息:同样是出错,但程序打印完错误信息后会继续执行,并正常退出。通过配置,
logging
还可以把错误记录到日志文件里,方便事后排查。抛出错误
因为错误是
class
,捕获一个错误就是捕获到该class的一个实例。因此,错误并不是凭空产生的,而是有意创建并抛出的。Python
的内置函数会抛出很多类型的错误,自己编写的函数也可以抛出错误。如果要抛出错误,首先根据需要,可以定义一个错误的class,选择好继承关系,然后,用
raise
语句抛出一个错误的实例:执行,可以最后跟踪到我们自己定义的错误:
只有在必要的时候才定义我们自己的错误类型。如果可以选择Python已有的内置的错误类型(比如
ValueError
,TypeError
),尽量使用Python
内置的错误类型。最后来看另一种错误处理的方式:
在
bar()
函数中,已经捕获了错误,但是,打印一个ValueError!
后,又把错误通过raise
语句抛出去了?这种错误处理方式相当常见。捕获错误目的只是记录一下,便于后续追踪。但是,由于当前函数不知道应该怎么处理该错误,所以,最恰当的方式是继续往上抛,让顶层调用者去处理。好比一个员工处理不了一个问题时,就把问题抛给他的老板,如果他的老板也处理不了,就一直往上抛,最终会抛给CEO去处理。
raise
语句如果不带参数,就会把当前错误原样抛出。此外,在except
中raise
一个Error,还可以把一种类型的错误转化成另一种类型:只要是合理的转换逻辑就可以,但是,决不应该把一个
IOError
转换成毫不相干的ValueError
。调试
程序能一次写完并正常运行的概率很小,基本不超过1%。总会有各种各样的bug需要修正。有的bug很简单,看看错误信息就知道,有的bug很复杂,需要知道出错时,哪些变量的值是正确的,哪些变量的值是错误的,因此,需要一整套调试程序的手段来修复bug。
简单直接粗暴有效的方法就是用
print()
把可能有问题的变量打印出来看看:用
print()
最大的坏处是将来还得删掉它,想想程序里到处都是print()
,运行结果也会包含很多垃圾信息。assert
凡是用
print()
来辅助查看的地方,都可以用断言(assert)来替代:assert
的意思是,表达式n != 0
应该是True
,否则,根据程序运行的逻辑,后面的代码肯定会出错。如果断言失败,
assert
语句本身就会抛出AssertionError
:程序中如果到处充斥着
assert
,和print()
相比也好不到哪去。不过,启动Python解释器时可以用O
参数来关闭assert
:关闭后,可以把所有的
assert
语句当成pass
来看。logging
把
print()
替换为logging
是第3种方式,和assert
比,logging
不会抛出错误,而且可以输出到文件:logging.info()
就可以输出一段文本。运行,发现除了ZeroDivisionError
,没有任何信息。怎么回事?别急,在
import logging
之后添加一行配置再试试:看到输出了:
这就是
logging
的好处,它允许你指定记录信息的级别,有debug
,info
,warning
,error
等几个级别,当指定level=INFO
时,logging.debug
就不起作用了。同理,指定level=WARNING
后,debug
和info
就不起作用了。这样一来,你可以放心地输出不同级别的信息,也不用删除,最后统一控制输出哪个级别的信息。logging
的另一个好处是通过简单的配置,一条语句可以同时输出到不同的地方,比如console
和文件。pdb
第4种方式是启动
Python
的调试器pdb
,让程序以单步方式运行,可以随时查看运行状态。先准备好程序:然后启动:
以参数
m pdb
启动后,pdb定位到下一步要执行的代码> s = '0'
。输入命令l
来查看代码:输入命令
n
可以单步执行代码:任何时候都可以输入命令
p 变量名
来查看变量:输入命令
q
结束调试,退出程序:(Pdb) q
这种通过
pdb
在命令行调试的方法理论上是万能的,但实在是太麻烦了,如果有一千行代码,要运行到第999行得敲多少命令啊。还好,我们还有另一种调试方法。pdb.set_trace()
这个方法也是用
pdb
,但是不需要单步执行,只需要import pdb
,然后,在可能出错的地方放一个pdb.set_trace()
,就可以设置一个断点:运行代码,程序会自动在
pdb.set_trace()
暂停并进入pdb
调试环境,可以用命令p
查看变量,或者用命令c
继续运行:这个方式比直接启动
pdb
单步调试效率要高很多,但也高不到哪去。单元测试
单元测试是用来对一个模块、一个函数或者一个类来进行正确性检验的测试工作。
比如对函数
abs()
,可以编写出以下几个测试用例:- 输入正数,比如
1
、1.2
、0.99
,期待返回值与输入相同;
- 输入负数,比如
1
、1.2
、0.99
,期待返回值与输入相反;
- 输入
0
,期待返回0
;
- 输入非数值类型,比如
None
、[]
、{}
,期待抛出TypeError
。
把上面的测试用例放到一个测试模块里,就是一个完整的单元测试。
如果单元测试通过,说明测试的这个函数能够正常工作。如果单元测试不通过,要么函数有bug,要么测试条件输入不正确,总之,需要修复使单元测试能够通过。
单元测试通过后有什么意义呢?如果对
abs()
函数代码做了修改,只需要再跑一遍单元测试,如果通过,说明修改不会对abs()
函数原有的行为造成影响,如果测试不通过,说明修改与原有行为不一致,要么修改代码,要么修改测试。这种以测试为驱动的开发模式最大的好处就是确保一个程序模块的行为符合设计的测试用例。在将来修改的时候,可以极大程度地保证该模块行为仍然是正确的。
编写一个
Dict
类,这个类的行为和dict
一致,但是可以通过属性来访问,用起来就像下面这样:mydict.py
代码如下:为了编写单元测试,需要引入Python自带的
unittest
模块,编写mydict_test.py
如下:编写单元测试时,需要编写一个测试类,从
unittest.TestCase
继承。以
test
开头的方法就是测试方法,不以test
开头的方法不被认为是测试方法,测试的时候不会被执行。对每一类测试都需要编写一个
test_xxx()
方法。由于unittest.TestCase
提供了很多内置的条件判断,我们只需要调用这些方法就可以断言输出是否是我们所期望的。最常用的断言就是assertEqual()
:self
.assertEqual(abs(-1), 1) # 断言函数返回的结果与1相等
另一种重要的断言就是期待抛出指定类型的
Error
,比如通过d['empty']
访问不存在的key时,断言会抛出KeyError
:而通过
d.empty
访问不存在的key
时,我们期待抛出AttributeError
:运行单元测试
一旦编写好单元测试,就可以运行单元测试。最简单的运行方式是在
mydict_test.py
的最后加上两行代码:这样就可以把
mydict_test.py
当做正常的python
脚本运行:$ python mydict_test.py
。另一种方法是在命令行通过参数
-m unittest
直接运行单元测试:这是推荐的做法,因为这样可以一次批量运行很多单元测试,并且,有很多工具可以自动来运行这些单元测试。
setUp与tearDown
可以在单元测试中编写两个特殊的
setUp()
和tearDown()
方法。这两个方法会分别在每调用一个测试方法的前后分别被执行。setUp()
和tearDown()
方法有什么用呢?设想你的测试需要启动一个数据库,这时,就可以在setUp()
方法中连接数据库,在tearDown()
方法中关闭数据库,这样,不必在每个测试方法中重复相同的代码:可以再次运行测试看看每个测试方法调用前后是否会打印出
setUp...
和tearDown...
。文档测试
如果经常阅读
Python
的官方文档,可以看到很多文档都有示例代码。比如re模块
就带了很多示例代码:可以把这些示例代码在
Python
的交互式环境下输入并执行,结果与文档中的示例代码显示的一致。这些代码与其他说明可以写在注释中,然后,由一些工具来自动生成文档。既然这些代码本身就可以粘贴出来直接运行,那么,可不可以自动执行写在注释中的这些代码呢?答案是肯定的。
当编写注释时,如果写上这样的注释:
无疑更明确地告诉函数的调用者该函数的期望输入和输出。并且,
Python
内置的“文档测试”(doctest)模块可以直接提取注释中的代码并执行测试。doctest
严格按照Python
交互式命令行的输入和输出来判断测试结果是否正确。只有测试异常的时候,可以用...
表示中间一大段烦人的输出。用doctest
来测试上次编写的Dict
类:运行
python mydict2.py
: $ python mydict2.py
。什么输出也没有,说明编写的
doctest
运行都是正确的;如果程序有问题,比如把__getattr__()
方法注释掉,再运行就会报错:注意到最后3行代码。当模块正常导入时,
doctest
不会被执行。只有在命令行直接运行时,才执行doctest
。所以,不必担心doctest
会在非测试环境下执行。