错误、调试和测试
2023-7-12
| 2023-8-6
0  |  阅读时长 0 分钟
type
status
date
slug
summary
tags
category
icon
password
Property

 

错误处理

程序运行的过程中,如果发生了错误,可以事先约定返回一个错误代码,这样可以知道是否有错以及出错的原因。在操作系统提供的调用中,返回错误码非常常见。比如打开文件的函数open(),成功时返回文件描述符(一个整数),出错时返回-1
 
用错误码来表示十分不便,因为函数返回的正常结果和错误码混在一起,调用者必须用大量的代码来判断是否出错:
一旦出错,还要一级一级上报,直到某个函数可以处理该错误(比如给用户输出一个错误信息),所以高级语言通常都内置了一套try...except...finally...的错误处理机制。
 

try

当认为某些代码可能会出错时,就可以用try来运行这段代码,如果执行出错,则后续代码不会继续执行,而是直接跳转至错误处理代码,即except语句块,执行完except后,如果有finally语句块,则执行finally语句块,至此,执行完毕。
 
从输出可以看到:当错误发生时,后续语句print('result:', r)不会被执行,except由于捕获到ZeroDivisionError,因此被执行。最后,finally语句被执行。然后,程序继续按照流程往下走。
 
错误有很多种类,如果发生了不同类型的错误,应该由不同的except来捕获不同类型的错误:
int()函数可能会抛出ValueError,所以用一个except捕获ValueError,用另一个except捕获ZeroDivisionError
 
此外,如果没有错误发生,可以在except语句块后面加一个else,当没有错误发生时,会自动执行else语句:
 
Python的错误其实也是class,所有的错误类型都继承自BaseException,所以在使用except时需要注意的是,它不但捕获该类型的错误,还把其子类也“一网打尽”:
第二个except永远也捕获不到UnicodeError,因为UnicodeErrorValueError的子类,如果有,也被第一个except给捕获了。
Python所有的错误都是从BaseException类派生的,常见的错误类型和继承关系:
 
 
使用try...except捕获错误还有一个巨大的好处,就是可以跨越多层调用,比如函数main()调用bar()bar()调用foo(),结果foo()出错了,这时,只要main()捕获到了,就可以处理:
也就是说,不需要在每个可能出错的地方去捕获错误,只要在合适的层次去捕获错误就可以了。这样一来,就大大减少了写try...except...finally的麻烦。
 

调用栈

如果错误没有被捕获,它就会一直往上抛,最后被Python解释器捕获,打印一个错误信息,然后程序退出。来看看err.py
执行,结果如下:
出错并不可怕,可怕的是不知道哪里出错了,解读错误信息是定位错误的关键,上往下可以看到整个错误的调用函数链。
 

记录错误

如果不捕获错误,自然可以让Python解释器来打印出错误堆栈,但程序也被结束了。既然能捕获错误,就可以把错误堆栈打印出来,然后分析错误原因,同时,让程序继续执行下去。
Python内置的logging模块可以非常容易地记录错误信息:
同样是出错,但程序打印完错误信息后会继续执行,并正常退出。通过配置,logging还可以把错误记录到日志文件里,方便事后排查。
 

抛出错误

因为错误是class,捕获一个错误就是捕获到该class的一个实例。因此,错误并不是凭空产生的,而是有意创建并抛出的。Python的内置函数会抛出很多类型的错误,自己编写的函数也可以抛出错误。
如果要抛出错误,首先根据需要,可以定义一个错误的class,选择好继承关系,然后,用raise语句抛出一个错误的实例:
执行,可以最后跟踪到我们自己定义的错误:
只有在必要的时候才定义我们自己的错误类型。如果可以选择Python已有的内置的错误类型(比如ValueErrorTypeError),尽量使用Python内置的错误类型。
 
最后来看另一种错误处理的方式:
bar()函数中,已经捕获了错误,但是,打印一个ValueError!后,又把错误通过raise语句抛出去了?
 
这种错误处理方式相当常见。捕获错误目的只是记录一下,便于后续追踪。但是,由于当前函数不知道应该怎么处理该错误,所以,最恰当的方式是继续往上抛,让顶层调用者去处理。好比一个员工处理不了一个问题时,就把问题抛给他的老板,如果他的老板也处理不了,就一直往上抛,最终会抛给CEO去处理。
raise语句如果不带参数,就会把当前错误原样抛出。此外,在exceptraise一个Error,还可以把一种类型的错误转化成另一种类型:
只要是合理的转换逻辑就可以,但是,决不应该把一个IOError转换成毫不相干的ValueError
 
 

调试

print

程序能一次写完并正常运行的概率很小,基本不超过1%。总会有各种各样的bug需要修正。有的bug很简单,看看错误信息就知道,有的bug很复杂,需要知道出错时,哪些变量的值是正确的,哪些变量的值是错误的,因此,需要一整套调试程序的手段来修复bug。
简单直接粗暴有效的方法就是用print()把可能有问题的变量打印出来看看:
print()最大的坏处是将来还得删掉它,想想程序里到处都是print(),运行结果也会包含很多垃圾信息。
 

assert

凡是用print()来辅助查看的地方,都可以用断言(assert)来替代:
assert的意思是,表达式n != 0应该是True,否则,根据程序运行的逻辑,后面的代码肯定会出错。
 
如果断言失败,assert语句本身就会抛出AssertionError
程序中如果到处充斥着assert,和print()相比也好不到哪去。不过,启动Python解释器时可以用O参数来关闭assert
关闭后,可以把所有的assert语句当成pass来看。
 
 

logging

print()替换为logging是第3种方式,和assert比,logging不会抛出错误,而且可以输出到文件:
logging.info()就可以输出一段文本。运行,发现除了ZeroDivisionError,没有任何信息。怎么回事?
 
别急,在import logging之后添加一行配置再试试:
看到输出了:
这就是logging的好处,它允许你指定记录信息的级别,有debuginfowarningerror等几个级别,当指定level=INFO时,logging.debug就不起作用了。同理,指定level=WARNING后,debuginfo就不起作用了。这样一来,你可以放心地输出不同级别的信息,也不用删除,最后统一控制输出哪个级别的信息。
logging的另一个好处是通过简单的配置,一条语句可以同时输出到不同的地方,比如console和文件。
 

pdb

第4种方式是启动Python的调试器pdb,让程序以单步方式运行,可以随时查看运行状态。先准备好程序:
然后启动:
以参数m pdb启动后,pdb定位到下一步要执行的代码> s = '0'。输入命令l来查看代码:
输入命令n可以单步执行代码:
任何时候都可以输入命令p 变量名来查看变量:
输入命令q结束调试,退出程序:(Pdb) q
这种通过pdb在命令行调试的方法理论上是万能的,但实在是太麻烦了,如果有一千行代码,要运行到第999行得敲多少命令啊。还好,我们还有另一种调试方法。
 

pdb.set_trace()

这个方法也是用pdb,但是不需要单步执行,只需要import pdb,然后,在可能出错的地方放一个pdb.set_trace(),就可以设置一个断点:
运行代码,程序会自动在pdb.set_trace()暂停并进入pdb调试环境,可以用命令p查看变量,或者用命令c继续运行:
这个方式比直接启动pdb单步调试效率要高很多,但也高不到哪去。
 

单元测试

单元测试是用来对一个模块、一个函数或者一个类来进行正确性检验的测试工作。
比如对函数abs(),可以编写出以下几个测试用例:
  1. 输入正数,比如11.20.99,期待返回值与输入相同;
  1. 输入负数,比如11.20.99,期待返回值与输入相反;
  1. 输入0,期待返回0
  1. 输入非数值类型,比如None[]{},期待抛出TypeError
把上面的测试用例放到一个测试模块里,就是一个完整的单元测试。
如果单元测试通过,说明测试的这个函数能够正常工作。如果单元测试不通过,要么函数有bug,要么测试条件输入不正确,总之,需要修复使单元测试能够通过。
 
单元测试通过后有什么意义呢?如果对abs()函数代码做了修改,只需要再跑一遍单元测试,如果通过,说明修改不会对abs()函数原有的行为造成影响,如果测试不通过,说明修改与原有行为不一致,要么修改代码,要么修改测试。
这种以测试为驱动的开发模式最大的好处就是确保一个程序模块的行为符合设计的测试用例。在将来修改的时候,可以极大程度地保证该模块行为仍然是正确的。
编写一个Dict类,这个类的行为和dict一致,但是可以通过属性来访问,用起来就像下面这样:
mydict.py代码如下:
为了编写单元测试,需要引入Python自带的unittest模块,编写mydict_test.py如下:
编写单元测试时,需要编写一个测试类,从unittest.TestCase继承。
test开头的方法就是测试方法,不以test开头的方法不被认为是测试方法,测试的时候不会被执行。
对每一类测试都需要编写一个test_xxx()方法。由于unittest.TestCase提供了很多内置的条件判断,我们只需要调用这些方法就可以断言输出是否是我们所期望的。最常用的断言就是assertEqual()self.assertEqual(abs(-1), 1) # 断言函数返回的结果与1相等
另一种重要的断言就是期待抛出指定类型的Error,比如通过d['empty']访问不存在的key时,断言会抛出KeyError
而通过d.empty访问不存在的key时,我们期待抛出AttributeError
 

运行单元测试

一旦编写好单元测试,就可以运行单元测试。最简单的运行方式是在mydict_test.py的最后加上两行代码:
这样就可以把mydict_test.py当做正常的python脚本运行:$ python mydict_test.py
另一种方法是在命令行通过参数 -m unittest直接运行单元测试:
这是推荐的做法,因为这样可以一次批量运行很多单元测试,并且,有很多工具可以自动来运行这些单元测试。
 

setUp与tearDown

可以在单元测试中编写两个特殊的setUp()tearDown()方法。这两个方法会分别在每调用一个测试方法的前后分别被执行。
setUp()tearDown()方法有什么用呢?设想你的测试需要启动一个数据库,这时,就可以在setUp()方法中连接数据库,在tearDown()方法中关闭数据库,这样,不必在每个测试方法中重复相同的代码:
可以再次运行测试看看每个测试方法调用前后是否会打印出setUp...tearDown...
 

文档测试

如果经常阅读Python的官方文档,可以看到很多文档都有示例代码。比如re模块就带了很多示例代码:
可以把这些示例代码在Python的交互式环境下输入并执行,结果与文档中的示例代码显示的一致。
 
这些代码与其他说明可以写在注释中,然后,由一些工具来自动生成文档。既然这些代码本身就可以粘贴出来直接运行,那么,可不可以自动执行写在注释中的这些代码呢?答案是肯定的。
当编写注释时,如果写上这样的注释:
无疑更明确地告诉函数的调用者该函数的期望输入和输出。并且,Python内置的“文档测试”(doctest)模块可以直接提取注释中的代码并执行测试。
 
doctest严格按照Python交互式命令行的输入和输出来判断测试结果是否正确。只有测试异常的时候,可以用...表示中间一大段烦人的输出。用doctest来测试上次编写的Dict类:
运行python mydict2.py$ python mydict2.py
什么输出也没有,说明编写的doctest运行都是正确的;如果程序有问题,比如把__getattr__()方法注释掉,再运行就会报错:
注意到最后3行代码。当模块正常导入时,doctest不会被执行。只有在命令行直接运行时,才执行doctest。所以,不必担心doctest会在非测试环境下执行。
 
  • Python
  • 正则表达式IO编程
    目录