type
status
date
slug
summary
tags
category
icon
password
Property
箱线图
箱线图(Box-plot)又称为盒须图、盒式图或箱型图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。箱线图的绘制方法是:先找出一组数据的上限值、下限值、中位数(Q2)和下四分位数(Q1)以及上四分位数(Q3);然后,连接两个四分位数画出箱子;再将最大值和最小值与箱子相连接,中位数在箱子中间。
在
matplotlib
中有plt.boxplot
来绘制箱线图,这个方法的相关参数如下:x
:需要绘制的箱线图的数据
notch
:是否展示置信区间,默认是False
。如果设置为True
,那么就会在盒子上展示一个缺口
sym
:代表异常点的符号表示,默认是小圆点
vert
:是否是垂直的,默认是True
,如果设置为False
那么将水平方向展示
whis
:上下限的系数,默认是1.5
,也就是上限是Q3+1.5IQR
,可以改成其他的。也可以为一个序列,如果是序列,那么序列中的两个值分别代表的就是下限和上限的值,而不是再需要通过IQR
来计算
positions
:设置每个盒子的位置
widths
:设置每个盒子的宽度
labels
:每个盒子的label
meanline
和showmeans
:如果这两个都为True
,那么将会绘制平均值的的线条
箱线图的应用场景
- 直观明了地识别数据中的异常值
- 利用箱线图判断数据的偏态
- 利用箱线图比较几批数据的形状
- 箱线图适合比较多组数据,如果知识要看一组数据的分布情况,建议使用直方图
雷达图
雷达图(Radar Chart)又被叫做蜘蛛网图,适用于显示三个或更多的维度的变量的强弱情况。
使用plt.polar
绘制雷达图
在
matplotlib.pyplot
中,可以通过plt.polar
来绘制雷达图,这个方法的参数跟plt.plot
非常的类似,只不过是x
轴的坐标点应该为弧度(2*PI=360°):其中有几点需要注意:
- 因为
polar
并不会完成线条的闭合绘制,所以我们在绘制的时候需要在theta
中和values
中在最后多重复添加第0个位置的值,然后在绘制的时候就可以和第1个点进行闭合了。
polar
只是绘制线条,所以如果想要把里面进行颜色填充,那么需要调用fill
函数来实现。
polar
默认的圆圈的坐标是角度,如果我们想要改成文字显示,那么可以通过xticks
来设置。
使用子图绘制雷达图
在多子图中,绘图对象不再是
pyplot
而是Axes
,而Axes
及其子类绘制雷达图则是通过将直角坐标转换成极坐标,然后再绘制折线图。示例代码如下:使用
plt.subplot
绘制的子图:使用
plt.subplots
绘制的子图:3使用
fig.add_subplot
绘制的子图: