type
status
date
slug
summary
tags
category
icon
password
Property
AnimationOpts:Echarts 画图动画配置项
可以配置画图的动画,比如是否开启动画,动画持续时间,动画缓动效果等
InitOpts
:初始化配置项
可以配置诸如图像宽度,高度,图表主题,背景颜色等:
type
status
date
slug
summary
tags
category
icon
password
Property
作为专门面向机器学习的
Python
开源框架,Scikit-learn
可以在一定范围内为开发者提供非常好的帮助。它内部实现了各种各样成熟的算法,容易安装和使用,样例丰富,而且教程和文档也非常详细。另一方面,
Scikit-learn
也有缺点。例如它不支持深度学习和强化学习,这在今天已经是应用非常广泛的技术。此外,它也不支持图模型和序列预测,不支持Python
之外的语言,不支持PyPy
,也不支持GPU
加速。如果不考虑多层神经网络的相关应用,
Scikit-learn
的性能表现是非常不错的。究其原因,一方面是因为其内部算法的实现十分高效,另一方面或许可以归功于Cython
编译器;通过Cython
在Scikit-learn
框架内部生成C
语言代码的运行方式,Scikit-learn
消除了大部分的性能瓶颈。type
status
date
slug
summary
tags
category
icon
password
Property
什么时候需要异常点检测?
常见的有三种情况:
- 在做特征工程的时候需要对异常的数据做过滤,防止对归一化等处理的结果产生影响
- 对没有标记输出的特征数据做筛选,找出异常的数据
- 对有标记输出的特征数据做二分类时,由于某些类别的训练样本非常少,类别严重不平衡,此时也可以考虑用非监督的异常点检测算法来做
异常点检测的目的是找出数据集中和大多数数据不同的数据,常用的异常点检测算法一般分为三类:
- 基于统计学的方法来处理异常数据
构建一个概率分布模型,计算对象符合该模型的概率,把具有低概率的对象视为异常点。比如RobustScaler在做数据特征值缩放时,会利用数据特征的分位数分布,将数据根据分位数划分为多段,只取中间段来做缩放,比如只取25%分位数到75%分位数的数据做缩放,这样减小了异常数据的影响。
- 基于聚类的方法来做异常点检测