Auto ARIMA
type
status
date
slug
summary
tags
category
icon
password
Property
 
为什么我们需要Auto ARIMA?
虽然ARIMA是预测时间序列数据的一个非常强大的模型,但是数据准备和参数调整过程最终非常耗时。在实现ARIMA之前,您需要使序列平稳,并使用上面讨论的图确定p和q的值。Auto ARIMA使这个任务对我们来说非常简单,因为它消除了我们在上一节中看到的步骤3到6。下面是实现Auto ARIMA所需遵循的步骤:
  • 加载数据:这一步将是相同的。将数据加载到笔记本中
  • 预处理数据:输入应该是单变量的,因此放弃其他列。
  • 拟合Auto ARIMA:在单变量序列上拟合模型
  • 验证集上的预测值:对验证集进行预测
  • 计算RMSE:使用实际值的预测值检查模型的性能
 
基于状态空间方法的时间序列分析
type
status
date
slug
summary
tags
category
icon
password
Property
 
 
模型意义
状态空间模型起源于平稳时间序列分析。当用于非平稳时间序列分析时需要将非平稳时间序列分解为随机游走成分(趋势)和弱平稳成分两个部分分别建模。 含有随机游走成分的时间序列又称积分时间序列,因为随机游走成分是弱平稳成分的和或积分。当一个向量值积分序列中的某些序列的线性组合变成弱平稳时就称这些序列构成了协调积分(cointegrated)过程。 非平稳时间序列的线性组合可能产生平稳时间序列这一思想可以追溯到回归分析,Granger提出的协调积分概念使这一思想得到了科学的论证。 Aoki和Cochrane等人的研究表明:很多非平稳多变量时间序列中的随机游走成分比以前人们认为的要小得多,有时甚至完全消失。
状态空间模型的建立和预测的步骤
为了避免由于状态空间模型的不可控制性而导致的错误的分解形式,当对一个单整时间序列建立状态空间分解模型并进行预测,应按下面的步骤执行:
(1) 对相关的时间序列进行季节调整,并将季节要素序列外推;
(2) 对季节调整后的时间序列进行单位根检验,确定单整阶数,然后在ARIMA过程中选择最接近的模型;
(3) 求出ARIMA模型的系数;
(4) 用ARIMA模型的系数准确表示正规状态空间模型,检验状态空间模型的可控制性;
(5) 利用Kalman滤波公式估计状态向量,并对时间序列进行预测。
(6) 把外推的季节要素与相应的预测值合并,就得到经济时间序列的预测结果
矢量自动回归
type
status
date
slug
summary
tags
category
icon
password
Property
 
向量自回归(VAR)是基于数据的统计性质建立模型,VAR模型把系统中每一个内生变量作为系统中所有内生变量的滞后值的函数来构造模型,从而将单变量自回归模型推广到由多元时间序列变量组成的“向量”自回归模型。VAR模型是处理多个相关经济指标的分析与预测最容易操作的模型之一,并且在一定的条件下,多元MA和ARMA模型也可转化成VAR模型,因此近年来VAR模型受到越来越多的经济工作者的重视。
 
方差分析
type
status
date
slug
summary
tags
category
icon
password
Property
 
 
 
多元统计
type
status
date
slug
summary
tags
category
icon
password
Property
 

主成分分析

notion image
 

因子分析

notion image
 

因子旋转

notion image
 
绘图
type
status
date
slug
summary
tags
category
icon
password
Property
 
notion image
notion image
notion image
notion image
 
 
notion image
notion image
 
生存分析
type
status
date
slug
summary
tags
category
icon
password
Property
 
 
 
 
多重插补
type
status
date
slug
summary
tags
category
icon
password
Property
ICE模块允许大多数Statsmodels模型拟合独立或因变量上具有缺失值的数据集,并为拟合参数提供严格的标准误差。基本思想是将具有缺失值的每个变量视为回归中的因变量,其中一些或所有剩余变量作为其预测变量。MICE程序循环遍历这些模型,依次拟合每个模型,然后使用称为“预测平均匹配”(PMM)的过程从拟合模型确定的预测分布中生成随机抽取。这些随机抽取成为一个插补数据集的估算值。
默认情况下,每个具有缺失变量的变量都使用线性回归建模,拟合数据集中的所有其他变量。请注意,即使插补模型是线性的,PMM过程也会保留每个变量的域。因此,例如,如果给定变量的所有观测值都是正,则变量的所有估算值将始终为正。用户还可以选择指定使用哪个模型为每个变量生成插补值。
 
SciPy简介
type
status
date
slug
summary
tags
category
icon
password
Property
notion image

SciPy 应用

Scipy 是一个用于数学、科学、工程领域的常用软件包,可以处理最优化、线性代数、积分、插值、拟合、特殊函数、快速傅里叶变换、信号处理、图像处理、常微分方程求解器等
SciPy 包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算
NumPy 和 SciPy 的协同工作可以高效解决很多问题,在天文学、生物学、气象学和气候科学,以及材料科学等多个学科得到了广泛应用
 

SciPy 模块列表

 
SciPy cluster
type
status
date
slug
summary
tags
category
icon
password
Property
scipy.cluster是scipy下的一个做聚类的package, 共包含了两类聚类方法:
  1. 矢量量化(scipy.cluster.vq):支持vector quantization 和 k-means 聚类方法
  1. 层次聚类(scipy.cluster.hierarchy):支持hierarchical clustering 和 agglomerative clustering(凝聚聚类)
 
SciPy constants
type
status
date
slug
summary
tags
category
icon
password
Property
SciPy 常量模块 constants提供了许多内置的数学常数。
常量模块包含以下几种单位:
  • 公制单位
  • 二进制,以字节为单位
  • 质量单位
  • 角度换算
  • 时间单位
  • 长度单位
  • 压强单位
  • 体积单位
  • 速度单位
  • 温度单位