自回归模型
自回归模型属于算法组件中统计分析的一种时间序列回归组件。可以在“公共组件-算法设计-统计分析-时间序列分析”的分类中找到它。
原理
自回归模型(英语:Autoregressive model,简称AR模型),是统计上一种处理时间序列的方法。
自回归模型被广泛运用在经济学、信息学、自然现象的预测上。
简介
自回归模型(英语:Autoregressive model,简称AR模型),是统计上一种处理时间序列的方法,用同一变数例如x的之前各期,亦即x1至xt-1来预测本期xt的表现,并假设它们为一线性关系。因为这是从回归分析中的线性回归发展而来,只是不用x预测y,而是用x预测 x(自己);所以叫做自回归。
自回归模型被广泛运用在经济学、信息学、自然现象的预测上。
定义
其中: c是常数项; 被假设为平均数等于0,标准差等于 的随机误差值; 被假设为对于任何的t都不变。
文字叙述为:X的当期值等于一个或数个落后期的线性组合,加常数项,加随机误差。
优劣
自回归方法的优点是所需资料不多,可用自身变数数列来进行预测。但是这种方法受到一定的限制:
必须具有自相关,自相关系数( )是关键。如果自相关系数(R)小于0.5,则不宜采用,否则预测结果极不准确。
自回归只能适用于预测与自身前期相关的经济现象,即受自身历史因素影响较大的经济现象,如矿的开采量,各种自然资源产量等;对于受社会因素影响较大的经济现象,不宜采用自回归,而应改采可纳入其他变数的向量自回归模型。
使用
将自回归模型模块拖出,并找到想要使用的数据集与模型预测组件,分别与自回归模型连接。
预测结束后可以点击时间序列预测的查看结果,可以看到最后的prediction为最终的预测结果。
参数
点击自回归模型组件的参数设置选项,可以看到有参数可以手动设置。
missing:可用选项有“none”、“drop”和“raise”。如果' none ',则不执行nan检查。如果“drop”,任何关于nans的观察值都将被删除。如果“raise”,则会引发一个错误。默认的是“没有”。
trend:是否包含常数。“c”包括常数,“nc”没有常数。
method:‘cmle’, ‘mle’两种方法。
maxiter:模型最大迭代次数。
disp:是否显示log。
maxlag:如果ic为None,则maxlag是fit中使用的滞后长度。
**
参考文献
https://baike.baidu.com/item/%E8%87%AA%E5%9B%9E%E5%BD%92%E6%A8%A1%E5%9E%8B https://www.statsmodels.org/dev/_modules/statsmodels/tsa/ar_model.html#AR