上一页|下一页

“建模和预测”任务

关于“建模和预测”任务

“建模和预测”任务使用时间序列数据创建预测模型。该任务需要有效时间序列格式的数据。要创建该数据,在运行“建模和预测”任务之前,需要使用“时间序列数据准备”任务。

示例:创建 SASHELP.PRICEDATA 数据集的随机游动模型

要创建此示例,请执行以下操作:
  1. 任务部分中,展开预测文件夹,并双击建模和预测。此时,系统会打开“建模和预测”任务的用户界面。
  2. 数据选项卡中,选择 SASHELP.PRICEDATA 数据集。
  3. 向以下角色分配列并指定相应的选项:
    角色
    角色
    因变量
    sale
    其他角色
    时间 ID
    date
    属性
    季节长度
    12
  4. 点击模型选项卡,然后选择以下选项:
    • 预测模型类型下拉列表中,选择随机游动模型
    • 模型设置标题下,选中漂移季节复选框。
  5. 要运行任务,点击 提交 SAS 代码
结果将显示 Sashelp.Pricedata 数据集的随机游动模型。
Sashelp.Pricedata 数据集的随机游动模型

向角色分配数据

要运行建模和预测任务,您必须为因变量角色分配一列,并且在模型选项卡上指定预测模型类型。
角色和选项
说明
角色
因变量
指定因变量。
其他角色
时间 ID
指定包含时间 ID 值的列。
属性
间隔
显示时间 ID 变量的间隔。有关 SAS 时间间隔的详细信息,请参见 了解 SAS 时间间隔
注: 此值由输入数据集确定。您无法在建模和预测任务中更改该值。
乘数
显示时间间隔的乘数。默认情况下,乘数为 1。
注: 此值由输入数据集确定。您无法在建模和预测任务中更改该值。
偏移
显示时间间隔的偏移。默认情况下,偏移为 1。
注: 此值由输入数据集确定。您无法在建模和预测任务中更改该值。
季节长度
指定时间间隔的季节性。默认值取决于时间间隔。
其他角色
季节长度
当您没有分配时间 ID 变量时,可以指定数据的季节性。
分析分组依据
列出您想用作分类 (BY) 变量的一个或多个变量。

设置模型选项

要使用“建模和预测”任务,必须选择一个预测模型类型。可以从以下六种模型类型中选择:随机游动、移动平均、指数平滑、ARIMA、ARIMAX 和不可观测成分。

随机游动

要创建随机游动模型,请执行以下操作:
  1. 预测模型类型下拉列表中,选择随机游动模型
  2. 从以下随机游动模型类型中选择一种:
    • 漂移将创建漂移随机游动模型,或 ARIMA 表示法 ARIMA (0, 1, 0)。
    • 趋势
    • 季节将创建季节随机游动模型,或无截距的 ARIMA(0, 1, 0)(0, 1, 0)。
  3. 标题下,选择结果中要包含的图。您可以从多种序列图、残差图和预测图中选择。

移动平均

宽度为 k 的移动平均模型的公式是 y sub t , equals . fraction left bracket . y sub t minus 1 end sub . plus dot dot dot plus . y sub t minus k end sub . right bracket , over k end fraction . plus e r r o r. Click image for alternative formats.
在 ARIMA 表示法中,该模型是 ARIMA(k, 0, 0),无截距且有固定的自回归参数 (AR):eh r equals , 1 over k , comma , 1 over k , comma dot dot dot comma , 1 over k. Click image for alternative formats.
要创建移动平均模型,请执行以下操作:
  1. 预测模型类型下拉列表中,选择移动平均
  2. 窗口(期间)框中,指定移动平均的期间数。该值必须是大于 0 小于 14 的整数。
  3. 标题下,选择结果中要包含的图。您可以从多种序列图、残差图和预测图中选择。

指数平滑

指数平滑是一种预测方法,通过使用指数递减权重来生成时间序列值的加权移动平均。您可以从若干预测模型中选择。
要创建指数平滑模型,请执行以下操作:
  1. 预测模型类型下拉列表中,选择指数平滑
  2. 预测模型下拉列表中,选择要使用的模型。您可以从以下模型中选择:
    • 简单(一次)指数平滑(默认)
    • 二次 (Brown) 指数平滑
    • 线性 (Holt) 指数平滑
    • 阻尼趋势指数平滑
    • 加法季节指数平滑
    • 乘法季节指数平滑
    • Winters 乘法模型
    • Winter 加法模型
  3. 转换下拉列表中,选择要应用于时间序列的转换。默认情况下,不应用转换。如果选择 Box-Cox 转换,您必须在 Box-Cox 转换参数框中指定 -5 和 5 之间的参数值。
  4. 预测类型下拉列表中,指定模型使用均值预测还是中位数预测。
  5. 标题下,选择结果中要包含的图。您可以从多种模型图、误差图和预测图中选择。

ARIMA

创建自回归求和移动平均 (ARIMA) 模型时,您可以指定 ARIMA 模型的自回归和移动平均多项式。
要创建 ARIMA 模型,请执行以下操作:
  1. 预测模型类型下拉列表中,选择 ARIMA
  2. ARIMA 标题下,为 ARIMA 模型指定自回归阶数、差分阶数和移动平均阶数。
    简单 ARIMA 的选项如下:
    • 自回归阶数 (p) 指定简单自回归阶数。可以指定介于 0 和 13 之间的整数。默认值为 0。
    • 差分阶数 (d) 指定简单差分阶数。可以指定介于 0 和 13 之间的整数。默认值为 0。
    • 移动平均阶数 (q) 指定简单移动平均。可以指定介于 0 和 13 之间的整数。默认值为 0。
    季节 ARIMA 的选项如下:
    • 自回归阶数 (P) 指定季节自回归阶数。可以指定介于 0 和 5 之间的整数。默认值为 0。
    • 差分阶数 (D) 指定简单差分阶数。可以指定介于 0 和 3 之间的整数。默认值为 0。
    • 移动平均阶数 (Q) 指定简单移动平均。可以指定介于 0 和 5 之间的整数。默认值为 0。
  3. 指定是否在模型中包括截距。默认情况下包括截距。
  4. 标题下,选择结果中要包含的图。您可以从多种序列图、残差图和预测图中选择。

ARIMAX

创建自回归求和移动平均 (ARIMA) 模型时,您可以指定 ARIMA 模型的自回归和移动平均多项式。在 ARIMAX 模型中,也可以将自变量包含在模型中。
要创建 ARIMAX 模型,请执行以下操作:
  1. 预测模型类型下拉列表中,选择 ARIMAX
  2. ARIMA 标题下,为 ARIMA 模型指定自回归阶数、差分阶数和移动平均阶数。
    简单 ARIMA 的选项如下:
    • 自回归阶数 (p) 指定简单自回归阶数。可以指定介于 0 和 13 之间的整数。默认值为 0。
    • 差分阶数 (d) 指定简单差分阶数。可以指定介于 0 和 13 之间的整数。默认值为 0。
    • 移动平均阶数 (q) 指定简单移动平均。可以指定介于 0 和 13 之间的整数。默认值为 0。
    季节 ARIMA 的选项如下:
    • 自回归阶数 (P) 指定季节自回归阶数。可以指定介于 0 和 5 之间的整数。默认值为 0。
    • 差分阶数 (D) 指定简单差分阶数。可以指定介于 0 和 3 之间的整数。默认值为 0。
    • 移动平均阶数 (Q) 指定简单移动平均。可以指定介于 0 和 5 之间的整数。默认值为 0。
  3. 自变量角色中,分配要在该模型中包括的输入数据集的变量。
  4. 指定是否在模型中包括截距。默认情况下包括截距。
  5. 标题下,选择结果中要包含的图。您可以从多种序列图、残差图和预测图中选择。

不可观测成分

要创建不可观测成分模型,请执行以下操作:
  1. 预测模型类型下拉列表中,选择不可观测成分
  2. (可选)要在该模型中包括自变量,展开回归效应标题,然后选择包括自变量复选框。将您想在该模型中包括的变量分配至自变量角色。
  3. 要包括不规则成分,展开不规则成分标题,然后选择包括不规则成分复选框。默认情况下包括不规则成分。
    不规则成分对应于该模型中的总随机误差。初始方差是在参数估计过程中作为初始值使用的值。要更改该值,选择指定方差,然后输入其他值。要将该值保留为初始方差,选择修正方差值
  4. 要包括趋势成分,展开趋势成分标题。水平成分和斜率成分组合起来以定义模型的趋势成分。如果您指定了水平和斜率成分,则将获得本地线性趋势。如果省略斜率成分,则系统将使用本地水平。
    1. 要在模型中包括水平成分,选择包括水平成分复选框。(默认情况下,包括水平成分。)然后您可以指定是否更改初始方差(默认为 0)以及是否查看水平中断。
    2. 要在模型中包括斜率成分,选择包括斜率成分复选框。然后您可以指定是否更改初始方差(默认为 0)。
  5. (可选)要包括季节成分,季节长度必须大于 1。展开季节成分标题,然后选择包括季节成分复选框。指定季节成分类型。季节成分可以是“虚拟”或“三角”这两种类型中的一种。您也可以指定是否更改初始方差(默认为 0)。
  6. (可选)要包括周期成分,展开周期成分标题,然后选择包括周期成分复选框。您可以指定以下选项:
    • 要指定在参数估计过程中使用的初始周期期间,选择指定周期期间复选框。然后在框中指定初始值。该值必须是大于 2 的整数。默认情况下,初始值为 3。
    • 要指定在参数估计过程中使用的初始阻尼因子,选择指定阻尼因子复选框,然后在框中指定初始值。您可以指定大于 0 小于等于 1 的任何值。默认情况下,初始值为 0.01。
    • 要为任务在参数估计过程中所使用的扰动方差参数指定初始值,选择指定方差复选框。然后在框中指定初始值。该值必须大于等于 0。默认情况下,初始值为 0。
  7. 标题下,选择结果中要包含的图。您可以从多种残差图、平滑成分估计、过滤成分估计以及序列分解和预测图中选择。

设置预测选项

选项
说明
预测设置
要预测的期间数
指定未来要进行多步预测的期间数。范围值越大,范围末尾的预测误差方差就越大。默认情况下,范围为 12。有效值是大于等于 0 且小于 32,768 的整数。
预测置信水平
指定序列的置信水平。默认情况下,该置信水平为 95%。
要阻止的期间数
指定要阻止的实际时间序列值的子集,从上个非缺失观测结尾开始。有效值是大于等于 0 且小于 32,768 的整数。
离群值检测
注: 如果您选择指数平滑作为预测模型类型,则该选项不可用。
执行离群值检测
指定在模型创建过程中自动检测出的任何离群值均为模型的输入。

设置输出选项

要创建输出数据集,点击输出选项卡。您可以创建的输出数据集类型取决于预测模型类型。
上一页|下一页|页首