前のページ|次のページ

モデリングと時系列予測タスク

モデリングと時系列予測タスクについて

モデリングと時系列予測タスクは、時系列データを使用する予測モデルを作成します。このタスクは、有効な時系列形式のデータを必要とします。このデータを作成するには、モデリングと時系列予測タスクを実行する前に時系列デーの準備タスクを使用します。

例:SASHELP.PRICEDATAデータセットのランダムウォークモデルの作成

この例を作成するには、次の操作を実行します。
  1. タスクセクションで、予測フォルダを展開し、モデリングと時系列予測をダブルクリックします。モデリングと時系列予測タスクのユーザーインターフェイスが開きます。
  2. データタブで、SASHELP.PRICEDATAデータセットを選択します。
  3. 次の役割に列を割り当て、オプションを指定します。
    役割
    役割
    従属変数
    売上
    追加役割
    時間ID
    日付
    プロパティ
    季節長
    12
  4. モデルタブをクリックし、次のオプションを選択します。
    • 予測モデルの種類ドロップダウンリストから ランダムウォークを選択します。
    • モデル設定見出しの下で、ドリフト季節チェックボックスを選択します。
  5. タスクを実行するには、実行をクリックします。
結果は、Sashelp.Pricedataデータセットのランダムウォークモデルを示します。
Sashelp.Pricedataデータセットのランダムウォークモデル

役割へのデータの割り当て

モデリングと時系列予測タスクを実行するには、従属変数役割に列を割り当て、モデルタブで予測モデルの種類を指定する必要があります。
役割とオプション
説明
役割
従属変数
従属変数を指定します。
追加役割
時間ID
時間ID値を含む列を指定します。
プロパティ
間隔
時間ID変数の間隔を示します。SAS時間間隔の詳細については、SAS時間間隔についてを参照してください。
注: この値は、入力データセットによって決定されます。モデリングと時系列予測タスクでこの値を変更することはできません。
乗数
時間間隔の乗数を示します。デフォルトでは、乗数は1です。
注: この値は、入力データセットによって決定されます。モデリングと時系列予測タスクでこの値を変更することはできません。
シフト
時間間隔のシフトを示します。デフォルトでは、この値は1です。
注: この値は、入力データセットによって決定されます。モデリングと時系列予測タスクでこの値を変更することはできません。
季節長
時間間隔の季節性を指定します。デフォルト値は、時間間隔に依存します。
追加役割
季節長
時間ID変数を割り当てない場合に、データの季節性を指定することができます。
グループ分析
分類(BY)変数として使用する1つまたは複数の変数を示します。

モデルオプションの設定

モデリングと時系列予測タスクを使用するには、予測モデルの種類を選択する必要があります。ランダムウォーク、移動平均、指数平滑化、ARIMA、ARIMAX、および観測不能成分の6つのモデルの種類から選択することができます。

ランダムウォーク

ランダムウォークモデルを作成するには、次の操作を実行します。
  1. 予測モデルの種類ドロップダウンリストから ランダムウォークを選択します。
  2. 以下のランダムウォークモデルの種類のいずれかを選択します。
    • ドリフトは、ドリフトを含む、またはARIMA記述ARIMA(0, 1, 0)のランダムウォークモデルを作成します。
    • トレンド
    • 季節は、季節ランダムウォークまたは切片がないARIMA(0, 1, 0)(0, 1, 0)を作成します。
  3. プロット見出しの下で、結果に含めるプロットを選択します。各種の時系列プロット、残差プロット、および予測プロットから選択することができます。

移動平均

幅がkの移動平均の式はy sub t , equals . fraction left bracket . y sub t minus 1 end sub . plus dot dot dot plus . y sub t minus k end sub . right bracket , over k end fraction . plus e r r o r. Click image for alternative formats.です。
ARIMA記述では、このモデルは切片がなく、自己回帰パラメータ(AR)が固定されているARIMA(k, 0, 0)です。eh r equals , 1 over k , comma , 1 over k , comma dot dot dot comma , 1 over k. Click image for alternative formats.
移動平均モデルを作成するには、次の操作を実行します。
  1. 予測モデルの種類ドロップダウンリストから 移動平均を選択します。
  2. 枠(期間)ボックスで、移動平均の期間の数を指定します。この値は、0より大きく14未満の整数でなければなりません。
  3. プロット見出しの下で、結果に含めるプロットを選択します。各種の時系列プロット、残差プロット、および予測プロットから選択することができます。

指数平滑化

指数平滑化は、指数関数的に減少する重みを使用して時系列値の加重移動平均を生成する予測手法です。いくつかの予測モデルから選択することができます。
指数平滑化モデルを作成するには、次の操作を実行します。
  1. 予測モデルの種類ドロップダウンリストから 指数平滑化を選択します。
  2. 予測モデルドロップダウンリストから、使用するモデルを選択します。次のモデルから選択することができます。
    • 単純(single)指数平滑化(デフォルト)
    • 二重(Brown)指数平滑化
    • 線形(Holt)指数平滑化
    • 減衰傾向指数平滑化
    • 加法型季節指数平滑化
    • 乗法型季節指数平滑化
    • Winters乗法型モデル
    • Winter加法型モデル
  3. 変換ドロップダウンリストから、時系列に適用する変換を選択します。デフォルトでは、変換は適用されません。Box-Cox変換を選択した場合、Box-Cox 変換ボックスに-5から5の間のパラメータ値を指定する必要があります。
  4. 予測の種類ドロップダウンリストから、モデルが平均の予測を使用するか中央値の予測を使用するかを指定します。
  5. プロット見出しの下で、結果に含めるプロットを選択します。各種のモデルプロット、エラープロット、および予測プロットから選択することができます。

ARIMA

自己回帰統合移動平均(ARIMA)モデルを作成するとき、ARIMAモデルの自己回帰および移動平均多項式を指定することができます。
ARIMAモデルを作成するには、次の操作を実行します。
  1. 予測モデルの種類ドロップダウンリストから ARIMAを選択します。
  2. ARIMA見出しの下で、ARIMAモデルの自己回帰、階差、および移動平均次数を指定します。
    単純ARIMAのオプションは次のとおりです。
    • 自己回帰の次数(p)は、単純自己回帰次数を指定します。0から13までの整数を指定することができます。デフォルト値は、0です。
    • 階差の次数(d)は、単純階差次数を指定します。0から13までの整数を指定することができます。デフォルト値は、0です。
    • 移動平均の次数(q)は、単純移動平均を指定します。0から13までの整数を指定することができます。デフォルト値は、0です。
    季節ARIMAのオプションは次のとおりです。
    • 自己回帰の次数(P)は、季節自己回帰次数を指定します。0から5までの整数を指定することができます。デフォルト値は、0です。
    • 階差の次数(D)は、単純階差次数を指定します。0から3までの整数を指定することができます。デフォルト値は、0です。
    • 移動平均の次数(Q)は、単純移動平均を指定します。0から5までの整数を指定することができます。デフォルト値は、0です。
  3. モデルに切片を含めるかどうかを指定します。切片はデフォルトで含まれています。
  4. プロット見出しの下で、結果に含めるプロットを選択します。各種の時系列プロット、残差プロット、および予測プロットから選択することができます。

ARIMAX

自己回帰統合移動平均(ARIMA)モデルを作成するとき、ARIMAモデルの自己回帰および移動平均多項式を指定することができます。ARIMAXモデルでは、モデルに独立変数を含めることもできます。
ARIMAXモデルを作成するには、次の操作を実行します。
  1. 予測モデルの種類ドロップダウンリストから ARIMAXを選択します。
  2. ARIMA見出しの下で、ARIMAモデルの自己回帰、階差、および移動平均次数を指定します。
    単純ARIMAのオプションは次のとおりです。
    • 自己回帰の次数(p)は、単純自己回帰次数を指定します。0から13までの整数を指定することができます。デフォルト値は、0です。
    • 階差の次数(d)は、単純階差次数を指定します。0から13までの整数を指定することができます。デフォルト値は、0です。
    • 移動平均の次数(q)は、単純移動平均を指定します。0から13までの整数を指定することができます。デフォルト値は、0です。
    季節ARIMAのオプションは次のとおりです。
    • 自己回帰の次数(P)は、季節自己回帰次数を指定します。0から5までの整数を指定することができます。デフォルト値は、0です。
    • 階差の次数(D)は、単純階差次数を指定します。0から3までの整数を指定することができます。デフォルト値は、0です。
    • 移動平均の次数(Q)は、単純移動平均を指定します。0から5までの整数を指定することができます。デフォルト値は、0です。
  3. 独立変数役割で、モデルに含める入力データセットの変数を割り当てます。
  4. モデルに切片を含めるかどうかを指定します。切片はデフォルトで含まれています。
  5. プロット見出しの下で、結果に含めるプロットを選択します。各種の時系列プロット、残差プロット、および予測プロットから選択することができます。

観測不能成分

観測不能成分モデルを作成するには、次の操作を実行します。
  1. 予測モデルの種類ドロップダウンリストから 予想不能成分を選択します。
  2. (オプション)モデルに独立変数を含めるには、回帰効果見出しを展開し、独立変数を含めるチェックボックスを選択します。モデルに含める変数を独立変数役割に割り当てます。
  3. 不規則成分を含めるには、不規則成分見出しを展開し、不規則成分を含めるチェックボックスを選択します。不規則成分がデフォルトで含まれます。
    不規則成分は、モデル内の全般的なランダムエラーに対応します。初期分散は、パラメータ推定処理中に初期値として使用される値です。この値を変更するには、分散の指定を選択して異なる値を入力します。この値を初期分散として保持するには、分散値を固定しますを選択します。
  4. トレンド成分を含めるには、トレンド成分見出しを展開します。レベル成分と傾き成分が結合してモデルのトレンド成分を定義します。レベルと傾き成分の両方を指定すると、局所的に線形なトレンドが得られます。傾き成分を省略すると、ローカルレベルが使用されます。
    1. モデルにレベル成分を含めるにはレベル成分を含めるチェックボックスを選択します。(レベル成分がデフォルトで含まれます。)次に、初期分散を変更するかどうか(デフォルトで0)およびレベルの分割を調べるかどうかを指定できます。
    2. モデルに傾き成分を含めるには傾き成分を含めるチェックボックスを選択します。次に、初期分散を変更するかどうか(デフォルトで0)を調べるかどうかを指定できます。
  5. (オプション)季節成分を含めるには、季節長が1より大きい必要があります。季節成分見出しを展開し、季節成分を含めるチェックボックスを選択します。季節成分の種類を指定します。季節成分は、ダミーまたは三角法の2つの種類のいずれかになります。初期分散を変更するかどうか(デフォルトで0)を指定することもできます。
  6. (オプション)サイクル成分を含めるには、サイクル成分見出しを展開し、サイクル成分を含めるチェックボックスを選択します。次のオプションを指定できます。
    • パラメータ推定処理中に使用する初期サイクル期間を指定するには、サイクル期間の指定チェックボックスを選択します。次に、ボックス内に初期値を指定します。この値は2より大きい整数でなければなりません。デフォルトでは、初期値は3です。
    • パラメータ推定処理中に使用する初期減衰因子を指定するには、減衰因子の指定チェックボックスを選択してボックス内に初期値を指定します。0と1の間の任意の値(0を除くが、1を含む)を指定することができます。デフォルトでは、初期値は0.01です。
    • タスクがパラメータ推定処理中に使用する外乱分散パラメータの初期値を指定するには、分散の指定チェックボックスを選択します。次に、ボックス内に初期値を指定します。この値は0以上である必要があります。デフォルトでは、初期値は0です。
  7. プロット見出しの下で、結果に含めるプロットを選択します。各種の残差プロット、平滑化された成分推定値、フィルタが適用された成分推定値、および系列分解と予測プロットの中から選択することができます。

予測オプションの設定

オプション
説明
予測設定
予測する期間数
多段階予測を行う将来の期間の数を指定します。予測期間が長いほど、予測期間終了時の予測エラー分散が大きくなります。デフォルトでは予測期間は12です。有効な値は、0以上32,768未満の整数です。
予測の信頼水準
時系列の信頼水準を指定します。デフォルトで信頼水準は95%です。
遅らせる期間数
最後の非欠損オブザベーションから始めて遅らせる実際の時系列値を指定します。有効な値は、0以上32,768未満の整数です。
外れ値検出
注: このオプションは、予測モデルの種類として指数平滑化を選択している場合には使用できません。
外れ値検出の実行
モデルの作成中に自動的に検出されるすべての外れ値がモデルの入力であることを指定します。

出力オプションの設定

出力データセットを作成するには、出力タブをクリックします。作成できる出力データセットの種類は、予測モデルの種類によって異なります。
前のページ|次のページ|ページの先頭へ