前のページ|次のページ

時系列データの準備タスク

時系列データの準備タスクについて

時系列データの準備タスクは、トランザクションデータを等間隔の時系列データに変えます。時系列分析を行うにはこの形式が必要です。このタスクは、タイムID変数を必要としません。時間ID変数が指定されていない場合、オブザベーション番号が時系列のIDです。

SAS時間間隔について

時間データの準備タスクは、時間IDの役割に割り当てられた変数を分析してデータの時間間隔を検出します。SASは、時間ID変数のすべての値が日付または日時のいずれかの値であると見なし、その大きさによって値を区別します。この前提は、日付が2196年7月21日より後か日時が1960年1月1日より前の場合は成立しません。
多くの企業では、その時系列データは等間隔であるか、または任意の2つの連続したインデックスが同じ時間間隔を有します。次の表は、1年間隔の等間隔時系列を示しています。
販売数
2012
42,100
2013
45,000
2014
47,000
2015
50,000
割り当てられた変数から時間間隔を検出できない場合、間隔と季節の長さを指定する必要があります。たとえば、次の表は、不等間隔の時系列を示しています。
販売数
2009
32,100
2010
45,000
2014
47,000
2015
50,000
多くの場合、トランザクションデータ(非特定の度数で記録されたタイムスタンプ付きデータ)では、時間間隔を検出することができません。この場合、タスクは、指定した間隔に対応するオブザベーションにデータを累積します。非トランザクションデータでは、データに多くのギャップ(欠損値)がある場合、間隔と季節の長さを指定する必要があります。この場合、タスクが欠損値を提供します。検証ルーチンが時間IDの値を調べてそれらがユーザーが指定した間隔で配置されているかどうか確認します。
間隔は、出力の度数を決定します。ユーザーが時間間隔を変更することができます。間隔をより高い度数から低い度数にまたはより低い度数から高い度数に変更することができます。時間間隔は、SASでは文字列を使用して指定されています。これらの文字列は、それぞれ一連の規則に従ってほとんど無限に属性集を作成できるよう形成されています。各時間間隔に対して、種類(たとえば、毎月または毎週)、乗数、およびシフト(間隔のオフセット)を指定することができます。入力データにある時間間隔より長いものを指定することができます。小さな間隔は多数のオブザベーションを生成するので、より小さい間隔は使用すべきではありません。
季節サイクルの長さは、季節の長さを指定します。タスクが時間ID変数から季節の長さを確認できる場合、この値は自動的に入力されます。しかし、データのサイクルをモデリングしたい場合は、デフォルト以外の季節の長さを指定することができます。たとえば、データが13週間のサイクルを含む場合があり、そのときは13週間の季節の長さを指定する必要があります。
間隔の構文は次のとおりです。
name<multipler><.shift>
各ユーザー提供値の説明は次のとおりです。
name
は間隔の名前です。
multipler
間隔の乗数を指定します。この値は、任意の正の数とすることができます。デフォルトでは、乗数は1です。たとえば、YEAR2は2年間の間隔を示します。
.shift
間隔の開始点を指定します。デフォルトでは、この値は1です。1より大きい値は、開始を間隔内の後の時点にシフトします。シフトの単位は間隔によって異なります。たとえば、YEAR.4は4ヶ月のシフトを指定するので、年は4月1日から翌年3月31日までです。
次の表の例は、間隔、季節の長さ、乗数、およびシフトに指定する値がどのように作用するかを示しています。
間隔名(SASコード形式)
デフォルト
シフト期間
YEARm.s
1月1日
YEAR2.7は2年ごとの間隔を指定します。シフトの値が7なので、年の最初の月は7月です。
QTRm.s
1月1日
4月1日
7月1日
10月1日
QTR3.2は4月1日、7月1日、10月1日、1月1日から始まる3ヶ月間隔を指定します。
MONTHm.s
各月の1日
MONTH2.2は、2から3月、4から5月、6から7月、8から9月、10から11月、12月から翌年の1月を指定します。
WEEKm.s
各日曜日
(1=日曜...
7=土曜)
WEEK6.3は、火曜日から始まる6週間の間隔を指定します。
DAYm.s
毎日
DAY3は、日曜日に始まる3日間の間隔を指定します。

例:SASHELP.PRICEDATAデータセット内のデータの変換

この例を作成するには、次の操作を実行します。
  1. タスクセクションで、予測フォルダを展開し、時系列データの準備をダブルクリックします。時系列データの準備タスクのユーザーインターフェイスが開きます。
  2. データタブで、SASHELP.PRICEDATAデータセットを選択します。
  3. 次の役割に列を割り当てます。
    役割
    役割
    時系列変数
    売上
    価格1
    追加役割
    時間ID
    日付
    プロパティ
    間隔
    四半期
  4. 変換タブをクリックして売上変数の以下の値を指定します。
    • 累積ドロップダウンリストから合計を選択します。
    • 変換ドロップダウンリストから対数を選択します。
    • 階差ボックスに、1を入力します。
    • 季節階差ボックスに、0を入力します。
  5. 価格変数には、累積ドロップダウンリストから合計を選択します。
  6. 出力タブをクリックします。出力データを表示するチェックボックスを選択します。表示するオブザベーションの数ボックスに、10を入力します。
  7. タスクを実行するには、実行をクリックします。
結果は次のようになります。
WORK.tsPrepのサブセット

役割へのデータの割り当て

時系列データの準備タスクを実行するには、時系列変数役割に列を割り当てる必要があります。
役割
説明
役割
時系列変数
タイムスタンプ付きのデータを含む変数を示します
欠損値の処理
タイムスタンプ付きのデータ内の欠損値の処理方法を指定します。次のオプションのいずれかを選択できます。
  • 欠損値
  • 累積時系列の平均値
  • 累積時系列の最小値
  • 累積時系列の中央値
  • 累積時系列の最大値
  • 累積時系列の最初の非欠損値
  • 累積時系列の最後の非欠損値
  • 前期の累積非欠損値欠損値は、前の累積非欠損値に設定されます。累積時系列の先頭の欠損値は、欠落したままになります。
  • 次期の累積非欠損値欠損値は、次の累積非欠損値に設定されます。累積時系列の最後の欠損値は、欠落したままになります。
  • 数値は、欠損値に使用する値を指定します。
追加役割
時間ID
時間ID値を含む列を指定します。
プロパティ
間隔
時間ID変数の間隔を指定します。時間間隔の詳細については、SAS時間間隔についてを参照してください。
乗数
時間間隔の乗数を指定します。デフォルトでは、乗数は1です。この値は負にすることはできません。
シフト
時間間隔のシフトを指定します。デフォルトでは、この値は1です。この値は負にすることはできません。
季節長
時間間隔の季節性を指定します。デフォルト値は、時間間隔に依存します。
追加役割
季節長
時間ID変数を割り当てない場合に、データの季節性を指定することができます。
グループ分析
分類(BY)変数として使用する1つまたは複数の変数を示します。

変換オプションの設定

変換テーブルには、時系列変数役割に割り当てる各列に対して1つの行があります。
オプション名
説明
累積
変数の累積方法を指定します。このオプションは、時間ID変数役割に変数を割り当てた場合に使用できます。
次のオプションのいずれかを選択できます。
なし
ベクトル値を累積しません。
合計
ベクトル値をそれらの値の合計に基づいて累積します。
欠損値は合計では無視されます。q sub n , equals 0. Click image for alternative formats.ならば、aが欠損値に設定されます。
平均
ベクトル値をそれらの値の平均に基づいて累積します。
欠損値は合計では無視されます。q sub n , equals 0. Click image for alternative formats.ならば、aが欠損値に設定されます。
変換
時系列変数に適用する変換を指定します。次の変換のいずれかを選択できます。
  • 対数
  • 平方根
  • ロジスティク
階差
階差の値を指定します。
季節階差
季節階差の値を指定します。このオプションは、データタブの季節の長さオプションが1より大きい場合に使用できます。

出力データセットの作成

出力データを表示するチェックボックス 出力データを結果タブに表示される結果に含めるかどうかを指定します。出力データの全部または一部を含めることができます。タスクは、常に出力データタブに表示される出力データセットを作成します。このデータセットは、指定した場所にも保存されます。
前のページ|次のページ|ページの先頭へ