前のページ|次のページ

データの標準化タスク

データの標準化タスクについて

データの標準化タスクでは、さまざまな手法を使用して1つ以上の数値変数を中心化や標準化できます。標準化された変数は、出力データセットに保存されます。

例:SASHELP.BASEBALLデータセット内の標準化された変数

この例を作成するには、次の操作を実行します。
  1. タスクセクションで、データフォルダを展開し、データの標準化をダブルクリックします。データの標準化タスクのユーザーインターフェイスが開きます。
  2. データタブで、SASHELP.BASEBALLデータセットを選択します。
  3. nHits列を標準化する変数役割に割り当てます。
  4. タスクを実行するには、実行をクリックします。
出力データのサブセットを示します。
データの標準化タスクの出力データのサブセット

役割へのデータの割り当て

データの標準化タスクを実行するには、標準化する変数役割に列を割り当てる必要があります。
役割
説明
役割
標準化する変数
標準化する数値変数が一覧表示されます。
追加役割
度数カウント
オブザベーション内の他の値の出現度数を含む変数です。このタスクは、各オブザベーションがn回出現したかのようにデータを処理します。ここで、nは、オブザベーションのcount変数の度数です。
重み
各オブザベーションを重み付けするために使用される値で、入力データ内の数値変数を指定します。これらの値は、整数である必要はありません。オブザベーションは、重み変数の値がゼロより大きい場合にのみ、分析に使用されます。
グループ分析
BY変数で定義されたグループに、オブザベーションの個別の分析値を作成します。

オプションの設定

オプション名
説明
手法
データの中心化のみ
平均または中央値標準化法のいずれかを使用することを指定します。
標準化法
次の標準化法のいずれかを使用することを指定します。
  • 標準偏差 (デフォルトであり、ほとんどの場合に標準化に対応する方式です)
  • Andrewの波形関数の推定この方法の調整定数は0より大きくなければなりません。デフォルト値は、4.7です。
  • ユークリッド距離
  • Huberの推定この方法の調整定数は0より大きくなければなりません。デフォルト値は、1です。
  • 四分位範囲
  • 範囲
  • 合計
  • Tukeyの双加重の推定この方法の調整定数は0より大きくなければなりません。デフォルト値は、6です。(Goodall 1983)
欠損値の処理
欠損値の処理法
欠損値を含むオブザベーションを削除するか欠損値を置き換えるるかどうかを指定します。以下のオプションで欠損値を置き換えることができます。
  • デフォルトの位置のメジャーは、選択された中心化または標準化法で使用される位置のメジャーです。
  • 平均
  • 中央値
  • 最小
  • カスタム値を指定するでは、標準化するすべての変数の値を指定することができます。
統計量
位置と尺度のメジャーの表示
結果に位置と尺度のメジャーを表示します。これらのメジャーから、標準化処理の結果がどのようなものか推測できます。

出力オプションの設定

デフォルトでは、データの標準化タスクは、元の変数と標準化された変数を含む出力データセットを作成します。元の変数と標準化された変数を区別するために、変数名に接頭辞を追加することができます。デフォルトでは、タスクは標準化した変数に接頭辞Standardize_を追加します。
出力データを表示する オプション出力データを結果タブに表示される結果に含めるかどうかを指定します。出力データの全部または一部を含めることができます。タスクは、常に出力データタブに表示される出力データセットを作成します。このデータセットは、指定した場所にも保存されます。
前のページ|次のページ|ページの先頭へ