前のページ|次のページ

連続データのビン化タスク

連続データのビン化タスクについて

連続データのビン化タスクは、データ準備タスクです。このタスクでは、連続変数のデータ値をいくつかの間隔に分割し、各間隔の値をそれぞれの間隔の1つの代表値で置き換えます。
注: このタスクは、SAS 9.4以降を実行していて、SAS/STATを保有している場合にのみ使用できます。

例:ウィンザー化ビン化

この例では、タスクを使用して入力データの基本的なウィンザー化統計情報を取得します。
この例を作成するには、次の操作を実行します。
  1. Work.Ex12データセットを作成するには、プログラムタブに次のコードを入力します。
    data ex12;
       length id 8;
       do id=1 to 10000;
          x1 = ranuni(101);
          x2 = 10*ranuni(201);
          x3 = 100*ranuni(301);
          output;
       end;
    run;
    実行をクリックします。
  2. タスクセクションで、ハイパフォーマンス統計量フォルダを展開し、ビン連続データをダブルクリックします。連続データのビン化タスクのユーザーインターフェイスが開きます。
  3. データタブで、WORK.EX12データセットを選択します。
  4. ビン化する変数役割にx1およびx2列を割り当てます。
  5. オプションタブを選択して、次のオプションを指定します。
    • ビン数ボックスに、10を入力します。
    • 選択方法ドロップダウンリストで、ウィンザー化ビン化を選択します。
  6. タスクを実行するには、実行をクリックします。
結果の一部を次に示します。
パフォーマンス情報、ビン化情報およびマッピング

役割へのデータの割り当て

連続データのビン化タスクを実行するには、ビン化する変数役割に変数を割り当てる必要があります。
役割
説明
役割
ビン化する変数
ビン化対象の入力変数として1つ以上の変数を指定します。間隔変数を指定する必要があります。
追加役割
度数カウント
各オブザベーションの出現度数を表す数値変数を指定します。度数値が1未満か、欠損している場合、そのオブザベーションは分析で使用されません。変数を度数カウント役割に割り当てない場合、各オブザベーションに度数1が割り当てられます。

オプションの設定

オプション名
説明
手法
ビン数
すべてのビン化変数のビン化レベルの総数を指定します。2~1000(2と1000を含む)の任意の整数を指定できます。デフォルトのビン化レベル数は16です。
手法
使用するビン化方法を指定します。
  • バケットビン化では、長さの等しいビンを作成し、それらのビンのいずれかにデータを割り当てます。ビン化中にビン数を指定できます。デフォルトのビン(ビン化レベル)数は16です。
  • ウィンザー化ビン化は、両端を切り捨てて滑らかなビン化結果を得る点を除き、バケットビン化と同じです。この手法は、データ準備段階で異常値を削除する目的でよく使用されます。
    ウィンザーレートオプションの値を指定する必要があります。有効な値は0.0から0.5(0.0と0.5を含まない)です。デフォルト値は、0.05です。
  • 擬似分位点ビン化では、分位点ビン化方法の結果を模倣しますが、CPU時間とメモリの消費量を減らして効率を高めます。
統計量
表示する統計量を選択する
結果に統計量を含めるかどうか指定できます。
含めることができる追加統計量を次に示します。
  • 基本統計量を使用すると、各ビン化変数の平均、擬似平均、標準偏差、最小値、最大値、ビン数が表示されます。
  • 分位点統計量を使用すると、推定分位点と極値テーブルが表示されます。

出力データセットの作成

結果を出力データセットに保存するかどうかを指定できます。出力データセットに含める追加変数役割で、出力データセットに含める列を入力データセットから指定します。
結果に出力データの全部または一部を表示するには、出力データを表示するを選択します。
前のページ|次のページ|ページの先頭へ