前のページ|次のページ

一般化線形モデル

一般化線形モデルタスクについて

一般化線形モデルタスクは、一般化線形モデルのモデル当てはめおよびモデル構築に利用できるハイパフォーマンスタスクです。このタスクでは、正規分布、Poisson分布、Tweedie分布などの指数型分布族に属する標準分布モデルの当てはめを行います。また、順序応答および公称応答の多項モデルの当てはめにも対応しています。タスクには、選択方法として変数増加法、変数減少法および変数増減法(ステップワイズ法)が用意されています。
注: このタスクは、SAS 9.4以降を実行していて、SAS/STATを所有している場合にのみ使用できます。

例:モデルの選択

この例を作成するには、次の操作を実行します。
  1. Work.getStartedデータセットを作成します。詳細については、GETSTARTEDデータセットを参照してください。
  2. タスクセクションで、ハイパフォーマンス統計量フォルダを展開し、一般化線形モデルをダブルクリックします。一般化線形モデルタスクのユーザーインターフェイスが開きます。
  3. データタブで、WORK.GETSTARTEDデータセットを選択します。
  4. 次の役割に列を割り当てます。
    役割またはオプション名
    列名
    分布
    Poisson
    応答変数
    Y
    分類変数
    C1
    C2
    C3
    C4
    C5
  5. モデルタブをクリックします。変数ボックスで、C1–C5を選択します。追加をクリックします。
  6. 選択タブをクリックします。選択方法ドロップダウンリストで、変数増加法を選択します。
  7. タスクを実行するには、実行をクリックします。
結果の一部を次に示します。
パフォーマンス情報、モデル情報、選択情報、クラスレベル情報

役割へのデータの割り当て

一般化線形モデルタスクを実行するには、応答変数役割に列を割り当てる必要があります。
オプション名
説明
役割
応答
分布
モデルの分布を指定します。次の分布から選択できます。
  • 二項分布
  • ガンマ分布
  • 逆Gaussian分布
  • 多項分布
  • 負の二項分布
  • 正規分布
  • Poisson
  • Tweedie分布
二項分布のオプション
Response data consists of numbers of events and trials
データを、正の応答(イベント)の数を指定する変数と、試行の数を指定する別の変数のどちらでで構成するかを指定します。
イベント数
イベント数を含む列を指定します。
試行数
試行数を含む列を指定します。
応答
応答値を含む変数を指定します。
二項応答モデルを作成する場合は、関心のあるイベントオプションを使用して順序が最初または最後のカテゴリを参照カテゴリとして指定できます。カスタムカテゴリを選択することもできます。
注: このオプションは、Response data consists of numbers of events and trialsチェックボックスを選択しなかった場合にのみ利用できます。
すべての分布タイプのオプション
応答
応答値を含む変数を指定します。
二項応答モデルまたは正規多項モデルを作成する場合は、関心のあるイベントオプションを使用して参照カテゴリとして順序が最初または最後のカテゴリを指定できます。カスタムカテゴリを選択することもできます。
  • 二項応答モデルを作成するには、分布としてBinomialを選択します。二項応答モデルの場合、1つの応答カテゴリを参照として指定することは、他の応答カテゴリをイベントカテゴリとして指定することと同じです。
  • 正規多項モデルを作成するには、分布としてMultinomialを選択し、リンク関数として一般化ロジットを選択します。一般化ロジットモデル場合、各ロジットは非参照カテゴリを参照カテゴリと対比します。
リンク関数
モデルのリンク関数を指定します。利用可能な関数は、選択した分布によって異なります。
リンク関数にDefaultを選択した場合は、モデル分布のデフォルトのリンク関数が使用されます。
分布と対応するデフォルトのリンク関数のリストを次に示します。
  • 二項分布では、ロジットリンク関数を使用します。
  • ガンマ分布では、逆リンク関数を使用します。
  • 逆Gauss分布では、平方の逆リンク関数を使用します。
  • 多項分布では、累積ロジットリンク関数を使用します。
  • 負の二項分布では、対数リンク関数を使用します。
  • 正規分布では、恒等リンク関数を使用します。
  • Poisson分布では、対数リンク関数を使用します。
  • Tweedie分布では、対数リンク関数を使用します。
説明変数
分類変数
分析でデータのグループ化(分類)に使用する変数を指定します。分類変数は文字でも数値でもかまいません。
効果のパラメータ化
コーディング
分類変数のパラメータ化方法を指定します。選択したコーディングスキーマに従って、分類変数から設計行列の列が作成されます。
次のコーディングスキーマから選択できます。
  • GLM codingフルランク未満の参照セルコーディングを指定します。このコーディングスキーマがデフォルトです。
  • Reference coding参照セルコーディングを指定します。
欠損値の処理
次の条件のいずれかが満たされた場合、オブザベーションは分析対象から除外されます。
  • モデル内の変数に欠損値が含まれる場合
  • (分類変数がモデルで使用されているかどうかにかかわらず)分類変数に欠損値が含まれる場合
連続変数
回帰分析モデルの独立共変量(回帰変数)を指定します。連続変数を指定しない場合、タスクでは切片のみを使用するモデルの当てはめを行います。
オフセット変数
線形予測子に対するオフセットとして使用する変数を指定します。オフセットは、係数が1となる効果として働きます。オフセット変数の値が欠損しているオブザベーションは、分析から除外されます。
追加役割
度数カウント
各オブザベーションの出現度数を表す数値列を指定します。
重み変数
データの重み付き分析を実行する際に重みとして使用する列を指定します。

モデルの構築

モデル構築の要件

デフォルトでは、効果が指定されていないため、切片のみのモデルの当てはめが行われます。効果を指定するには、分類変数役割または連続変数役割に少なくとも1つの変数を割り当てる必要があります。変数の組み合わせを選択し、クロス、ネスト、組み合わせまたは多項式の各効果を作成できます。
モデルを作成するには、モデルタブでモデルビルダを使用します。モデルを作成したら、モデルに切片を含めるかどうかを指定できます。

主効果の作成

  1. 変数ボックスで変数名を選択します。
  2. 列の追加をクリックして、モデル効果ボックスに変数を追加します。

クロス効果(相互作用)の作成

  1. 変数ボックスで2つ以上の変数を選択します。複数の変数を選択するには、Ctrlキーを押します。
  2. クロスをクリックします。

ネストされた効果の作成

ネストされた効果は、主効果またはクロス効果に続けて、分類変数または分類変数のリストをかっこで囲んで指定します。主効果またはクロス効果は、かっこ内にリストされた効果内にネストされます。ネストされた効果の例としては、B(A)、C(B*A)、D*E(C*B*A)などがあります。この例でB(A)は、"AはB内にネストされる"と読みます。
  1. モデル効果ボックスで、効果名を選択します。
  2. Nestをクリックします。Nestedウィンドウが開きます。
  3. ネストされた効果で使用する変数を選択します。外側または外側内でネスト化をクリックし、ネストされた効果の作成方法を指定します。
    注: 外側内でネスト化ボタンは、分類変数が選択されている場合にのみ使用できます。
  4. 追加をクリックします。

すべての組み合わせモデルの作成

  1. 変数ボックスで2つ以上の変数を選択します。
  2. すべての組み合わせをクリックします。
たとえば、Height、WeightおよびAge変数を選択し、すべての組み合わせをクリックすると、モデル効果としてAge、Height、Weight、Age*Height、Age*Weight、Height*Weight、Age*Height*Weightが作成されます。

N元の組み合わせの作成

  1. 変数ボックスで2つ以上の変数を選択します。
  2. N 元の組み合わせをクリックして、モデル効果ボックスにこれらの効果を追加します。
たとえば、Height、WeightおよびAge変数を選択し、Nの値として2を指定し、N 元の組み合わせをクリックすると、モデル効果としてAge、Height、Weight、Age*Height、Age*Weight、Height*Weightが作成されます。Nがモデル内の変数の数より大きな値に設定されている場合、事実上Nは変数の数に設定されます。

N次の多項式効果の作成

  1. 変数ボックスで1つの変数を選択します。
  2. Nフィールドの数値を調整して、高次クロスを指定します。
  3. 多項式の次数 = Nをクリックして、モデル効果ボックスに多項式効果を追加します。
たとえば、AgeおよびHeight変数を選択し、Nフィールドで3を指定して、多項式の次数 = Nをクリックすると、モデル効果としてAge、Age*Age、Age*Age*Age、Height、Height*Height、Height*Height*Heightが作成されます。

モデルの選択オプションの設定

オプション
説明
モデルの選択
選択方法
モデルの選択法を指定します。このタスクでは、選択法で定義されているルールに従って、モデルに効果を追加する必要があるか、モデルから効果を削除する必要があるかを調べることによって、モデルが選択されます。
選択方法の有効な値は次のとおりです。
  • Noneでは、フルモデルを当てはめます。
  • 変数増加法では、効果を含まないモデルから開始し、モデルに効果を追加する有意水準オプションに基づいて効果を追加します。
選択方法(続き)
  • 変数減少法では、すべての効果を含むモデルから開始し、モデルから効果を削除する有意水準オプションの値に基づいて効果を削除します。
  • 変数増減法(ステップワイズ法)は、変数増加法モデルに似ています。ただし、モデルにすでに存在する効果が必ずしもそのまま残るとは限りません。効果は、モデルに効果を追加する有意水準オプションに基づいてモデルに追加され、モデルから効果を削除する有意水準オプションに基づいてモデルから削除されます。
最適モデルの選択方法
最も当てはまるモデルが識別されるようにするための基準を指定します。
詳細
選択プロセスの詳細
選択プロセスに関してどの程度の情報を結果に含めるかを指定します。選択プロセスの各ステップの要約または詳細、または選択プロセスに関するすべての情報を表示できます。
効果の階層を維持する
効果の階層を維持することを指定します。

オプションの設定

オプション
説明
手法
Dispersion
Dispersion parameter
分散パラメータを持つ分布に、固定の分散パラメータを指定できます。このパラメータは、デフォルトでは推定されます。
最適化
手法
使用する最適化法を指定します。
最大反復回数
選択した最適化法で実行する最大反復回数を指定します。
統計量
出力に含める統計量を選択できます。
含めることができる追加統計量を次に示します。
  • 推定値の信頼限界
  • パラメータ推定値の相関
  • パラメータ推定値の共分散

出力オプションの設定

出力データセットを作成するかどうかを指定できます。また、出力データセットに、予測値、残差またはその他の変数を追加するかどうかも指定できます。
前のページ|次のページ|ページの先頭へ