前のページ|次のページ

相関分析タスク

相関分析タスクについて

相関とは、数値変数間の関係を表すための統計学的手法です。関係は、変数の相関係数を計算することによって表されます。相関の範囲は-1~1です。相関分析タスクを使用すると、変数間の関連性を調べるためのグラフと統計量が表示されます。
注: このタスクを使用するには、SAS/STATが必要です。

例: Sashelp.Carsデータセットにおける相関

この例を作成するには、次の操作を実行します。
  1. タスクセクションで、統計量フォルダを展開し、相関分析をダブルクリックします。相関分析タスクのユーザーインターフェイスが開きます。
  2. データタブで、SASHELP.CARSデータセットを選択します。
  3. 次の役割に列を割り当てます。
    役割
    分析変数
    エンジンサイズ
    馬力
    相関変数
    シリンダ
    MPG_Highway
  4. タスクを実行するには、実行をクリックします。
結果は次のようになります。
相関分析タスクの数値結果

役割へのデータの割り当て

相関分析タスクを実行するには、分析変数役割に少なくとも2つの列を割り当てる必要があります。または、分析変数役割に少なくとも1つの列を割り当て、相関変数役割に1つの列を割り当てる必要があります。
役割
説明
役割
分析変数
相関係数を計算する変数を指定します。
相関変数
分析変数との間で相関を計算する変数を指定します。
部分変数
ここで指定する変数の相関を分析変数と相関変数から削除してから、相関を計算します。
追加役割
度数カウント
オブザベーションの度数を表す数値変数を指定します。この役割に変数を割り当てると、各オブザベーションがn件のオブザベーションを表すものとされます。nは、度数変数の値です。nが整数以外の場合、自動的に切り捨てられます。nが1未満か、欠損している場合、そのオブザベーションは分析から除外されます。度数変数の合計は、オブザベーションの合計数を表します。
重み
Pearsonの重み付き積率相関の計算に使用する重みを指定します。
グループ分析
BY変数で定義された各グループのオブザベーションについて、それぞれ個別の分析値を取得できます。

オプションの設定

オプション名
説明
手法
欠損値
値が欠損しているオブザベーションをどのように扱うかを指定します。すべての選択済み変数に非欠損値を使用するオプションを選択した場合、値が欠損しているオブザベーションはすべて分析から除外されます。変数ペアに非欠損値を使用するオプションを選択した場合、欠損していない変数ペアを使用して相関統計量が計算されます。
統計量
デフォルトでは、相関とp値を示すテーブルが結果に表示されます。次の統計量を含めることもできます。
相関
このオプションを選択すると、相関が結果に追加されます。各相関係数に関連付ける確率を指定したり、相関を絶対値で降順に並べ替えたりすることもできます。
共分散
このオプションを選択すると、分散および共分散行列が結果に追加されます。また、Pearson相関が表示されます。列を部分変数役割に割り当てると、偏共分散行列が計算されます。
平方和と積和
このオプションを選択すると、平方和と積和のテーブルが結果に表示されます。Pearson相関も結果に追加されます。列を部分変数役割に割り当てると、不偏平方和と積和行列が表示されます。
修正平方和と積和
このオプションを選択すると、修正平方和と積和のテーブルが表示されます。Pearson相関も結果に追加されます。列を部分変数役割に割り当てると、不偏と偏の両方の修正平方和と積和行列が計算されます。
記述統計量
このオプションを選択すると、変数ごとに単純な記述統計量が追加されます。このオプションを選択せずに出力データセットの作成を選択した場合でも、データセットには変数の記述統計量が含まれます。
Fisherのz変換
Pearson相関では、Fisher変換オプションを使用して特定の対立(帰無)仮説、h sub 0 , colon rho equals , rho sub 0. 別の形式を利用するにはイメージをクリックします。の下で、信頼限界値およびp値を求め、Fisherのz変換を使用した相関係数を計算できます。Fisherのz変換チェックボックスを選択した場合は、帰無仮説ボックスに値を指定する必要があります。
次のタイプの中から信頼限界を選択できます。
  • 両側信頼限界は、帰無仮説h sub 0 , colon rho equals , rho sub 0. 別の形式を利用するにはイメージをクリックします。の検定に対する両側信頼限界を求めます。これがデフォルトです。
  • 下側信頼限界は、片側帰無仮説h sub 0 , colon rho less than or equal to , rho sub 0. 別の形式を利用するにはイメージをクリックします。の検定に対する下側信頼限界を求めます。
  • 上側信頼限界は、片側帰無仮説h sub 0 , colon rho greater than or equal to , rho sub 0. 別の形式を利用するにはイメージをクリックします。の検定に対する上側信頼限界を求めます。
デフォルトでは、相関の信頼限界の水準は95%です。
ノンパラメトリック相関
Spearmanの順位相関
Spearmanの順位相関を計算します。これは、データ値の順位に基づくノンパラメトリックな関連性指標です。相関の範囲は-1~1です。
Kendall's tau-b
Kendallのtau-bを計算します。これは、ペアのオブザベーションの一致数と不一致数に基づくノンパラメトリックな関連性指標です。一致はペアのオブザベーションが一緒に変化する場合に発生し、不一致はペアのオブザベーションが別個に変化する場合に発生します。Kendallのtau-bの範囲は-1~1です。
Hoeffding's measure of dependence
Hoeffdingの従属性指標であるD統計量を計算します。これは、独立性からのより一般的な乖離を検出するノンパラメトリックな関連性指標です。このD統計量は通常の定義の30倍あり、範囲は-0.5~1となっているため、大きな正の値のみが従属性を示します。
ブロット
結果に次のプロットのいずれかを含めることができます。
  • 変数の散布図行列。対称行列プロットに分析変数のヒストグラムを含めることもできます。
  • 分析変数とは異なる適用可能な各変数ペアの散布図。新しいオブザベーションの予測楕円を表示するか、平均の信頼楕円を表示するかを指定できます。
また、プロットする変数の数とプロットする最大点数を指定することもできます。

出力オプションの設定

Pearson相関統計量を含む出力データセットを作成するかどうかを指定できます。このデータセットには、平均、標準偏差およびオブザベーション数も含まれています。
次の統計量を出力データセットに含めることもできます。
  • 共分散:デフォルトでは、出力データセットに、対応する_TYPE_変数値'CORR'を持つ相関係数が追加されます。
  • 共分散:このオプションを選択すると、出力データセットに、対応する_TYPE_変数値'COV'を持つ共分散行列が追加されます。
  • 平方和と積和:列を部分変数役割に割り当てると、出力データセットに、平方和と積和行列は追加されません。
  • 修正平方和と積和:列を部分変数役割に割り当てると、出力データセットに、偏修正平方和と積和行列が追加されます。
前のページ|次のページ|ページの先頭へ