前のページ|次のページ

SAS Visual Analytics Explorerのデータ分析の概要

データ分析の種類

SAS Visual Analyticsでは、次の3種類の基本的なデータ分析を実行できます。
相関
メジャー間の統計上の関係の度合を識別します。
近似線
メジャー間の関係のモデルをプロットします。近似線には、線形近似、2次近似、3次近似、ペナルティ付きB-スプラインなどの多くの種類があります。
予測
統計的傾向に基づいてデータの今後の値を予測します。

相関

相関によってメジャー間の統計上の関係の度合を識別します。相関の強度は–1から1までの数値で表されます。–1に近い値は強い負の相関を意味し、0に近い値は相関がほとんどないか、まったくないことを意味し、1に近い値は強い正の相関を意味します。
ビジュアルに相関を適用するには、線形近似線を追加するか、ビジュアルの種類として相関マトリックスを選択します。
ヒートマップや単純な散布図の場合、相関はビジュアル凡例のテキストラベルで識別されます。相関分析の結果についてを選択して、正確な相関値などの相関に関する詳細情報を表示します。
散布図マトリックスでは、各プロットの相関はプロットの周囲の色付きの境界線で識別されます。ビジュアル凡例には、色の値を示すキーが表示されます。相関分析の結果についてを選択して、プロットごとの正確な相関値などの相関に関する詳細情報を表示します。
注: 線形近似以外の種類では、2方向の変数の各インターセクションを表すために散布図マトリックスに追加プロットが表示されます。たとえば、散布図マトリックスで変数A、BおよびCをプロットする場合、線形近似以外の近似線を適用すると、A * BとB * Aのどちらにもプロットが作成されます。
相関マトリックスでは、各セルの相関がセルの背景色で識別されます。ビジュアル凡例には、色の値を示すキーが表示されます。各セルのデータチップに相関値が表示されます。

近似線

近似線では、メジャー間の関係のモデルがプロットされます。近似線は、散布図とヒートマップに適用できます。
ビジュアルに適用できる近似線には、次の種類があります。
自動近似
データに最も適したモデル(線形、2次、3次)を選択します。自動近似方法は、逆方向の変数選択を使用して、重要性が最も高いモデルを選択します。使用された最終のモデルを確認するには、ビジュアル凡例から回帰分析の結果についてを選択します。
線形
線形回帰アルゴリズムから線形近似線を作成します。線形近似線では、2つのメジャー間の関係を最適に表現する直線が生成されます。この線形近似線の詳細を確認するには、ビジュアル凡例から回帰分析の結果についてを選択します。
線形近似では、ビジュアルに相関が自動的に追加されます。相関はそれ以外の近似法で使用することができません。
2次
2次近似線を作成します。2次近似線では、1つの曲線を含む線が生成されます。2次近似線の場合は、放物線形状の線が生成されることがよくあります。この2次近似線の詳細を確認するには、ビジュアル凡例から回帰分析の結果についてを選択します。
3次
3次近似線を作成します。3次近似線では、2つの曲線を含む線が生成されます。3次近似線の場合は、“S”形状の線が生成されることがよくあります。この3次近似線の詳細を確認するには、ビジュアル凡例から回帰分析の結果についてを選択します。
PSpline
ペナルティ付きB-スプラインを作成します。ペナルティ付きB-スプラインは、データを詳細に近似する平滑化スプラインです。ペナルティ付きB-スプラインでは、曲率の変化が多い複雑な線を表示できます 。このペナルティ付きB-スプラインの詳細を確認するには、ビジュアル凡例から回帰分析の結果についてを選択します。

予測

統計的傾向に基づいてデータの今後の値を予測します。予測は、日付または日時データアイテムを含む折れ線グラフの場合にのみ使用できます。
予測では、予測値を含む線がビジュアルに追加され、信頼区間を表す色付きの区間が追加されます。たとえば、95%の信頼区間は、今後の値になる予測モデルの信頼度が95%のデータ範囲です。
エクスプローラでは、データに対して複数の予測モデルが自動的にテストされた上で、最良のモデルが選択されます。どの予測モデルが使用されたかを確認するには、ビジュアル凡例から相関分析の結果についてを選択します。
次のいずれかの予測モデルを使用できます。
  • 減衰傾向指数平滑法
  • 線形指数平滑法
  • 季節変動指数平滑法
  • 単純指数平滑法
  • ウィンタース法(加法)
  • ウィンタース法(乗法)
注: 標準的な時間間隔(1時間=60分、1日=24時間など)を使用して周期的なパターンの数値を予測します。お使いのデータが非標準的な間隔(1日につき30分周期で48回など)を使用する場合、周期的なパターンは予測では考慮されません。
前のページ|次のページ|ページの先頭へ