前のページ|次のページ

要約統計量タスク

要約統計量タスクについて

要約統計量タスクでは、すべてのオブザベーションおよびオブザベーショングループを対象として変数の記述統計量を生成することができます。データの要約は、ヒストグラムや箱ひげ図などのグラフ表示にも対応しています。
たとえば、このタスクを使用すると、製品の種類および国別の新規販売台数に関するレポートを作成できます。
注: このタスクを使用するには、SAS/STATが必要です。

例:販売台数の要約統計量

この例では、販売台数を分析します。表形式の結果に加え、分布ヒストグラムを表示することもできます。
この例を作成するには、次の操作を実行します。
  1. タスクセクションで、統計量フォルダを展開し、要約統計量をダブルクリックします。要約統計量タスクのユーザーインターフェイスが開きます。
  2. データタブで、SASHELP.PRICEDATAデータセットを選択します。
  3. 分析変数役割にsale列を割り当てます。
  4. オプションタブで、プロットセクションを展開し、ヒストグラムチェックボックスを選択します。
  5. タスクを実行するには、実行をクリックします。
結果は次のようになります。
販売台数についてのMEANおよびUNIVARIATEプロシジャの結果

役割へのデータの割り当て

要約統計量タスクを実行するには、分析変数役割に列を割り当てる必要があります。
役割
説明
役割
分析変数
この役割に割り当てる変数は、統計量を表示する数値変数です。この役割には、少なくとも1つの変数を割り当てる必要があります。
分類変数
この役割に割り当てる変数は、入力データをカテゴリやサブグループに分類するために使用する文字変数または離散数値変数です。選択したすべての分析変数の統計量は、分類変数の重複しない組み合わせごとに計算されます。
追加役割
グループ分析
この役割に割り当てる変数は、グループ分析変数の固有値または値の組み合わせごとに統計量を個別に計算するために使用されます。統計量を計算する前に、この役割の変数によってデータが自動的に並べ替えられます。
度数カウント
この役割に変数を割り当てると、テーブル内の各オブザベーションが n件のオブザベーションを表すものとされます。 nは、該当する行の度数カウントの値です。それに応じて統計量が計算されます。この役割に割り当てることができる変数は1つのみです。
重み変数
この役割に変数を割り当てると、各オブザベーションにその変数の値を使用して重み付きの平均、分散および合計が計算されます。この役割に割り当てることができる変数は1つのみです。

オプションの設定

オプション名
説明
統計量
基本統計量
平均
分析変数の値を足して、その合計を非欠損オブザベーションの数で割ることによって計算される算術平均です。
標準偏差
データ値のグループの変動を表す統計的尺度です。この尺度は、度数分布の分散尺度として最も広く使用されており、分散の正の平方根と等しくなります。
最小値
分析変数の最小値です。
最大値
分析変数の最大値です。
中央値
分析変数の中央値です。
オブザベーションの数
欠損値が存在しないオブザベーションの合計数です。
欠損値の数
欠損値が存在するオブザベーションの合計数です。
追加統計量
標準誤差
サンプル平均の標準偏差です。標準誤差は、サンプルサイズの平方根に対するサンプル標準偏差の比率として定義されます。
注: このオプションは、標準偏差と分散の除数ドロップダウンリストで自由度を選択した場合にのみ使用できます。
分散
データ値の分散を表す統計的尺度です。この尺度は、各オブザベーションとサンプル平均の間の全二乗分散の平均です。
モード
分析変数の最頻値です。
範囲
データの最小値から最大値までの差分です。
合計
分析変数のすべての値の合計です。
重みの合計
各オブザベーションの重み付けに使用する数値変数の合計です。
注: 重み変数役割に変数を割り当てていない場合は、重みの合計を計算できません。
平均の信頼限界
平均の両側信頼限界です。平均の両側100 open 1 minus alpha close percent. 別の形式を利用するにはイメージをクリックします。信頼区間の上限と下限はx with macron above , plus minus . t sub open 1 minus , alpha over 2 , semicolon n minus 1 close end sub . fraction s , over square root of n end fraction. 別の形式を利用するにはイメージをクリックします。です。ここで、ssquare root of fraction 1 , over n minus 1 end fraction . cap sigma . open , x sub i , minus , x with macron above , close squared end root. 別の形式を利用するにはイメージをクリックします。t sub open 1 minus , alpha over 2 , semicolon n minus 1 close end sub. 別の形式を利用するにはイメージをクリックします。は生徒のt統計の1 minus , alpha over 2. 別の形式を利用するにはイメージをクリックします。(自由度n minus 1. 別の形式を利用するにはイメージをクリックします。)です。
変動係数
相対変動の単位なし尺度です。この尺度は、パーセントで表される平均に対する標準偏差の比率として定義されます。変動係数が意味を持つのは、変数が比率尺度で測定される場合のみです。
歪度
一方向の偏差が逆方向と比較して大きくなる傾向を表す歪度です。
尖度
裾の重さを表す尖度です。
パーセント点
1st、5th、10th、下側四分位点(25%点)、Median、上側四分位点(75%点)、90th、95th、99th、四分位範囲
計算するパーセント点と分位点を選択します。
分位点の計算方法
分位点、中央値、パーセント点の計算に使用する方法を指定します。
順序統計量にもとづく方法
すべてのデータをメモリに読み込み、一意の値を基準にして並べ替えます。
Piecewise-parabolic アルゴリズム
分位点を近似計算します。メモリの消費が少ない方法です。
注: 重み変数役割に変数を割り当てた場合は、順序統計量にもとづく方法のみを使用できます。
ブロット
ヒストグラム
データ分布の確認に使用するグラフを作成します。正規分布の密度曲線を追加した場合、タスクではmu. 別の形式を利用するにはイメージをクリックします。およびsigma. 別の形式を利用するにはイメージをクリックします。にサンプル平均およびサンプル標準偏差が使用されます。核分布の密度曲線を追加した場合、タスクではAMISE法を使用して核密度推定が計算されます。
グラフに統計量を含めるには、インセットの統計量の追加チェックボックスを選択します。
比較箱ひげ図
中央の場所の尺度(中央値)、2つの分散尺度(範囲と四分位範囲)、歪度(中央値の向きから分位点に相対的に)、潜在的異常値を示すグラフを作成します。箱ひげ図は、特に2つ以上のデータセットを比較する場合に役立ちます。
注: 比較箱ひげ図オプションは、分類変数役割に列が割り当てられている場合にのみ使用できます。
グラフにはインセットの統計量全体を追加することも、各グループのインセットの統計量のみを追加することもできます。
ヒストグラムと箱ひげ図
共通のX軸を持つ単一パネルにヒストグラムと箱ひげ図を一緒に表示します。インセットの統計量全体をグラフに追加することができます。
注: ヒストグラムと箱ひげ図オプションは、分類変数役割に列が割り当てられていない場合にのみ使用できます。
詳細
標準偏差と分散の除数
分散と標準偏差の計算に使用する除数を指定します。有効なオプションは次のとおりです。
自由度
n minus 1. 別の形式を利用するにはイメージをクリックします。
デフォルトでは、分散の除数は自由度です。
オブザベーションの数
n
重みの合計- 1
open , cap sigma sub i , w sub i , close minus 1. 別の形式を利用するにはイメージをクリックします。
重みの合計
cap sigma sub i , w sub i. 別の形式を利用するにはイメージをクリックします。
注: 重みの合計- 1および重みの合計オプションは、重み変数役割に変数を割り当てた場合にのみ使用できます。

出力オプションの設定

統計量を出力データセットに保存するかどうかを指定できます。
前のページ|次のページ|ページの先頭へ