前のページ|次のページ

PROBMC関数

平均値の多重比較を行うために各種の分布から確率または分位点を返します。

カテゴリ: 確率

構文

必須引数

distribution

分布を特定する文字定数、変数または式です。有効な分布は次のとおりです。

分布
引数
平均分析
ANOM
片側Dunnett
DUNNETT1
両側Dunnett
DUNNETT2
最大係数
MAXMOD
分割された範囲
PARTRANGE
スチューデント化された範囲
RANGE
Williams
WILLIAMS

q

分布の分位点を指定する数値定数、変数または式です。

制限事項 qまたはprobのいずれか一方を指定できます(両方指定することはできません)。

prob

分布の左側確率を指定する数値定数、変数または式です。

制限事項 probまたはqのいずれか一方を指定できます(両方指定することはできません)。

df

自由度を指定する数値定数、変数または式です。

注: 欠損値は無限値として解釈されます。

nparms

処理数を指定する数値定数、変数または式です。

注: DUNNETT1とDUNNETT2については、コントロールグループを計算に入れません。

オプション引数

パラメータ

不揃いなサンプルサイズを扱うために指定する必要があるnparmsパラメータのセットです(省略可能)。parametersの意味はdistributionの値によって異なります。parametersが指定されていない場合、サンプルサイズは揃っているものと見なされます。通常、帰無仮説のケースはサンプルサイズが揃っています。

詳細

概要

PROBMC関数は、分散推定値に有限および無限の自由度を使用して、各種の分布の確率または分位点を返します。
prob引数は確率変数がq未満となる確率です。したがって、p-valuesは1– probのように計算できます。たとえば、有意水準5%の臨界値を計算するには、prob= 0.95と設定します。
計算された確率の精度はO(10—8) (絶対誤差)、計算された分位点の精度はO(10—5)です。
注: 自由度が有限のときと、サンプルサイズが不揃いのときは、スチューデント化された範囲は計算されません。
注: Williams検定はサンプルサイズが揃っているときにのみ計算されます。

式とパラメータ

ここに掲げる等式は、各種の分布と、それぞれの分布におけるさまざまな状況で確率probと分位点qを関連付ける等式に使用する式を定義します。これらの式では、vを自由度dfとします。

平均分析の計算

平均分析(ANOM)は、i番目のサンプルサイズがniとなるk(ガウス)サンプルのデータで使用されます。i equals , square root of negative 1 end root. 別の形式を利用するにはイメージをクリックします。のようになります。分布関数[1, 2, 3, 4, 5]はk次元の多変量画像ベクトルの最大絶対値のCDFです。このとき、自由度は nu. 別の形式を利用するにはイメージをクリックします。 、関連相関行列は rho sub i j end sub , equals negative , alpha sub i , alpha sub j. 別の形式を利用するにはイメージをクリックします。 です。この式は次のように表すことができます。
前述の式には次の関係が適用されます。
cap gamma , open . close. 別の形式を利用するにはイメージをクリックします。, straight phi , open . close. 別の形式を利用するにはイメージをクリックします。およびcap phi , open . close. 別の形式を利用するにはイメージをクリックします。 はそれぞれ正規分布のガンマ関数、密度およびCDFです。
nu equals infinity. 別の形式を利用するにはイメージをクリックします。のとき、分布は次に減少します。
前述の式には次の関係が適用されます。
均衡しているケースでは、分布は次に減少します。
前述の式には次の関係が適用されます。
および rho equals . fraction 1 , over n minus 1 end fraction. 別の形式を利用するにはイメージをクリックします。
この分布の構文は次のとおりです。
x=probmc('anom', q, p, nu, n, <alpha1 , ..., alphan>);
引数
x
返される結果の数値です。
q
分位点を示す数値です。
p
確率を示す数値です。pqは、いずれかが欠損値である必要があります。
nu
自由度を示す数値です。
n
サンプル数を示す数値です。
alphai, i=1,...,k
この分布の最初の式のα値を示す数値です(省略可能)。平均分析の計算を参照してください。.

多対1のt統計量:Dunnettの片側検定

  • 自由度が有限の不揃いなケースで確率probと分位点qを相関させます。parametersはλ1, ..., λknparmsの設定値はkdfの設定値はνです。式は次のとおりです。
  • 自由度が有限の揃っているケースで確率probと分位点qを相関させます。parametersは渡されず、open lamda equals , square root of 1 half end root , close. 別の形式を利用するにはイメージをクリックします。 nparmsの設定はkdfの設定値はνです。式は次のとおりです。
  • 自由度が無限の不揃いなケースで確率probと分位点qを相関させます。parametersはλ1, ..., λknparmsの設定値はkdfの設定値は欠損です。式は次のとおりです。
  • 自由度が無限の揃っているケースで確率probと分位点qを相関させます。parametersは渡されず、open lamda equals , square root of 1 half end root , close. 別の形式を利用するにはイメージをクリックします。 nparmsの設定はkdfの設定値は欠損です。式は次のとおりです。

多対1のt統計量:Dunnettの両側検定

  • 自由度が有限の不揃いなケースで確率probと分位点qを相関させます。parametersはλ1, ..., λknparmsの設定値はkdfの設定値はνです。式は次のとおりです。
  • 自由度が有限の揃っているケースで確率probと分位点qを相関させます。parametersは渡されず、nparmsの設定はkdfの設定値はνです。式は次のとおりです。
  • 自由度が無限の不揃いなケースで確率probと分位点qを相関させます。parametersはλ1, ..., λknparmsの設定値はkdfの設定値は欠損です。式は次のとおりです。
  • 自由度が無限の揃っているケースで確率probと分位点qを相関させます。parametersは渡されず、nparmsの設定はkdfの設定値は欠損です。式は次のとおりです。

分割された範囲の計算

RANGEは、nのグループ平均のスチューデント化範囲の分布で使用されます。PARTRANGEは、分割されたスチューデント化範囲の分布で使用されます。nグループを、大きさがn1+ ...+ nk= nk個のサブセットに分割します。このとき、分割された範囲はそれぞれのサブセットのスチューデント化範囲の最大です。スチューデント化係数はすべてのケースで同一です。
この分布の構文は次のとおりです。
x=probmc('partrange', q, p, nu, k, n1, ..., nk);
引数
x
返される結果の数値です(確率または分位点)。
q
分位点を示す数値です。
p
確率を示す数値です。pqは、いずれかが欠損値である必要があります。
nu
自由度を示す数値です。
k
グループ数を示す数値です。
ni i=1,...,k
この分布の式のn値を示す数値です(省略可能)。分割された範囲の計算を参照してください。

スチューデント化された範囲

注: 自由度が有限のときと、サンプルサイズが不揃いのときは、スチューデント化された範囲は計算されません。
  • 自由度が有限の揃っているケースで確率probと分位点qを相関させます。parametersは渡されず、nparmsの設定はkdfの設定値はνです。式は次のとおりです。
  • 自由度が無限の不揃いなケースで確率probと分位点qを相関させます。parametersはσ1, ..., σknparmsの設定値はkdfの設定値は欠損です。式は次のとおりです。
  • 自由度が無限の揃っているケースで確率probと分位点qを相関させます。parametersは渡されず、nparmsの設定はkdfの設定値は欠損です。式は次のとおりです。

スチューデント化された最大係数

  • 自由度が有限の不揃いなケースで確率probと分位点qを相関させます。parametersはσ1, ..., σknparmsの設定値はkdfの設定値はνです。式は次のとおりです。
  • 自由度が有限の揃っているケースで確率probと分位点qを相関させます。parametersは渡されず、nparmsの設定はkdfの設定値はνです。式は次のとおりです。
  • 自由度が無限の不揃いなケースで確率probと分位点qを相関させます。parametersはσ1, ..., σknparmsの設定値はkdfの設定値は欠損です。式は次のとおりです。
  • 自由度が無限の揃っているケースで確率probと分位点qを相関させます。parametersは渡されず、nparmsの設定はkdfの設定値は欠損です。式は次のとおりです。

Williams検定

PROBMCは、Williams (1971、1972)によって定義されている分布の確率または分位点を計算します。(リファレンスを参照。) 処方治療の平均をコントロール平均と比較し、治療で有効な最小の処方量を判断するため使用します。
注: Williams検定はサンプルサイズが揃っているときにのみ計算されます。
X1, X2, ..., Xkは同一の独立しているN(0,1)の確率変数であるものとします。Ykは次の式で表されるそれらの平均であるものとします。
次の分布を計算する必要があります。
引数
Yk
前述の定義のとおりです。
Z
N(0,1)の独立した確率変数です。
S
½νS2がχ2変数です(自由度ν)。
Williams (1971) (リファレンス を参照)の説明によれば、全体の計算は非常に冗長であり、3段階で行われます。
  1. Ykの分布を計算します。分布の計算はこの演算の基本的な(高コストな)部分で、Ykの密度と確率の両方を求めるのに使われます。Uiは次のように定義されるものとします。
    実数としてdを使用し、Yk > dの確率の再帰式を記述できます。
    この確率を計算するには、次のN(0,1)密度関数から始めます。
    次に重畳を再帰的に計算します。
    この一連の重畳から、前掲の cap pr of . open , y sub k , less than d close. 別の形式を利用するにはイメージをクリックします。 再帰式のすべての要素を計算できます。
  2. Yk – Zの分布を計算します。この計算には、確率を計算するために別の重畳を必要とします。
  3. (Yk – Z)/Sの分布を計算します。この計算には、確率を計算するために別の重畳を必要とします。
ν = ∞のときは、第3段階は必要ありません。演算が複雑なため、この冗長なアルゴリズムは有限および無限の自由度νの両方でk ≤ 15のとき、高速なアルゴリズムに置き換えられます。k≥ 16のときは、冗長計算が実行されます。この計算は、アルゴリズムが複雑なため、きわめて高コストで非常に時間がかかります。

比較

SAS/STATソフトウェアのGLMプロシジャのMEANSステートメントは次の検定を計算します。
  • Dunnettの片側検定
  • Dunnettの両側検定
  • スチューデント化された範囲

例1: PROBMCを使用した確率の計算

次の例では、確率の計算方法を示します。
data probs;
   array par{5};
      par{1}=.5;
      par{2}=.51;
      par{3}=.55;
      par{4}=.45;
      par{5}=.2;
   df=40;
   q=1;
   do test="dunnett1","dunnett2", "maxmod";
      prob=probmc(test, q, ., df, 5, of par1–par5);
      put test $10. df q e18.13 prob e18.13;
   end;
run; 
SASは次の結果をログに書き込みます。
DUNNETT1 40 1.00000000000E+00 4.82992196083E-01 DUNNETT2 40 1.00000000000E+00 1.64023105316E-01 MAXMOD 40 1.00000000000E+00 8.02784203408E-01

例2: 平均分析の計算

data _null_;
   q1=probmc('anom', ., 0.9, ., 20);                           put q1=;
   q2=probmc('anom', ., 0.9, 20, 5, 0.1, 0.1, 0.1, 0.1, 0.1);  put q2=;
   q3=probmc('anom', ., 0.9, 20, 5, 0.5, 0.5, 0.5, 0.5, 0.5);  put q3=;
   q4=probmc('anom', ., 0.9, 20, 5, 0.1, 0.2, 0.3, 0.4, 0.5);  put q4=;
run;
SASは次の結果をログに書き込みます。
q1=2.7895061016 q2=2.4549961967 q3=2.4549961967 q4=2.4532319994

例3: 平均の比較

この例では、グループ平均を比較して有意な差異がどこにあるかを調べる方法を示します。この例のデータはDuncan (1955)の論文から引用しています。また、Hochberg and Tamhane (1987)にも記載されています。(この関数の末尾のリファレンスセクションを参照してください。)
次の値はグループ平均です。
  • 49.6
  • 71.2
  • 67.6
  • 61.5
  • 71.3
  • 58.1
  • 61.0
このデータでは、平均平方誤差はν = 30のときs2 = 79.64 (s = 8.924)です。
data duncan;
   array tr{7}$;
   array mu{7};
   n=7;
   do i=1 to n;
      input tr{i} $1. mu{i};
   end;
   input df s alpha;
   prob=1-alpha;
      /* compute the interval */
   x=probmc("RANGE", ., prob, df, 7);
   w=x * s / sqrt(6);
      /* compare the means */
   do i=1 to n;
      do j=i + 1 to n;
         dmean = abs(mu{i} - mu{j});
         if dmean >= w then do;
            put tr{i} tr{j} dmean;
         end;
      end;
   end;
   datalines;
A 49.6
B 71.2
C 67.6
D 61.5
E 71.3
F 58.1
G 61.0
 30 8.924 .05
;
run;
SASは次の結果をログに書き込みます。
A B 21.6 A C 18 A E 21.7

例4

data _null_;
   q1=probmc('partrange', ., 0.9, ., 4, 3, 4, 5, 6);  put q1=;
   q2=probmc('partrange', ., 0.9, 12, 4, 3, 4, 5, 6); put q2=;
run;
SASは次の結果をログに書き込みます。
q1=4.1022397989 q2=4.7888626338

例5: 信頼区間の計算

この例では、Dunnett検定の片側検定と両側検定で95%信頼区間を計算する方法を示します。この例およびデータはDuncan (1955)の論文から引用しています。また、Hochberg and Tamhane (1987)にも記載されています。(この関数の末尾のリファレンスセクションを参照してください。)データは、3つの動物グループの血球数測定値です。次の表に示すとおり、第3グループをコントロールグループとして、最初の2つのグループには異なる薬物を投与します。3つのグループの動物の数は不揃いです。
投与グループ:
薬物A
薬物B
コントロール
9.76
12.80
7.40
8.80
9.68
8.50
7.68
12.16
7.20
9.36
9.20
8.24
10.55
9.84
8.32
グループ平均
8.90
10.88
8.25
n
4
5
6
平均平方誤差はν = 12のときs2 = 1.3805 (s = 1.175)です。
data a;
   array drug{3}$;
   array count{3};
   array mu{3};
   array lambda{2};
   array delta{2};
   array left{2};
   array right{2};
      /* input the table */
   do i=1 to 3;
      input drug{i} count{i} mu{i};
   end;
      /* input the alpha level,    */
      /* the degrees of freedom,   */
      /* and the mean square error */
   input alpha df s;
   
      /* from the sample size, */
      /* compute the lambdas   */
   do i=1 to 2;
      lambda{i}=sqrt(count{i}/
        (count{i} + count{3}));
   end;
      /* run the one-sided Dunnett's test */
   test="dunnett1";
      x=probmc(test, ., 1 - alpha, df, 
                 2, of lambda1-lambda2);
      do i=1 to 2;
         delta{i}=x * s * 
            sqrt(1/count{i} + 1/count{3});
         left{i}=mu{i} - mu{3} - delta{i};
      end;
   put test $10. x left{1} left{2};
      /* run the two-sided Dunnett's test */
   test="dunnett2";
      x=probmc(test, ., 1 - alpha, df, 
                 2, of lambda1-lambda2);
      do i=1 to 2;
         delta{i}=x * s * 
            sqrt(1/count{i} + 1/count{3});
         left{i}=mu{i} - mu{3} - delta{i};
         right{i}=mu{i} - mu{3} + delta{i};
      end;
   put test $10. left{1} right{1};
   put test $10. left{2} right{2};
   datalines;
A 4 8.90
B 5 10.88
C 6 8.25
0.05 12 1.175
;
run;
SASは次の結果をログに書き込みます。
DUNNETT1 2.1210448226 -0.958726041 1.1208812046 DUNNETT2 -1.256408109 2.5564081095 DUNNETT2 0.8416306717 4.4183693283

例6: Williams検定の計算

次の例では、8つのブロックからなる乱塊法を使用し、7つの水準である物質を検定しました。観測された処理の平均は次のとおりです。
処理
平均
X0
10.4
X1
9.9
X2
10.0
X3
10.6
X4
11.4
X5
11.9
X6
11.7
自由度は(7 – 1)(8 – 1) = 42で、平均平方はs2 = 1.16です。
平均化プロセスを経て最大尤度推定Miを求めます。
  • X0 > X1であるから、X0,1 = (X0 + X1)/2 = 10.15である。
  • X0,1 > X2であるから、X0,1,2 = (X0 + X1 + X2)/3=(2X0,1 + X2)/3=10.1である。
  • X0,1,2 < X3 < X4 < X5
  • X5 > X6であるから、X5,6 = (X5 + X6)/2 = 11.8である。
これで順序制約が満たされました。
対立仮説では、最大尤度推定は次のとおりです。
  • M0=M1=M2 = X0,1,2=10.1
  • M3=X3=10.6
  • M4=X4=11.4
  • M5=M6=X5,6=11.8
次に t equals . open 1 1 . 8 minus 1 0 . 4 close . slash . square root of 2 , s squared , slash 8 end root . equals 2 . 6 0. 別の形式を利用するにはイメージをクリックします。 を計算すると、k = 6、ν = 42、t = 2.60に対応する確率は.9924467341となります。すなわち、物質に対する強い反応があることが示されています。また、次の表に示すように、上の5%および裾の1%の分位点も計算できます。
SASステートメント
結果
prob=probmc("williams", 2.6, ., 42, 6);
0.9924466872
quant5=probmc("williams", ., .95, 42, 6);
1.806562536
quant1=probmc("williams", ., .99, 42, 6);
2.490908273

関連項目:

参考文献

Guirguis, G. H., and R. D. Tobias. “On the Computation of the Distribution for the Analysis of Means.” 2004. Communications in Statistics:Simulation and Computation 33: 861–887.
Nelson, P. R. “Numerical Evaluation of an Equicorrelated Multivariate Non-central t Distribution.” 1981. Communications in Statistics:Part B - Simulation and Computation 10: 41–50.
Nelson, P. R. “Exact Critical Points for the Analysis of Means.” 1982. Communications in Statistics:Part A - Theory and Methods 11: 699–709.
Nelson, P. R. “An Approximation for the Complex Normal Probability Integral.” 1982a. BIT 22(1): 94-255.
Nelson, P. R. “Application of the Analysis of Means.” 1988. Proceedings of the SAS Users Group International Conference 13: 225–230.
Nelson, P. R. “Numerical Evaluation of Multivariate Normal Integrals with Correlations.” 1991. The Frontiers of Statistical Scientific Theory and Industrial Applications 2: 97–114.
Nelson, P. R. “Additional Uses for the Analysis of Means and Extended Tables of Critical Values.” 1993. Technometrics 35: 61-255.
前のページ|次のページ|ページの先頭へ