対比について


2008.1.18最終修正
2008.1.10より

 対比(contrast)とは、処理間の比較(差)を表現するために分散分析でよく使われてきた、(処理の各水準の平均)×(その水準に与えた係数)の合計のことである。式の形から、線型対比(linear contrast)と呼ばれることもある

 たとえば、1元配置分散分析で、処理が3水準(A,B,Cとする)だとする。処理Aの平均をmA、処理Bの平均をmB、処理Cの平均をmCと書くことにする。処理Aの係数をcA、処理Bの係数をcB、処理Cの係数をcCとすると、対比は、
 (mA・cA)+(mB・cB)+(mC・cC)
である。

 分散分析ではどこかの処理間にちがいがあるという仮説のほかにも、特定の処理や複数の処理をまとめたものの間にも差がないかどうかに関心があることが多い。さまざまな処理間の比較は、対比で表すことができる。たとえば、処理Aと処理Cの差は、係数cA=1,cB=0,cC=-1としたときの対比である。また、(処理Aと処理Bの平均)と処理Cの差は、係数cA=0.5,cB=0.5,cC=-1としたときの対比である。

 上記のような、(係数×処理の平均)の和、のうち、係数の合計が0(すぐ上の例ではいずれもそうなっている)である場合に限って対比と呼ぶことも多い。また、係数の二乗の合計が1になるような、一種の規準化をすることもある。

対比の意味

 係数の合計が0の場合、i番目の水準の係数をci、ある水準の平均をmiとすると、対比は、煤ici・mi)である。cとmの積和は、煤oci−(cの平均)}・{mi−(mの平均)}である。展開すると、
 煤ici・mi)−(cの平均)煤imi)−(mの平均)煤ici)+煤o(cの平均)・(mの平均)}
で、ここでは煤ici)=0だから、煤ici・mi)となる。つまり、係数の合計が0のとき、対比は、係数と各水準の平均の積和になる。

 さらに係数の二乗の合計が1なら、係数の平方和は1である。煤ici・mi)は、積和/係数の平方和と書けるから、yにmを、xにcをとった回帰直線の傾きである。また、積和の二乗/xの平方和が、この回帰直線で説明されるyの変動(平方和)であるが、対比つまり煤ici・mi)を二乗したものは、積和の2乗/mの平方和、でもある。
 対比により、目的変数の水準間のちがいのうち、係数とともに変動する部分を取り出すことができるわけである。

対比の直交性

 直交(orthogonal)とは2つ(あるいはそれ以上)の対比のあいだの関係である。2つの対比があって、ある処理の対比1の係数×対比2の係数の和が0であることである。

 先ほどの例を使うと、
処理Aと処理Cの差を表す対比:cA=1,cB=0,cC=-1
(処理Aと処理Bの平均)と処理Cの差を表す対比:cA=0.5,cB=0.5,cC=-1
では、1×0.5+0×0.5+(-1×-1)で、0でないから直交していない。一方、
処理Aと処理Bの差を表す対比:cA=1,cB=-1,cC=0
(処理Aと処理Bの平均)と処理Cの差を表す対比:cA=0.5,cB=0.5,cC=-1
では、1×0.5+(-1×0.5)+(0×-1)で、0だから、直交している。

 直交している下の2つの対比では、(処理Aと処理Bの平均)と処理Cの差は、もう1つの対比が表している処理Aと処理Bの差の情報を使っていないことがわかる。

 実際、(標本数が等しいなどの条件が満たされれば)、直交する対比は独立である。

 直交対比(orthogonal contrast)は、数学用語で言えば、選点直交系である。2つの関数があって、その値の積をある範囲で積分したものが0だと、その2つの関数はその範囲で直交関数系だと言う。積分でなく、とびとびの点について2つの関数の値を出して掛け算し、その合計が0なら、選点直交系だという。直交対比の場合には、各処理を点、対比を関数と見れば、選点直交系というわけである。
 直交関数系と選点直交系については(もちろん目的にもよるが)、金谷健一著『これなら分かる応用数学教室』(共立出版)の説明がわかりやすかった。

 多項式対比については、別項を参照してください