本ページでは、統計分析における仮説検定の基本的な考え方についてまとめたい。
仮説検定の考え方
「AがBである」ことを示したいとする。このとき、「いったん『AがBで"ない"』という仮説を立て、その仮説が正しい確率が十分に低い」ことを示すことで、「AがBである」ことを確かめる、というのが、仮説検定の基本的な流れとなる。
具体的には、以下のステップで仮説検定を行う。ここでは一例として、「新型の電球の開発により電気の寿命は延びたか」という検証を取り上げる。
①帰無仮説の設定
「新型の電球の開発により旧来型よりも電気の寿命が延びた」ことを示したいとする。このとき、いったんそれと反対の仮説、すなわち「新型の電球は旧来型と電気の寿命が変わらない」を設定する。これは後に棄却したい仮説であるため、帰無仮説と呼ばれる。いったんは、この帰無仮説が正しいという前提の下、検証を進めていく。
旧来型の電気の寿命が1000時間であったとする。新型の寿命の平均をμ時間とすると、
μ=1000
が、帰無仮説となる。μは、母集団の平均である。
②標本の抽出
次に、新型の電球の標本を抽出し、その寿命の平均(標本平均)を算出する。標本平均をX(本来であればXの上にバー(―)が付くが、ここでは省略)とすると、ここではX=1200であったとする。
③統計量の作成
ここで関心があるのは、この1200という数字が、本当に「新型電球の開発により電気の寿命が延びた」ことを示しているのか、という点である。これをどのように検証するかというと、先ほどの帰無仮説(新型の寿命は旧来型と同じ1000時間)の下、「平均1000時間の母集団から抽出した標本の平均として、1200時間という数字はどれだけ珍しいことか」を確率的に検証するのである。検証の結果、もしあまりに珍しい(確率的に低い)ことが確認されたのなら、やはり新型の電球は旧来型の電球と寿命の平均値が異なると考えるのが妥当であり、よって帰無仮説は棄却される、とみなすのである。
何をもって「珍しい」とみなすか、は分析者によって異なるが、一般に「5%以下」であれば帰無仮説は棄却できる、とみなすケースが多い。この水準を有意水準という。
では、どのようにして確率的に検証するのか。それは、抽出した標本平均をもとにして、確率分布に従う「統計量」を作成する。母集団が平均μ、分散σ^2の正規分布に従っているとき、標本平均Xは、サンプル数をnとすると、平均μ、分散σ^2/nの正規分布に従う。さらに、標本平均Xからμを引き、σ^2/nで割った数字は、平均0,分散1の標準正規分布に従う。フォーマルには以下のように表される。
ここで、X=1200を代入した値(統計量)が、標準正規分布の中でどこに位置づけられるのかを確かめる。
④確率の検証
統計量と確率は対応している。標準正規分布の場合、統計量が1.96以上、あるいは-1.96以下であるとき、それは5%以下の確率であることを意味する。有意水準を5%と設定するとき、統計量が上記の範囲であれば、それは十分に珍しく、よって帰無仮説を棄却できる、ということになる。
σ(母集団の標準偏差)が分かっているとき、X、μ、nが分かっているので、統計量を算出することができる。この統計量から、母平均が1000である中で標本平均X=1200となる確率を算出し、その確率が十分に低ければ、帰無仮説は棄却でき、よって新型の電球は旧来型よりも寿命が長いことを統計的に検証できたということになる。
σが分からないとき
以上が仮説検定のステップとなる。しかしながら、現実の分析においては、母集団の標準偏差σが分かっていることはあまり多くない。標準正規分布を使って分析するには、σが分かっている必要がある。
しかし、母分散σ^2を標本分散s^2(標本として抽出した値の分散)に代替することができる。このとき、標準正規分布ではなく、t分布に従うことが知られている(正確には自由度n-1のt分布)。t分布における統計量と確率の対応により、上記のように帰無仮説を検証することができる。
(参考):