t値とp値の違いとは?
本ページでは、仮説検定におけるt値とp値の違いについてまとめたい。
仮説検定の考え方
「AがBである」ことを示したいとする。このとき、「いったん『AがBで"ない"』という仮説を立て、その仮説が正しい確率が十分に低い」ことを示すことで、「AがBである」ことを確かめる、というのが、仮説検定の基本的な流れとなる。このとき、『AがBで"ない"』という仮説を帰無仮説という。
仮説検定については、以下で基本的な考え方をまとめている。以降の記述は、この内容が前提となっている。
t値
t値とは、一言でいえば「t検定における統計量」のことである。
仮説検定を行うにあたり、抽出した標本平均をもとにして、確率分布に従う「統計量」を作成する。母集団が平均μ、分散σ^2の正規分布に従っているとき、標本平均Xは、サンプル数をnとすると、平均μ、分散σ^2/nの正規分布に従う。さらに、標本平均Xからμを引き、σ^2/nで割った数字は、平均0,分散1の標準正規分布に従う。
ただ、現実の分析においては、母集団の標準偏差σが分かっていることはあまり多くない。標準正規分布を使って分析するには、σが分かっている必要がある。
しかし、母分散σ^2を標本分散s^2(標本として抽出した値の分散)に代替することができる。このとき、標準正規分布ではなく、t分布に従うことが知られている(正確には自由度n-1のt分布)。このt分布を用いた検定をt検定と呼び、ここでの統計量をt値という。
p値
統計量と確率は対応している。t分布における統計量と確率の対応により、帰無仮説を検証することができる。例えば、自由度20のt分布の場合、統計量が2.0860以上、あるいは-2.0860以下であるとき、帰無仮説が成立するのは5%以下の確率であることを意味する。有意水準を5%と設定するとき、統計量が上記の範囲であれば、帰無仮説が成り立つ状況は十分に珍しく、よって帰無仮説を棄却できる、ということになる。
そして、有意水準5%(0.05)とするときの0.05をp値と呼ぶ。
また、言い換えれば、ある統計量が、有意水準をどこに設定すれば帰無仮説を棄却できるのか、を示した値をp値ということができる。p値が大きいということは、相当有意水準を甘く見積もらないと帰無仮説を棄却できない、ということになる。