<金融アトラス/a>

金融アトラス

個人の勉強も兼ねて、少しずつまとめます。

t値とp値の違いとは?

f:id:hongoh:20210316221549j:plain



本ページでは、仮説検定におけるt値とp値の違いについてまとめたい。

 

仮説検定の考え方

「AがBである」ことを示したいとする。このとき、「いったん『AがBで"ない"』という仮説を立て、その仮説が正しい確率が十分に低い」ことを示すことで、「AがBである」ことを確かめる、というのが、仮説検定の基本的な流れとなる。このとき、『AがBで"ない"』という仮説を帰無仮説という。

 

仮説検定については、以下で基本的な考え方をまとめている。以降の記述は、この内容が前提となっている。

hongoh.hatenablog.com

 

t値

t値とは、一言でいえば「t検定における統計量」のことである。

 

仮説検定を行うにあたり、抽出した標本平均をもとにして、確率分布に従う「統計量」を作成する。母集団が平均μ、分散σ^2の正規分布に従っているとき、標本平均Xは、サンプル数をnとすると、平均μ、分散σ^2/nの正規分布に従う。さらに、標本平均Xからμを引き、σ^2/nで割った数字は、平均0,分散1の標準正規分布に従う。

 

ただ、現実の分析においては、母集団の標準偏差σが分かっていることはあまり多くない。標準正規分布を使って分析するには、σが分かっている必要がある。

 

しかし、母分散σ^2を標本分散s^2(標本として抽出した値の分散)に代替することができる。このとき、標準正規分布ではなく、t分布に従うことが知られている(正確には自由度n-1のt分布)。このt分布を用いた検定をt検定と呼び、ここでの統計量をt値という。

 

 

p値

統計量と確率は対応している。t分布における統計量と確率の対応により、帰無仮説を検証することができる。例えば、自由度20のt分布の場合、統計量が2.0860以上、あるいは-2.0860以下であるとき、帰無仮説が成立するのは5%以下の確率であることを意味する。有意水準を5%と設定するとき、統計量が上記の範囲であれば、帰無仮説が成り立つ状況は十分に珍しく、よって帰無仮説を棄却できる、ということになる。

 

そして、有意水準5%(0.05)とするときの0.05をp値と呼ぶ。

 

また、言い換えれば、ある統計量が、有意水準をどこに設定すれば帰無仮説を棄却できるのか、を示した値をp値ということができる。p値が大きいということは、相当有意水準を甘く見積もらないと帰無仮説を棄却できない、ということになる。