<金融アトラス/a>

金融アトラス

個人の勉強も兼ねて、少しずつまとめます。

不偏性と一致性とは何かについて平たく説明

f:id:hongoh:20210316221706p:plain

本ページでは、統計学における不偏性と一致性についてまとめたい。一般に、母集団の性質を標本によって推定する際に、その推定量が不偏性と一致性を持つことが望ましいとされる。以下、母集団の平均を標本によって推定することを念頭に記述する。

 

母集団と標本

まず、母集団と標本の関係について整理する。

ある調査対象(例えば日本人、日本企業など)があり、その全ての要素を含んだものが母集団である。その調査対象で何か(例えば収益の平均など)を調べようと思ったとき、できることなら全数調査をして、すべての要素を集計した方が正確である。しかしながら、技術的に全ての要素を集計するのは難しいことも多いので、いくつか標本(サンプル)を抽出して、そのサンプルの中での平均(標本平均)を調べ、母集団の平均(母平均)を推測する、と言う方法が取られることがしばしばある。

 

例えば、テレビの視聴率は典型的なサンプル調査で、サンプルに選ばれた世帯の視聴状況を調べて、日本全体の(あるいは各地域の)視聴率を推定しているのである。

 

母平均と標本平均の関係

もちろん、サンプルを恣意的に抽出してはならず、あくまでランダムに抽出することで、母平均に近い標本平均を導くことができる。

 

しかし、もちろん、標本平均が完全に母平均に一致するとは考えにくい。どのサンプルを抽出したかによって、微妙に母平均とのズレが生じるのは自然なことだろう。しかしながら、標本平均が以下の不偏性と一致性を持つとき、標本平均は母平均の推定値として望ましいと考えられる。

 

不偏性

不偏性は、一言でいえば「標本平均の期待値をとると母平均と一致する」という性質である。例えば10000の要素からなる母集団があり、そこから100のサンプルをランダムに抽出して標本平均を算出する場合を考える。そして、このサンプルの抽出、標本平均の抽出を何回も(例えば100回)繰り返すとする。

 

ある回では、標本平均と母平均が大きく異なることもある。またある回では、両者が完全に一致しているかもしれない。

 

このとき、何回も標本抽出して算出した標本平均の期待値をとると、母平均と同じになることが知られている。

 

一致性

標本サイズを大きくしていけば、標本平均が母平均に近づいていく。この性質を一致性という。

 

上記の例でいえば、10000の要素からなる母集団から、10のサンプルをとったときの平均と、9000のサンプルをとった時の平均を比べれば、後者の方が母平均と近いことは直感的にイメージしやすいだろう。

 

(出典):

田中隆一(2015)「計量経済学の第一歩」有斐閣ストゥデイア