<金融アトラス/a>

金融アトラス

個人の勉強も兼ねて、少しずつまとめます。

標準偏差と標準誤差の違いについて平たく説明

f:id:hongoh:20220922093320p:image

本ページでは、標準偏差と標準誤差の違いについてまとめたい。

 

母集団と標本

標準偏差と標準誤差の説明に入る前に、まず、母集団と標本の関係について整理しておきたい。

 

ある調査対象(例えば日本人、日本企業など)があり、その全ての要素を含んだものが母集団である。その調査対象で何か(例えば収益の平均など)を調べようと思ったとき、できることなら全数調査をして、すべての要素を集計した方が正確である。しかしながら、技術的に全ての要素を集計するのは難しいことも多いので、いくつか標本(サンプル)を抽出して、そのサンプルの中での平均(標本平均)を調べ、母集団の平均(母平均)を推測する、と言う方法が取られることがしばしばある。

 

例えば、テレビの視聴率は典型的なサンプル調査で、サンプルに選ばれた世帯の視聴状況を調べて、日本全体の(あるいは各地域の)視聴率を推定しているのである。


もちろん、サンプルを恣意的に抽出してはならず、あくまでランダムに抽出することで、母平均に近い標本平均を導くことができる。

 

しかし、もちろん、標本平均が完全に母平均に一致するとは考えにくい。どのサンプルを抽出したかによって、微妙に母平均とのズレが生じるのは自然なことだろう。しかしながら、標本平均が以下の不偏性と一致性を持つとき、標本平均は母平均の推定値として望ましいと考えられる。

 

標準偏差

前置きが長くなったが、標本(サンプル)と母集団の関係を整理したところで、標準偏差と標準誤差についての説明に入りたい。

 

標準偏差とはサンプルを抽出した時のサンプルのばらつきを示す。人口100万人の都市で無作為に100人をサンプルとして抽出することを考えてみたときに、その中には10歳の人もいれば80歳の人もいるかもしれない。100人のサンプルの年齢について調べるとすると、その100人の中での年齢のばらつきが、標準偏差となる。

 

標準誤差

対して標準誤差は、標本平均のばらつきとなる。

100人サンプルを抽出したときの年齢の平均が35歳だったとする。しかし、同じ母集団(人口100万人の都市)からもう一度100人を抽出してみると、今度は年齢の平均が40歳になるかもしれない。

 

このように繰り返しサンプルを何度も抽出すると、その度毎に違った標本平均が算出される。この標本平均のちらばりのことを、標準誤差という。

 

標準偏差と標準誤差の関係

標準偏差と標準誤差には、以下の関係があることが知られている。

se =sd/√n

ここで、nはサンプル数、seは標準誤差、sdは標準偏差である。

 

 

(参考):

Q2 同じ実験を繰り返して得られた平均値の誤差を出すときに,標準偏差と標準誤差ではどちらを用いるのでしょうか?|バイオ実験に絶対使える統計の基本Q&A|実験医学online:羊土社 - 羊土社