最尤法とは何か
本ページでは、最尤法とは何かについてまとめたい。
最尤法の概要
最尤法の基本的な目的は、「観測されたデータがどんな確率分布に従うか」を推定することにある。
例えば、抽出したサンプルデータが1,5,7という値であったとする。ここで、このデータがどんな確率分布に従うのか?を求めるのが最尤法である。
求めるにあたっては、このデータがどの確率分布に従うのか、仮定を置く必要がある。ここでは、正規分布に従うと仮定したとする。「確率分布を求めるのに、ある確率分布を仮定するってどういうこと?」と思われるかもしれないが、正規分布に従うと仮定を置いても、平均や分散の値によってその形状は変わる。分布の基本的な形は最初に仮定して、そこから実際のデータを用いてより具体的な形に当てはめていく、というイメージだろう。確率分布を推定するとは、確率分布の形状を決定するパラメータを求めることである。
1という値を取る確率をf(1)というふうに表すことができる。f()は正規分布の確率密度関数である。同じように他の値についても確率をf(5),f(7)というふうに表現できる。
抽出されたサンプルデータセット(1,5,7)が実現する確率は、f(1)×f(5)×f(7)で表される。そして、この値が最大になるようなf()こそが、求めたい確率密度関数ということになる。その確率が最大になるということは、要するに「最も起こり得る」ということだ。そして、そのサンプルデータ自体は既に「起こった」データである訳だから、f(1)×f(5)×f(7)を最大にするようなf()は現実の確率分布と推定できるのではないか、という考えが成り立つだろう。
具体的な計算方法は、尤度関数L=f(1)×f(5)×f(7)
について対数をとり線形にしてから、仮定した確率分布f()のパラメータで(正規分布の場合母集団の平均μと標準偏差σ)でそれぞれ微分した値が0になるようなf()を求める。微分した値が0になるということは、その点において尤度関数が極大値をとっていることを意味する。
最尤法の応用
最尤法は、被説明変数が1または0のみの値を取るような場合(例えば合格・不合格、犯罪歴有り・無し、など)において説明変数の係数を推定するときなどに応用可能である。詳細は以下のページを参照されたい。
(参考):