<金融アトラス/a>

金融アトラス

個人の勉強も兼ねて、少しずつまとめます。

機械学習における教師あり学習とは

本ページでは、機械学習における教師あり学習とは何かについてまとめたい。

総務省の定義によれば、機械学習とは「コンピュータがデータを読み込むことで自動的にルールやパターンを見出し、その結果を活かして分類や予測を行う仕組み全体のこと」とされている。学習のフェーズと、その学習結果を用いた分析(予測など)のフェーズに分けることができる。

 

機械学習には、大きく分けて「教師あり学習」「教師なし学習」がある。このうち、本ページでは教師あり学習について取り上げる。

 

教師あり学習は、「特徴を表す情報と正解を表す情報がセットになった状態のデータを用いてコンピュータに学習させる手法」と定義される(総務省)。「特徴を表す情報」は説明変数と呼ばれ、「正解を表す情報」は目的変数と呼ばれる。

教師あり学習の代表例として回帰と分類が挙げられる。

 

回帰

回帰の目的は説明変数の情報から目的変数の情報を予測することである。回帰における目的変数は連続した値となる。

 

分類

説明変数の情報から、目的変数がどのクラスに分類されるかを予測するものである。目的変数が2種類の場合は「二値分類」、3種類以上存在する場合は「多値分類」と呼ばれる。

 

これらの教師あり学習を行うには、説明変数と目的変数のセットが揃っている必要がある。まず説明変数と目的変数の関係を学習し、そこで学習した関係に基づき、説明変数のデータから目的変数(未知)を予測する。

 

(参考):

総務省高等学校における「情報II」のためのデータサイエンス・データ解析入門