統計学と機械学習の用語
統計用語
- 標本:データを構成する個々の例
- 観測値:標本が持つ値
- パラメータ:観測値がどのような値になるのかの傾向を決めている値(データに依存せずに決まる部分をモデル)
- 検定:データについての仮説が正しいかどうかを明らかにする.
- 推定:まだ観測されていない値の予測
機械学習用語
- 学習・訓練:プログラムにルールを獲得させる
- タスク:機械学習の目標
教師あり学習
入力と入力に対する出力の正解例(教師信号)を多数与えて,識別モデルを学習させる.
代表的なタスクは,分類と回帰
- 分類:入力をあらかじめきめられた有限個のカテゴリに分類する.
- 回帰:実数値を出力とする.
教師なし学習
生成モデルを学習させる.「このようなルールで分類,回帰を行う」という識別モデルに対して,生成モデルでは,「観測されたデータはこのように生成される」というメカニズムを表現する.
代表的なタスクは,クラスタリングと次元削減
- クラスタリング:データのグループ分け
- 次元削減:入力をよりシンプルな表現に変換
参考
- 手塚 太郎,"しくみがわかるベイズ統計と機械学習"
Tags: