468 異常検知

教師なし学習のタスクの一つ。訓練データとの傾向とかけ離れた異質なデータを発見する。

最も単純な場合で言えば、k近傍法などを用いて(外れ値)を検出する方法や、系列データの(変化点)を検出する手法が挙がられる。

異常検知技術には大きく分けて3通りの分類がある。教師なし異常検知(unsupervised anomaly detection)手法は、データセット内のインスタンスの大多数は正常であるという仮定の下でデータセットの残りにほとんどフィットしないと思われるインスタンスを探すことによって、ラベル付されていないテストデータセットにある異常を見つける。教師あり異常検知(supervised anomaly detection)手法は「正常」と「異常」にラベル付されたデータセットを必要とし、分類器を訓練することを含む(他の多くの統計分類問題との決定的な違いは固有の外れ値検出の不均衡な性質である)。半教師あり異常検知(semi-supervised anomaly detection)手法は与えられた正常な訓練データセットから正常な振る舞いを表すモデルを構成し、そして学習したモデルによって生成されるテストインスタンスの尤度をテストする。