292 DQN

DeepQ-Network:2013年にDeepMind社から発表された深層強化学習の基本的手法。強化学習における行動価値関数の関数近似にCNNを用いた手法。

Atari2600のゲームのいくつかは人間以上のスコアで攻略できることが示された。

Q値を推定するためにDeep Learningを使って近似する手法がDQNです。Q-Learningの場合、状態のパターンが少なければQ値を正確に推定できますが、タスクによってはとても複雑な状態を定義する必要があります。このような場合、Deep Learningを組み合わせたQ値の推定の方が有効です。DQNでは学習精度を高めるために、さまざまな工夫を凝らしているのも特徴の一つです。