めもめも

このブログに記載の内容は個人の見解であり、必ずしも所属組織の立場、戦略、意見を代表するものではありません。

2016-05-18から1日間の記事一覧

倒立振子でDQNにおけるモデルの複雑さと学習内容の関係をちらっと確かめてみた系の話

何の話かというと qiita.com上記の記事では、「倒立振子」を題材にした、DQN(Deep Q Network)による強化学習の解説があり、非常によくまとまっています。一方、この記事の中では、全結合層を4層に重ねたネットワークを利用しているのですが、倒立振子の問…