迷路

強化学習で迷路問題を解くことになりました。
なんかようやくまともなプログラムになった気がする。
強化学習なんかつかわずに、A*アルゴリズムだのよく使われるAIのアルゴリズムを使ったほうが早いような気がするけど気にしない。

http://sysplan.nams.kyushu-u.ac.jp/gen/edu/applets/MazeQL.html

強化学習を迷路問題に適用している例は多いみたいです。
比較的パラメータの調整が簡単なQ-learningが使われているみたいですね。

http://ja.wikipedia.org/wiki/Q%E5%AD%A6%E7%BF%92

個人的にはちと単純すぎやしないかと思ってます。
単純なのはいいことなんですが。