End to End DeepLearning が切り開く自動運転の世界

End to End DeepLearning が切り開く自動運転の世界
CRANK

将棋のルールは結構複雑で、普通に記述するとソースコード1000行くらいは必要になる。Deep Learningにどのように合法手(=ルール上可能な手)を教え込めばいいか悩んでいた。そして結局、Ponanzaは特にルールを教えずに5億の局面と最善手(∈合法手)のペアをひたすら一致させるよう学習させた結果、ほぼ全ての場面で合法手(しかもかなりいい手を)を推薦するようになった。コード規模1000行程度の複雑なルールを明示的に教えてなくても、学習データから勝手に学習することは当時の私にはあまりに衝撃的なことだった。この世界のルールは複雑だ。将棋のように複雑ながらもexplicitに

note.com 5 years ago

Open page

https://note.com/issei_y/n/n367368c7c5bc