DSF特別LTセッション:DQNを用いたテトリス学習回路のFPGA実装

我々は「テトリス」というゲームにおいて、強化学習の一種であるDQN(Deep Q-Network)を用いて一定手数以上ゲームオーバーにならずにプレイすることができるシステムをFPGA上に実装した。各処理の高速化、回路規模の削減、テトリスのゲーム自体をFPGA上に実装することによるホストPCとの通信量削減を行い、81%の確率で512手以上プレイすることができるよう学習を行うことに成功した。

千葉大学 渡邊 峻介氏
千葉大学
渡邊 峻介 (わたなべ しゅんすけ)
 溝口 貴大氏
溝口 貴大 (みぞぐち たかひろ)