DSF特別LTセッション:ニューラルネットワークを用いたバックギャモンの最善手推定回路の設計と実装

バックギャモンを強化学習によってプレイする回路の設計を行った。ニューラルネットワークによって各行動を評価し、最善手を推定する回路を設計した。これらをSoC FPGAに実装し、CPU側で対戦するプレイヤーを切り替えることで、自己対戦学習とユーザー対戦がどちらも可能なスタンドアロンシステムを構築した。また、ソフトウェア上で学習したパラメータを用いることで、初心者レベルに近いプレイを行うシステムの構築に成功した。

千葉大学 原 貴之氏
千葉大学
原 貴之 (はら たかゆき)
 安木 大貴氏
安木 大貴 (やすき だいき)
 塩見 日隆氏
塩見 日隆 (しおみ はるたか)