強化学習を用いた二人ゲーム戦略の解析
Study on strategies of two-person games via reinforcement learning
概要
ポーカーなどのゲームにおいて多く勝つプレイヤーと多く負けるプレイヤーが存在するのはなぜか?プレイヤー同士が相手の状況・手札を確率的に推定しながら行動する場合、 数多くのゲームを行うにつれてプレイヤー同士の勝敗差は拮抗してくると予想される。しかし、現実では勝利の多寡が生まれる。この原因として多く勝利する者は「ハッタリ」をうまく利用しているのではないかと考え、その影響について研究することを本研究の主題とした。そこで、ゲームにおける戦略を数理的に研究するために、ハッタリ戦略を含むゲームを設計し、利得に対するプレイヤーの最適な行動を評価し学習する強化学習を用いてゲームのシミュレーションを行った。

産業界への展開例・適用分野
情報が不完全で互いの状況がわからない状況でどのような行動を選択するのが最も適切であるか、という問題に対する解は我々の関心を集めるところである。本研究は人と人がコミュニケーションできる状況で、ゲームにおけるブラフ戦略の効果を確かめることを目的としている。これにより経済戦略への貢献、応用へつながることを期待している。
研究者
氏名 | 専攻 | 研究室 | 役職/学年 |
---|---|---|---|
村上 公平 | 複雑系科学専攻 | 非線形物理学講座 理論神経科学・非平衡系 | 修士1回生 |