不確実な評価に基づく先読みの方法
How to look-ahead based on uncertain evaluation

概要

複数の候補手が存在する中で、いくつかの候補手を試しながら最適手を探索するという木探索問題において、選んだ手の結果が完全に未知となる状況は、強化学習の問題として定式化され、逆に選んだ手の結果が完全に既知となる状況の木探索問題は、最適制御やmini-max法などの従来の木探索アルゴリズムによって解くことができる。しかし応用上は、選んだ手の結果が完全に未知であるわけでも完全に既知であるわけでもないことが多い。
本発表では、確率的な評価によって不確実性を表現することで、いわゆる幅優先探索と深さ優先探索のジレンマを解くアルゴリズムを提案する。

産業界への展開例・適用分野

投薬スケジューリングの最適化、広告・ニュース記事推薦、
部分的に未知なダイナミクスをもつ対象に対する制御、
囲碁・将棋などのゲーム木探索

研究者

氏名 専攻 研究室 役職/学年
大月 龍 システム科学専攻 石井研 修士1回生

PAGE TOP