Skip to content

Latest commit

 

History

History
19 lines (14 loc) · 951 Bytes

README.md

File metadata and controls

19 lines (14 loc) · 951 Bytes

cfr

Learn the basis of counterfactual regret minimization(CFR).

CFRはポーカーAIに使われているアルゴリズムである。

rps_submit.ipynb

FixedTrainerオブジェクトは相手がグー、パー、チョキをそれぞれ0.4, 0.3, 0.3の確率で出すとき、 勝率を最大化するような戦略を計算するものである。 計算の結果、最適解はグー、パー、チョキをそれぞれ0, 1, 0の確率で出すときである。

RPSTrainerオブジェクトは相手の出し手を等確率に設定した時、勝率を最大化するような戦略を計算するものである。 計算の結果、こちらも1/3の等確率でグー、パー、チョキを出すと良いという結論に辿り着いた。

rps.ipynb

これは遊びファイルである。

kuhn_poker.ipynb

クーンポーカーという簡略化されたポーカーを遊ぶ この時のナッシュ均衡解を求める