2022年03月10日

AIが6人ポーカーでプロに勝利した話

小ネタ
AIが6人ポーカーでプロに勝利した話

ざっくり言うと

  • Facebookとカーネギーメロン大学が共同開発した人工知能 「Pluribus」
  • ノーリミットのテキサス・ホールデムで世界のトッププロに勝利
  • トッププロの中には、WSOP優勝者などの猛者が多数

2019年、Facebookとカーネギーメロン大学(CMU)の研究チームが共同開発した人工知能 「Pluribus」が、ノーリミットのテキサス・ホールデムで世界のトッププロを駆逐しました。


Pluribus Poker AI from Facebook AI Research(4分36秒)

この発表を裏付ける論文は、米科学誌Scienceサイトで公開されています。

 

◆6人対戦での勝利がいかにすごいことか

これまでも、AIが人間に勝利したニュースは、度々報じられてきました。
しかし、これまでの対戦はAI対人間のヘッズアップ(1対1)で、複数人で行う実際のゲームとは別ものだと考えられてきました。本件については、日本屈指のプロポーカープレイヤーである木原直哉氏も過去に同様の指摘をされていました。

「1対1」のポーカーは全く別のゲーム
『(これまでの話として)AIと人間の勝負はその性質上、普段はほとんど行われることのない「1対1」でやらざるを得ません。ヘッズアップのポーカーは、通常の6人以上のゲームとは全く感覚が異なります。 6人のゲームでは、平均して6回に1回勝負に勝ち、その上で、勝つときは対戦相手よりやや多くチップを得て、負けるときに失うチップをやや小さくすることができれば、トータルで勝つことができます。一方、ヘッズアップでは、平均して2回に1回勝負に勝たないといけないのです。なので、プロのプレイヤーといえども、ヘッズアップが強いかどうかはまた別物なのです。』

「なぜ人間はポーカーでAIに負けたのか? 日本トッププロが解説する“違和感”」(ITmedia)

 

◆対戦結果

今回の対戦では、複数の人間の中にAIが1人混ざるものと、複数のAIの中に人間が1人混ざるものの2パターンでの検証がなされています。

①「人間 5人 VS. AI 1人」

対戦した15人の人間は、それぞれが過去に100万ドル(約1億円)超を獲得したことのあるプロのプレイヤーで、ローテーションしながら6人対戦を12日間で1万回のプレイをしました。プロのプレイヤーの中には、WSOP(ワールド・シリーズ・オブ・ポーカー)メインイベントの優勝者グレッグ・マーソン氏や、WSOPサイドイベントの優勝者アンソニー・グレッグ氏も含まれていたそうです。
結果は、AIの勝利。

②「人間 1人 VS. AI 5人」

対戦した人間の中には、WPT(ワールド・ポーカー・ツアー)の最多優勝者ダレン・エリアス氏や、WSOPメインイベントの優勝者クリス・ファーガソン氏も含まれており、1人のプレイヤーが5人のAIを相手に5,000回プレイしたそうです。
結果は、こちらもAIの勝利。

2017年の「Libratus」のヘッズアップでの勝利から、今回の「Pluribus」の6人対戦での勝利まで、わずか2年。開発陣の能力の高さに感服です。また、対戦相手がこの面子では、プロのレベルが低かったなんて言い訳もできないですね。

 

◆AI(Pluribus)の学習プロセスとシステム構成がすごい

「Pluribus」は、対戦相手の手を最後まで予測せず、2・3手先までに限定することで、予想プロセスを大幅に効率化したそうです。その結果、AIの自己学習期間はわずか8日。システム構成は、512GB以下のRAMを搭載した64コアサーバのみで、「Pluribus」の自己学習に要したコストはわずか150ドルだったとのことです。これまでのAIが数億円のスーパーコンピューターを駆使していたことを考えると、あり得ないレベルの技術革新です。

また、「Pluribus」は、実際にプレイする際、2個のCPUと128GBのメモリーしか使用しないそうです。となると、スマホのリソースでも十分動作可能で、カジノのポーカールームでのスマホの使用が全面禁止になる日も、そう遠くないかもしれません。

 

◆さいごに

本件で気になったのは、「Pluribus」が一般的には悪手とされるドンクベット(相手のベットやレイズにコールして終了した次のアクションで、相手に先んじてベットすること)をプロよりもはるかに多く使用していたこと。

一般的にドンクベットは、下手の代表格と考えられがちですが、それが既成概念や固定観念による誤った考え方かもしれないという仮説が生まれています。

既成概念・・・一般的に社会で認められていること
固定観念・・・自身が「これは、こうなんだ!」と思い込んでいること

もしこの仮説が正しければ、ポーカーの戦術が大きく変わる可能性があります。