AlphaGo Zero は3日で初心者からグランドマスターへ – 他の助けなしで



(写真はDeepMindから)
 
[IEEE SPECTRUM]IEEE SPECTRUMによると、Googleのロンドンに本拠を置くDeepMindは、昨年のソウルで世界クラスの選手であるLee Sedol氏を倒したAlphaGoよりも、Goの古代中国ゲームを楽しむマシンを開発したことを発表しました。
 

3日間で

以前のプログラムは、数多くのマスターゲームのデータベースで数か月にわたって訓練され、人間のクリエイターからのポインタホイールをたくさん持っていました。そして、それはそれ自体に対して無数のゲームをすることによってさらに改善されました。
 
しかし、AlphaGo Zeroと呼ばれる新しいものは、トレーニングホイールを受けていませんでした。それはタイロからグランドマスターまでのすべての道を訓練しました。たった3日間で。
 

100試合で全勝

数日間のトレーニングの後、新しいマシンは、ゲームごとにプレーヤー1人につき2時間という標準的なトーナメントスピードで行われた試合で、古いものに対してピットインされました。アルファゴーゼロは100試合で全勝を達成しました。
 
出典:IEEE SPECTRUM