1 :2019/07/17(水) 17:10:14.93 ID:wtKccmt50.net
囲碁のトップ棋士に勝利したAI「AlphaGo」は、自らの進化形として生まれた「AlphaGo Zero」に、 誕生からわずか30時間で超えられてしまいました。AlphaGoとAlphaGo Zeroの違いは、AlphaGo Zeroが人間の棋譜を参考にせず、自身による強化学習で鍛錬を重ねたという 点にありました。これと同じように、カリフォルニア大学アーバイン校(UCI)が生み出した 深層強化学習アルゴリズム「DeepCubeA」は、人間の手助けなく、ルービックキューブをほんの一瞬で解けるようになったそうです。
6色のパネル9枚で構成された六面体の立体パズル・ルービックキューブは、慣れてくると50手程度で解くことができ、最短だと20手を切ることが可能です。
UCIのピエール・バルディ教授らは、このルービックキューブを「DeepCubeA」と呼ばれる深層強化学習アルゴリズムで攻略。事前に解法を与えたり、人間を手助けをしたりすることなく、 2日間かけた自己学習の結果、解決率100%、うち60.3%の事例で最短の解き方を得ることに 成功しました。解くのにかかる時間は「ほんの一瞬」だとのこと。
バルディ教授によると、「DeepCubeA」は解決戦略が人間の解き方と異なっており、そもそも推論形式が異なっていると考えられるとのこと。プロジェクトの究極の目標は 次世代AIシステムの構築にあるとのことで、「今回のことは、大きな目標への一歩です」と バルディ教授は語っています。
なお、今回の事例は「自己学習で解法に到達した」という点がポイントの1つ。
すでにコンピューターを用いた「ルービックキューブ早解き」は相当な速度に到達しており、 2018年にはマサチューセッツ工科大学のベン・カッツ氏とジャレッド・ディ・カルロ氏がわずか 0.38秒での攻略に成功しています。
https://gigazine.net/news/20190717-rubiks-cube-solve-deepcubea/