1月にAlphaStarが人間のトッププレイヤー2人に勝利したと報じられたとき、ArsTechnicaなどはその公平性に疑問が残ると評していました。それはゲームにおけるUI、つまりモニターの映像を見て、マウスとキーボードの入力を使って操作するという点で人間に対してAIが優位だということでした。
そこでAlphaStarはStarCraft IIをプレイするに際し、コンピューター側から特別な信号などを受け取るのでなく、モニターを映したカメラ映像で周囲の状況を知るマップ情報も人間同様に制限されるようにしました。さらにマウスやキーボード入力も人間が可能な速度に制限をかけることにしました。そして、そのような条件下でプロゲーマーがStarCraftのトレーニングする様子を模倣し、強化学習に努めました。
また、それまでのAIの学習過程においてDeepMindはAIに勝つ可能性を最大化することを重要視したゲームプレイをさせていました。それだけで全体の上位5%に入れる実力を備えることが出来たものの、さらにそこから上へと踏み入るのにはアルゴリズムを変える必要があると考え、すべてのエージェントが勝利を目指すのでなく、「ここは俺に任せて先へ行け」的な、チームのためなら犠牲になることもいとわない資質を持ったエージェントを加えることにしました。
こうして、Protoss、Terran、およびZergで構成される3種族すべてでAIを鍛え上げていった結果、AlphaStarはすべての種族でグランドマスターに到達、ランキングにおける人間のゲーマーの99.8%に勝てるようになったとのことです。
DeepMindは、AlphaStarのトレーニング速度に関してはまだまだ人間の能力に及ばないとしています。またDeepMindの長期計画では、リアルタイムストラテジーゲームにおける複雑な捜査と状況判断への適用性を他の分野、たとえば自動運転やロボットに活用することを考えており、通常のAIには対処しきれないような異常事態をうまく切り抜けられるAIを目指しています。
https://japanese.engadget.com/2019/11/01/deepmind-ai-starcraft-ii-0-2/
2019-11-01 07:00:00Z
52782004674626
Tidak ada komentar:
Posting Komentar