Подразделение Google DeepMind, занимающееся разработками в области искусственного интеллекта, создало улучшенную версию алгоритма AlphaGo, прославившегося обыгрышем чемпиона мира по игре в го. Зная только базовые правила, новая программа — AlphaZero — сумела сама себя обучить игре в шахматы, сёги (японские шахматы) и го всего за 3 дня, без вмешательства человека.
" Начав с совершенно случайной игры, AlphaZero постепенно узнала, что это означает играть хорошо, и сформировала свои свои представления об игре, — заявил глава DeepMind Демис Хассабис.— в этом смысле она свободна от ограничений, которыми руководствуются граждане, думая об игре".
AlphaZero является прямым потомком AlphaGo, которая в 2016 году одолела Ли Седоля — профессионального игрока из Южной Кореи, одного из сильнейших в мире. Пятиматчевая серия закончилась со счетом 4: 1 в угоду ИИ. Седоль, завоевавший многочисленные международные титулы, отыгрался лишь однажды: в четвертой партии, сумев приспособиться к поведению алгоритма.
Под конец 2017-го AlphaGo эволюционировала в AlphaGo Zero (AGZ). Инженеры DeepMind переписали алгоритмы нейросети, сделав её полностью самообучаемой: ИИ начал " тренироваться" сам, без какого-либо участия от людей. Снова и Снова играя сам с собой, через 3 дня AGZ смог победить AlphaGo со счетом 100: 0.
Однако если AGZ мог играть только в го, AlphaZero своими силами освоил сразу 3 игры, и стал гроссмейстером во всех дисциплинах. Для этого ему потребовались огромные вычислительные ресурсы (5 тыс. нейрочипов TPU), сопоставимые с нуждами суперкомпьютера. Как говорит Хассабис, со временем " самоучка" даже выработала собственный собственный, уникальный стиль игры.
Силу алгоритма DeepMind дал оценку гроссмейстер Гарри Каспаров, пишет ArsTechnica. По данным шахматиста, AlphaZero формирует свои свои знания, не оглядываясь на человеческий опыт, и всего за пару часов достигает " результатов, которые превосходят любого человека или машину".