Алгоритм Google AlphaZero победил лучших ИИ-игроков в шахматы, го и сёги
Программа раскусила три сложные логические игры менее чем за сутки.
Команда разработчиков Google DeepMind опубликовала исследовательскую работу об успешном )и самостоятельном) обучении ИИ сложным логическим играм. После восьми часов тренировки новый алгоритм одолел победоносного AlphaGo, после четырёх часов — выиграл у чемпионской шахматной программы Stockfish, а через два часа — превзошёл Elmo, лучшую программу по игре в сёги, японский аналог шахмат.
Алгоритм получил название AlphaZero. Секрет его успеха в том, что программа не создавалась для какой-то конкретной игры. Разработчики лишь закладывали в неё основные правила. После чего система играла сама с собой, наращивая скорость и результаты. Такой метод обучения ИИ называется «усиленным».
В мае программа Google AlphaGo впервые победила лучшего из людей в логической игре Го со счётом 3:0. Перед соревнованием систему обучала команда специалистов. В октябре разработчики Google представили улучшенную версию программы — AlphaGo Zero. Она самостоятельно достигла уровня предшественника благодаря «усиленному обучению». А новый AlphaZero смог менее чем за сутки освоить три сложные логические игры и победить лучшие алгоритмы. Такая универсальная и эффективная обучаемость приближает разработчиков к созданию по-настоящему искусственного интеллекта.
Материалы по теме:
Хотите подсказать новость или поделиться экспертным мнением? Пишите: news@cossa.ru