19 октября 2017, 12:50

Google DeepMind разработал самообучаемый алгоритм для игры в го

«Самый совершенный игрок в го».

Подразделение Google DeepMind представило AlphaGo Zero — новую версию алгоритма для игры в го. Искусственный интеллект является самообучаемым: он не анализирует партии, сыгранные человеком.

В AlphaGo Zero заложили лишь правила игры в го. Алгоритм формирует стратегию выигрыша, моделируя игры с самим собой. Удачные варианты ходов сохраняются в алгоритме.

Спустя три дня самообучения AlphaGo Zero смог победить версию AlphaGo, которая в своё время обыграла лучшего в мире игрока в го. После 40 дней ИИ в 90% случаев выигрывал у более совершенной версии оригинального AlphaGo, обучающегося на основе сыгранных человеком партий.

В DeepMind отметили, что избавили алгоритм от ограничений человеческого разума. Ведущий программист AlphaGo Zero Дэвид Сильвер (David Silver) рассказал, что во время самообучения ИИ сначала имитировал поведение начинающего, а после и опытного игрока в го. В конце концов AlphaGo Zero стал совершать ходы, которые нетипичны даже для профессиональных игроков. По мнению программистов DeepMind, они создали самого совершенного игрока в го.

Ранее Google запустил игру Teachable Machine для обучения нейросетей.

Читать по теме:

Хотите подсказать новость или поделиться экспертным мнением? Пишите: news@cossa.ru

Автор иконки на тизере: Duygu Ozkan, Noun Project