Google DeepMind разработал самообучаемый алгоритм для игры в го
«Самый совершенный игрок в го».
Подразделение Google DeepMind представило AlphaGo Zero — новую версию алгоритма для игры в го. Искусственный интеллект является самообучаемым: он не анализирует партии, сыгранные человеком.
В AlphaGo Zero заложили лишь правила игры в го. Алгоритм формирует стратегию выигрыша, моделируя игры с самим собой. Удачные варианты ходов сохраняются в алгоритме.
Спустя три дня самообучения AlphaGo Zero смог победить версию AlphaGo, которая в своё время обыграла лучшего в мире игрока в го. После 40 дней ИИ в 90% случаев выигрывал у более совершенной версии оригинального AlphaGo, обучающегося на основе сыгранных человеком партий.
В DeepMind отметили, что избавили алгоритм от ограничений человеческого разума. Ведущий программист AlphaGo Zero Дэвид Сильвер (David Silver) рассказал, что во время самообучения ИИ сначала имитировал поведение начинающего, а после и опытного игрока в го. В конце концов AlphaGo Zero стал совершать ходы, которые нетипичны даже для профессиональных игроков. По мнению программистов DeepMind, они создали самого совершенного игрока в го.
Ранее Google запустил игру Teachable Machine для обучения нейросетей.
Читать по теме:
Хотите подсказать новость или поделиться экспертным мнением? Пишите: news@cossa.ru
Автор иконки на тизере: Duygu Ozkan, Noun Project
Хотите защитить себя в цифровой среде, используя всего один сервис?
Подключайте МТС Membrana — комплексное решение для цифровой безопасности.
Membrana это:
- Приватность в сети: контроль цифрового следа, мониторинг утечек, дополнительные номера и почты для защиты личных данных;
- Удобство голосового общения: умная фильтрация и управление входящими;
- Дополнительные возможности: доступ к зарубежным сайтам и оплата иностранных сервисов; блокировка рекламы.
