Google DeepMind разработал самообучаемый алгоритм для игры в го
«Самый совершенный игрок в го».
Подразделение Google DeepMind представило AlphaGo Zero — новую версию алгоритма для игры в го. Искусственный интеллект является самообучаемым: он не анализирует партии, сыгранные человеком.
В AlphaGo Zero заложили лишь правила игры в го. Алгоритм формирует стратегию выигрыша, моделируя игры с самим собой. Удачные варианты ходов сохраняются в алгоритме.
Спустя три дня самообучения AlphaGo Zero смог победить версию AlphaGo, которая в своё время обыграла лучшего в мире игрока в го. После 40 дней ИИ в 90% случаев выигрывал у более совершенной версии оригинального AlphaGo, обучающегося на основе сыгранных человеком партий.
В DeepMind отметили, что избавили алгоритм от ограничений человеческого разума. Ведущий программист AlphaGo Zero Дэвид Сильвер (David Silver) рассказал, что во время самообучения ИИ сначала имитировал поведение начинающего, а после и опытного игрока в го. В конце концов AlphaGo Zero стал совершать ходы, которые нетипичны даже для профессиональных игроков. По мнению программистов DeepMind, они создали самого совершенного игрока в го.
Ранее Google запустил игру Teachable Machine для обучения нейросетей.
Читать по теме:
#959595;">Хотите подсказать новость или поделиться экспертным мнением? Пишите: #959595;">news@cossa.ru
Автор иконки на тизере: Duygu Ozkan, Noun Project

Масштабный спортивный фестиваль для IT-специалистов RUNIT в этом году пройдет 18 июня в Измайловском парке
И если вы читаете этот текст — вы приглашены.
Участвовать можно в личном или командном зачете на дистанции от 3-х до 25 км или собрать команду и пробежать эстафету. С организаторов футболка и крутая медаль для каждого участника, вода, еда, отличная трасса и множество развлечений.
В один день в одном парке соберутся 3 000 айтишников. И мы уверены, что пропускать такое событие нельзя.