webit
19 октября 2017, 12:50

Google DeepMind разработал самообучаемый алгоритм для игры в го

«Самый совершенный игрок в го».

Подразделение Google DeepMind представило AlphaGo Zero — новую версию алгоритма для игры в го. Искусственный интеллект является самообучаемым: он не анализирует партии, сыгранные человеком.

В AlphaGo Zero заложили лишь правила игры в го. Алгоритм формирует стратегию выигрыша, моделируя игры с самим собой. Удачные варианты ходов сохраняются в алгоритме.

Спустя три дня самообучения AlphaGo Zero смог победить версию AlphaGo, которая в своё время обыграла лучшего в мире игрока в го. После 40 дней ИИ в 90% случаев выигрывал у более совершенной версии оригинального AlphaGo, обучающегося на основе сыгранных человеком партий.

В DeepMind отметили, что избавили алгоритм от ограничений человеческого разума. Ведущий программист AlphaGo Zero Дэвид Сильвер (David Silver) рассказал, что во время самообучения ИИ сначала имитировал поведение начинающего, а после и опытного игрока в го. В конце концов AlphaGo Zero стал совершать ходы, которые нетипичны даже для профессиональных игроков. По мнению программистов DeepMind, они создали самого совершенного игрока в го.

Ранее Google запустил игру Teachable Machine для обучения нейросетей.

Хотите подсказать новость или поделиться экспертным мнением? Пишите: news@cossa.ru

Автор иконки на тизере: Duygu Ozkan, Noun Project

Корпоративный пакет 2019 на Cossa

«Корпоративные пакеты» Cossa — это особый набор из десяти рекламных опций, включающий баннеры, анонсы в соцсетях и публикации о компании.

Это самый комплексный и высокий по КПД из коммерческих форматов на Cossa.

Узнать больше >>>

Реклама

Комментарии:

Реклама


📰 Чем живёт digital.
Главное — в рассылке:




Вход на cossa.ru

Уже есть аккаунт?
Выбирай любой вариант входа:
Facebook Vkontakte

Используйте свой аккаунт в социальной сети Facebook или Вконтакте, чтобы пользоваться сайтом

Не забудьте написать email на странице своего профиля для управления рассылкой