PublBox
В этом разделе материалы размещаются пользователями сайта и публикуются после одобрения модератором. Редакция не несет ответственности за орфографические и другие ошибки, хотя и старается исправлять их по мере возможности.
Добавить свою заметку вы можете на этой странице.
14 августа 2015, 14:02

Просто о некоторых способах машинного обучения (ML)

<p>Трудно разобраться в большом количестве материала по теме. Особенно, если задача поставлена на уровне «быстренько разобраться что к чему, найти реализацию и использовать, не вникая в детали.</p>

Трудно разобраться в большом количестве материала по теме. Особенно, если задача поставлена на уровне «быстренько разобраться что к чему, найти реализацию и использовать, не вникая в детали, о которых уже позаботились умные бородатые дяди». Задача статьи — систематизировать часто встречающуюся информацию и преподать её языком, понятным IT-шнику сходу. Сделать эдакую шпаргалку.

Машинное обучение — процесс, целью которого является достижение явно не заложенного поведения компьютера.

Виды ML

  1. Дедуктивное (аналитическое) — выведение фактов и правил из заранее сформулированных и формализованных правил. 
  2. Индуктивное (статистическое) — построение правил на базе эмпирических данных.

Основные задачи ML

  • группировка:
    • кластеризация — разделение объектов на группы по изначально неизвестным признакам;
    • классификация — разделение объектов на группы по заданным признакам;
  • регрессионный анализ — нахождение зависимостей между изменяющимися данными:
    • линейная регрессия — линейная зависимость некой переменной от другой (других);
    • нелинейная регрессия — зависимость выражена нелинейной функцией (степенная, показательная, экспоненциальная и т. п.).

Получи сертификат Digital Project Manager!

25 октября в Москве пройдет первая очная сертификация RDC по позиции Digital Project Manager.

Если вы управляете цифровыми проектами на стороне агентства или на стороне клиента — получите одним из первых на рынке сертификат, подтверждающий высокий уровень вашей компетенции! А чтобы проверить свои силы, можно и нужно пройти полноценный витринный онлайн-тест.

Запись на очную сертификацию Digital Project Manager 25 октября — на этой странице. Cossa рекомендует!

Реклама

Нейронная сеть

Иногда задача такова, что очень трудно даже чётко сформулировать метод её решения, так как условий и зависимостей слишком много. Как раз в таких случаях часто берут нейросети, заменяя огромный сложный алгоритм на чёрный ящик, который можно настраивать, и эмпирическим путём приходят к приемлемому результату.

Перед тем как данные пойдут в нейросеть, их необходимо формализовать — перевести в понятный нейросети вид. Например, превратить картинку в одномерный массив, где каждый элемент соответствует пикселю и содержит информацию «закрашен/не закрашен». Благодаря абстрагированию от конкретных данных и переводу их в такой вид нейросеть можно обучить работать с самыми разными типами данных: графическими, текстовыми, звуковыми.

Элементы сети

  1. Синапс удобно представить как объект, похожий на очередь (канал) и имеющий определённый приоритет. Он нужен для обмена информацией между нейронами.
  2. Нейрон — объект, который принимает значения из синапса(ов), делает определённые вычисления и отдаёт их результат в синапс(ы) и/или аксон(ы).
  3. Аксон — объект, похожий на синапс, но отличающийся тем, что в него можно только помещать данные из нейросети, забирает же их кто-то из вне (например, они просто выводятся пользователю).

Как это работает

Нейронная сеть — группа связанных нейронов. Каждый нейрон имеет маленькую долю ответственности — решает какую-то маленькую задачу, вынося вердикт — 1 или 0. Этих задач и, соответственно, нейронов может быть очень много. Из результатов их решения формируется конечный результат. Настраивается всё это изменением приоритетов синапсов, в результате чего агрегация промежуточных результатов происходит по-разному, и общий результат, соответственно, получается разный.

Настраивать сети можно несколькими способами:

  • обучение с учителем — восстановление зависимости по данным вида «стимул -> реакция»;
  • обучение без учителя — обнаружение зависимостей объектов по обучающей выборке;
  • обучение с подкреплением — обучение с взаимодействием с некоторой средой;
  • генетический алгоритм — случайный подбор и комбинирование параметров по аналогии с механизмом естественного отбора в природе.

Выбор метода зависит от задачи.

Некоторые виды нейросетей

  • персептрон;
  • однослойный;
  • многослойный;
  • рекуррентный;
  • ассоциативная память;
  • спайковые сети;
  • сеть радиальных базисных функций;
  • когнитрон.

Если нейронные сети не являются необходимыми для решения задачи, их лучше не использовать.

Деревья принятия решений

Дерево принятия решений представляет собой набор правил в иерархической, последовательной структуре, где каждому входному данному соответствует узел, дающий решение. Такие деревья бывают бинарными, что по сути — много вложенных if-ов.

Основная проблема деревьев принятия решений — сложность построения. Для этого существует ряд алгоритмов, например Classification and Regression Tree. Он используется для построения бинарного дерева и C4.5 для построения дерева с неограниченным числом потомков у узлов.

Преимущества:

  • быстрое обучение;
  • формулирование правил на естественном языке;
  • простота и интуитивность классификационной модели;
  • высокий уровень и предсказуемость точности прогноза;
  • простота тестирования.

Недостатки:

  • неоптимальность дерева из-за «жадности» большинства алгоритмов построения деревьев;
  • сложность поддержки.

Бустинг (boosting)

Бустинг — это комбинирование недостаточно точных алгоритмов ML, чтобы каждый каким-то образом влиял на результат. Эксперименты показывают, что бустинг позволяет сильно сократить количество ошибок на независимой выборке по мере увеличения количества «плохих» алгоритмов.

Не пропустите!

5 свежих сервисов для увеличения конверсии интернет-магазина
eCommerce-проекты с пугающими интеграциями. Не страшно — проектируем такие уже 5 лет!
Доступно каждому, пользуются единицы: 8 полезных инструментов интернет-маркетинга
15 базовых SEO-советов о том, что сделать при переносе сайта на новый движок
Как мы создали базу знаний по SMM, подключили к чатботу и теперь собираем подписчиков
«Простая схема, которая работает годами». Как GeniusMarketing создаёт рекламные кампании
5 способов создания креатива в Instagram. Советы креативного стратега Facebook
40+ SEO-сервисов для анализа сайта и конкурентов
«Синдром FoMO в каждом из нас». Детали рекламной кампании финансового сервиса
Ситуативный маркетинг на ЧМ-2018: как Domino’s Pizza обошла конкурентов, сохранив почти весь бюджет
Новые форматы мобильной рекламы: проверьте, всё ли вы успели опробовать
Вы обратились в агентство, а оно продвигает ваших конкурентов. Отказаться или работать?

Комментарии:

Реклама


📰 Чем живёт digital.
Главное — в рассылке:




Вход на cossa.ru

Уже есть аккаунт?
Выбирай любой вариант входа:
Facebook Vkontakte

Используйте свой аккаунт в социальной сети Facebook или Вконтакте, чтобы пользоваться сайтом

Не забудьте написать email на странице своего профиля для управления рассылкой