Exiterra
В этом разделе материалы размещаются пользователями сайта и публикуются после одобрения модератором. Редакция не несет ответственности за орфографические и другие ошибки, хотя и старается исправлять их по мере возможности.
Добавить свою заметку вы можете на этой странице.
14 августа 2015, 14:02
4095
0

Просто о некоторых способах машинного обучения (ML)

<p>Трудно разобраться в большом количестве материала по теме. Особенно, если задача поставлена на уровне «быстренько разобраться что к чему, найти реализацию и использовать, не вникая в детали.</p>

Трудно разобраться в большом количестве материала по теме. Особенно, если задача поставлена на уровне «быстренько разобраться что к чему, найти реализацию и использовать, не вникая в детали, о которых уже позаботились умные бородатые дяди». Задача статьи — систематизировать часто встречающуюся информацию и преподать её языком, понятным IT-шнику сходу. Сделать эдакую шпаргалку.

Машинное обучение — процесс, целью которого является достижение явно не заложенного поведения компьютера.

Виды ML

  1. Дедуктивное (аналитическое) — выведение фактов и правил из заранее сформулированных и формализованных правил. 
  2. Индуктивное (статистическое) — построение правил на базе эмпирических данных.

Основные задачи ML

  • группировка:
    • кластеризация — разделение объектов на группы по изначально неизвестным признакам;
    • классификация — разделение объектов на группы по заданным признакам;
  • регрессионный анализ — нахождение зависимостей между изменяющимися данными:
    • линейная регрессия — линейная зависимость некой переменной от другой (других);
    • нелинейная регрессия — зависимость выражена нелинейной функцией (степенная, показательная, экспоненциальная и т. п.).

cossa-icons-6.png

Весь интернет-маркетинг за 19 недель!

Cossa рекомендует: онлайн-курс по интернет-маркетингу от Ingate — digital-агентства с 17-летним опытом.

  • 17 учебных блоков по ключевым вопросам интернет-маркетинга
  • Поддержка менторов
  • Диплом
  • Cтажировка в топовых агентствах России
  • Помощь в трудоустройстве
Узнать больше >>

Реклама

Нейронная сеть

Иногда задача такова, что очень трудно даже чётко сформулировать метод её решения, так как условий и зависимостей слишком много. Как раз в таких случаях часто берут нейросети, заменяя огромный сложный алгоритм на чёрный ящик, который можно настраивать, и эмпирическим путём приходят к приемлемому результату.

Перед тем как данные пойдут в нейросеть, их необходимо формализовать — перевести в понятный нейросети вид. Например, превратить картинку в одномерный массив, где каждый элемент соответствует пикселю и содержит информацию «закрашен/не закрашен». Благодаря абстрагированию от конкретных данных и переводу их в такой вид нейросеть можно обучить работать с самыми разными типами данных: графическими, текстовыми, звуковыми.

Элементы сети

  1. Синапс удобно представить как объект, похожий на очередь (канал) и имеющий определённый приоритет. Он нужен для обмена информацией между нейронами.
  2. Нейрон — объект, который принимает значения из синапса(ов), делает определённые вычисления и отдаёт их результат в синапс(ы) и/или аксон(ы).
  3. Аксон — объект, похожий на синапс, но отличающийся тем, что в него можно только помещать данные из нейросети, забирает же их кто-то из вне (например, они просто выводятся пользователю).

Как это работает

Нейронная сеть — группа связанных нейронов. Каждый нейрон имеет маленькую долю ответственности — решает какую-то маленькую задачу, вынося вердикт — 1 или 0. Этих задач и, соответственно, нейронов может быть очень много. Из результатов их решения формируется конечный результат. Настраивается всё это изменением приоритетов синапсов, в результате чего агрегация промежуточных результатов происходит по-разному, и общий результат, соответственно, получается разный.

Настраивать сети можно несколькими способами:

  • обучение с учителем — восстановление зависимости по данным вида «стимул -> реакция»;
  • обучение без учителя — обнаружение зависимостей объектов по обучающей выборке;
  • обучение с подкреплением — обучение с взаимодействием с некоторой средой;
  • генетический алгоритм — случайный подбор и комбинирование параметров по аналогии с механизмом естественного отбора в природе.

Выбор метода зависит от задачи.

Некоторые виды нейросетей

  • персептрон;
  • однослойный;
  • многослойный;
  • рекуррентный;
  • ассоциативная память;
  • спайковые сети;
  • сеть радиальных базисных функций;
  • когнитрон.

Если нейронные сети не являются необходимыми для решения задачи, их лучше не использовать.

Деревья принятия решений

Дерево принятия решений представляет собой набор правил в иерархической, последовательной структуре, где каждому входному данному соответствует узел, дающий решение. Такие деревья бывают бинарными, что по сути — много вложенных if-ов.

Основная проблема деревьев принятия решений — сложность построения. Для этого существует ряд алгоритмов, например Classification and Regression Tree. Он используется для построения бинарного дерева и C4.5 для построения дерева с неограниченным числом потомков у узлов.

Преимущества:

  • быстрое обучение;
  • формулирование правил на естественном языке;
  • простота и интуитивность классификационной модели;
  • высокий уровень и предсказуемость точности прогноза;
  • простота тестирования.

Недостатки:

  • неоптимальность дерева из-за «жадности» большинства алгоритмов построения деревьев;
  • сложность поддержки.

Бустинг (boosting)

Бустинг — это комбинирование недостаточно точных алгоритмов ML, чтобы каждый каким-то образом влиял на результат. Эксперименты показывают, что бустинг позволяет сильно сократить количество ошибок на независимой выборке по мере увеличения количества «плохих» алгоритмов.

✉️ Самое интересное шлём по почте, не чаще двух раз в неделю.

Не пропустите!

4761
Как искать девушку, если ты маркетолог. Полтора года спустя
Приходите на премьерную выставку-фестиваль коммерческого креатива PSI Russia!
18299
Искусственный интеллект в маркетинге: начало новой эпохи
3934
Работодателям. Ошибки в подборе сотрудников
7112
Примеры интересных digital-кампаний в Viber, WhatsApp и Telegram
8210
В украинском Facebook разгорается скандал рестораторов. Следим за работой с репутацией
4602
Нам весело, а им больно. Косяки в рекламе крупных брендов
7611
Саморазвитие от ленивого: почему полезно плыть по течению и ничего не планировать
4056
4 тренда, которые формируют маркетинг будущего: ключевые тезисы с конференции ENGAGE IAB UK
4635
Как бренды используют IGTV от Instagram: смотрим первые примеры
43266
40+ SEO-сервисов для анализа сайта и конкурентов
4929
«Продактами не рождаются», — Анна Булдакова о шагах в профессию продакт-менеджера

Комментарии:

Ответить?
Реклама

Чем живёт digital.
Главное — в рассылке:




Вход на cossa.ru

Уже есть аккаунт?
Выбирай любой вариант входа:
Facebook Twitter Vkontakte

Используйте свой аккаунт в социальной сети Facebook или Twitter, чтобы пользоваться сайтом

Не забудьте написать email на странице своего профиля для управления рассылкой