Машинное обучение — это дисциплина искусственного интеллекта (ИИ), направленная на технологическое развитие человеческих знаний. Машинное обучение позволяет компьютерам справляться с новыми ситуациями посредством анализа, самообучения, наблюдения и опыта.

Машинное обучение — это изучение данных (примеров), построение логики и прогнозирование результата для заданного ввода.

Определение от Тома Митчелла (известного ученого-компьютерщика) —

“A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at the tasks improves with the experiences”

Итак, мы можем разбить это на 2 части —

1. Учитесь на прошлом опыте

2. Улучшить производительность интеллектуальных программ

Контролируемые и неконтролируемые в основном используются многими инженерами по машинному обучению и специалистами по данным. Обучение с подкреплением действительно мощное и сложное средство для решения проблем.

  • Контролируемое обучение

Машинное обучение принимает данные в качестве входных данных. Назовем эти данные данные для обучения.

Обучающие данные включают как входные данные, так и Labels(Targets).

Что такое входы и метки (цели)?? например, сложение двух чисел a=5,b=6, результат =11, Входные равны 5,6 и Цельравны 11.

Сначала мы обучаем модель с большим количеством обучающих данных (входные и целевые), затем с новыми данными и логикой, которую мы получили, прежде чем прогнозировать результат.

(Примечание: мы не получаем точных 6, так как ответ может получить значение, близкое к 6, на основе обучающих данных и алгоритма)

Этот процесс называется Обучение с учителем, и он действительно быстрый и точный.

Классификация.Проблема классификации возникает, когда выходной переменной является категория, например «красный» или «синий», или «болезнь» и «отсутствие болезни». Модель классификации пытается сделать некоторый вывод из наблюдаемых значений. Учитывая один или несколько входных данных, модель классификации попытается предсказать значение одного или нескольких результатов.
Например, при фильтрации электронных писем как «спам» или «не спам», при просмотре данных о транзакциях, «мошеннических» или «уполномоченный». Короче говоря, классификация либо предсказывает категориальные метки классов, либо классифицирует данные (конструирует модель) на основе обучающего набора и значений (меток классов) в атрибутах классификации и использует их при классификации новых данных. Существует несколько моделей классификации. Модели классификации включают логистическую регрессию, дерево решений, случайный лес, дерево с градиентным усилением, многослойный персептрон и наивный байесовский алгоритм.

Некоторые примеры —

  • Предсказание пола человека по стилю его почерка
  • Прогнозирование цены дома в зависимости от площади
  • Предсказание, будет ли муссон нормальным в следующем году
  • Предсказать, сколько копий музыкального альбома будет продано в следующем месяце

Регрессия. Проблема регрессии возникает, когда выходная переменная представляет собой реальное или непрерывное значение, например «зарплата» или «вес». Можно использовать множество различных моделей, самой простой из которых является линейная регрессия. Он пытается сопоставить данные с лучшей гиперплоскостью, проходящей через точки.

Некоторые примеры —

  • Предсказание возраста человека
  • Предсказание национальности человека
  • Предсказание, вырастет ли цена акций компании завтра
  • Предсказание, связан ли документ с наблюдением НЛО?
  • Обучение без учителя

Это тип обучения, при котором мы не задаем цель нашей модели во время обучения, т. Е. Модель обучения имеет только значения входных параметров. Модель сама должна найти способ обучения.

Обучающие данные, которые мы подаем:

  • Неструктурированные данные: могут содержать зашумленные (бессмысленные) данные, отсутствующие значения или неизвестные данные.
  • Немаркированные данные: данные содержат только значения входных параметров, целевого значения (вывода) нет. Его легко собрать по сравнению с помеченным в контролируемом подходе.

Кластеризация. Это тип проблемы, когда мы группируем похожие вещи вместе. Но здесь мы не даем метки, система сама понимает из данных и кластеризует данные.

Некоторые примеры —

  • данные новостные статьи группируются в разные типы новостей.
  • задан набор твитов, кластеризация на основе содержания
  • учитывая набор изображений, сгруппируйте их в разные объекты
  • Обучение с подкреплением

Обучение с подкреплением — это аспект машинного обучения, при котором агент учится вести себя в среде, выполняя определенные действия и наблюдая за вознаграждениями/результатами, которые он получает от этих действий. Каждый раз, когда мы вводим данные, они изучают и добавляют данные к своим знаниям, которые являются обучающими данными. Таким образом, чем больше он узнает, тем лучше он обучается и, следовательно, получает опыт.

Благодаря достижениям в области робототехники, манипулированию руками, Google Deep Mind, обыгравшему профессионального игрока Alpha Go, и недавней победе команды OpenAI над профессиональным игроком в DOTA, область обучения с подкреплением действительно взорвалась за последние годы.

Пример для понимания —

Imagine a baby is given a TV remote control at your home (environment). In simple terms, the baby (agent) will first observe and construct his/her own representation of the environment (state). Then the curious baby will take certain actions like hitting the remote control (action) and observe how would the TV response (next state). As a non-responding TV is dull, the baby dislike it (receiving a negative reward) and will take less actions that will lead to such a result(updating the policy) and vice versa. The baby will repeat the process until he/she finds a policy (what to do under different circumstances) that he/she is happy with (maximizing the total (discounted) rewards).

Практические приложения —

  • Управление ресурсами в компьютерных кластерах
  • Управление светофором
  • Робототехника
  • Персональные рекомендации
  • Торги и реклама