Введение в контролируемое обучение и обучение без учителя

Обучение под наблюдением и обучение без учителя являются задачами машинного обучения.
Контролируемое обучение - это просто процесс обучения алгоритму из набора данных обучения. Контролируемое обучение - это когда у вас есть входные переменные и выходная переменная, и вы используете алгоритм для изучения функции отображения от входа к выходу. Цель состоит в том, чтобы приблизить функцию отображения, чтобы, когда у нас были новые входные данные, мы могли предсказать выходные переменные для этих данных.

Неконтролируемое обучение - это моделирование базовой или скрытой структуры или распределения в данных, чтобы узнать больше о данных. Обучение без учителя - это когда у вас есть только входные данные и нет соответствующих выходных переменных.

Учебный набор данных: набор примеров, используемых для обучения, где целевое значение известно.

Сравнение лицом к лицу между контролируемым обучением и неконтролируемым обучением (Инфографика)

Ниже приведены 7 лучших сравнений между обучением с обучением и обучением без учителя

Ключевые различия между контролируемым обучением и неконтролируемым обучением

Ниже приведены списки баллов, описывающие ключевые различия между обучением с наблюдением и обучением без учителя.

1. Алгоритмы машинного обучения обнаруживают закономерности в больших данных. Эти разные алгоритмы можно классифицировать на две категории в зависимости от того, как они «узнают» о данных, чтобы делать прогнозы. Это контролируемое и неконтролируемое обучение.

2. В контролируемом обучении ученый выступает в качестве руководства, чтобы научить алгоритм, какие выводы или прогнозы он должен сделать. В неконтролируемом обучении нет правильного ответа, нет учителя, алгоритмы предоставлены самим себе, чтобы обнаружить и представить интересную скрытую структуру в данных.

3. Модель обучения под наблюдением будет использовать данные обучения для изучения связи между входом и выходом.

4. Обучение без учителя не использует выходные данные. При неконтролируемом обучении они не будут помечены как предшествующие знания, тогда как при контролируемом обучении будут иметь доступ к меткам и будут иметь предварительные знания о наборах данных.

5. Контролируемое обучение. Идея состоит в том, что обучение может быть обобщено и что модель может использоваться с новыми данными с некоторой точностью.

6. Контролируемые алгоритмы обучения: метод опорных векторов, линейная регрессия и логистика, нейронная сеть, деревья классификации и случайный лес и т. Д.

7. Необслуживаемые алгоритмы можно разделить на различные категории: кластерные алгоритмы, K-средние значения, иерархическая кластеризация, алгоритмы уменьшения размеров, обнаружение аномалий и т. Д.

8. Классификация и регрессия в области широко используемых алгоритмов в контролируемом обучении. Машины опорных векторов (SVM) - это модели машинного обучения с контролируемыми алгоритмами обучения, которые можно использовать как для целей классификации, так и для целей регрессии, но в основном используются для задач классификации.

9. В модели SVM мы отображаем каждый элемент данных как точку в n-мерном пространстве (где n - это объекты, которые у нас есть), причем значения каждого объекта - это значение определенной координаты. Затем классификация выполняется путем нахождения гиперплоскости, которая дифференцирует два класса.

10. Основной целью алгоритмов регрессии является прогнозирование дискретного или непрерывного значения. В некоторых случаях прогнозируемое значение может использоваться для определения линейной взаимосвязи между атрибутами. На основе проблемы могут быть использованы алгоритмы регрессии разности. Некоторые из основных алгоритмов регрессии - линейная регрессия, полиномиальная регрессия и т. Д.

11. Кластеризация широко используется в обучении без учителя. Кластеризация - это задача разделения точек данных на количество групп, так что одни и те же черты характера будут вместе в форме кластера. Есть еще много алгоритмов кластеризации; немногие из них - это модели подключения, модели центроидов, модели распределения и модели плотности.

12. Иерархическая кластеризация подпадает под неконтролируемое обучение. Иерархическая кластеризация, как следует из названия, представляет собой алгоритм, который строит иерархию кластеров. Этот алгоритм начинается со всех точек данных, назначенных их кластеру. Затем два ближайших кластера объединяются в один кластер. В конце концов, этот алгоритм завершается, когда остается только один кластер.

13.KMeans подпадает под неконтролируемый метод кластеризации. Данные будут разбиты на k кластеров в зависимости от их особенностей. Каждый кластер представлен своим центроидом, определяемым как центр точек в кластере. KMeans прост и быстр, но он не дает одинакового результата при каждом запуске.

14. Чтобы лучше понять обучение под наблюдением и обучение без учителя, давайте возьмем примеры из реальной жизни. Обучение под контролем. Давайте рассмотрим в качестве примера одну из функций Gmail - спам. Основываясь на прошлой информации о спаме, отфильтровываю новую входящую почту в папку «Входящие» или «Нежелательную папку». В этом сценарии Gmail моделирует функцию сопоставления для разделения входящей почты на основе предшествующего знания о письмах, это контролируемое обучение.

15. Необучаемое обучение. Предположим, что друг приглашает вас на свою вечеринку, где вы знакомитесь с новыми людьми. Теперь вы классифицируете их, не используя предварительные знания (обучение без учителя), и эта классификация может иметь любую черту. Это может быть возрастная группа, пол, одежда, образовательная квалификация или любой другой способ. Поскольку вы не использовали никаких предварительных знаний о людях и не классифицировали их, это относится к обучению без надзора.

Сравнение обучения с обучением и обучения без учителя

Контролируемое обучениеОбучение без учителя

метод

Будут заданы входные и выходные переменные.Будут предоставлены только входные данные

Цель

Цель контролируемого обучения состоит в том, чтобы определить функцию так хорошо, чтобы при задании нового набора входных данных можно было предсказать результат.Целью обучения без присмотра является моделирование скрытых шаблонов или базовой структуры в заданных входных данных для изучения этих данных.

Учебный класс

Проблемы машинного обучения, Data Mining и Нейронные сети,Машинное обучение, интеллектуальный анализ данных, проблемы и нейронные сети

Примеры

  • классификация
  • регрессия
  • Линейная регрессия
  • Машина опорных векторов
  • Кластеризация
  • ассоциация
  • К средних
  • ассоциация
Кто пользуетсяУченые данныхУченые данных

Eco-система

Обработка больших данных, интеллектуальный анализ данных и т. Д.

Обработка больших данных, интеллектуальный анализ данных и т. Д.

Пользы

Контролируемое обучение часто используется для экспортных систем в распознавании изображений, распознавании речи, прогнозировании, финансовом анализе и обучении нейронных сетей и деревьев решений и т. Д.

Необслуживаемые алгоритмы обучения используются для предварительной обработки данных, во время поискового анализа или для предварительной подготовки алгоритмов обучения под наблюдением.

Вывод - обучение под наблюдением против обучения без учителя

Выбор алгоритма машинного обучения под наблюдением или без присмотра, как правило, зависит от факторов, связанных со структурой и объемом ваших данных, а также с вариантом использования. На самом деле, в большинстве случаев, ученые данных используют подходы Supervised Learning и Unsupervised Learning вместе для решения варианта использования.

Рекомендуемая статья

Это было руководство по контролируемому обучению против неконтролируемого обучения, их значению, личному сравнению, ключевым различиям, сравнительной таблице и выводам. Вы также можете посмотреть следующие статьи, чтобы узнать больше -

  1. 7 лучших сравнений между обучаемым и обучающим обучением
  2. 5 самых полезных отличий между наукой о данных и машинным обучением
  3. Узнайте, 10 лучших различий между картами уменьшить и пряжи
  4. MapReduce против Apache Spark - 20 полезных сравнений для изучения
  5. Что такое обучение усилению?