Разница между линейной регрессией и логистической регрессией

В следующей статье Линейная регрессия против Логистической регрессии представлены наиболее важные различия между ними, но прежде чем мы увидим, что означает Регрессия?

регрессия

Регрессия - это, в основном, статистическая мера для определения силы взаимосвязи между одной зависимой переменной, то есть выходом Y, и рядом других независимых переменных, то есть X 1, X 2 и так далее. Регрессионный анализ в основном используется для прогнозирования и прогнозирования.

Что такое линейная регрессия?

Линейная регрессия - это алгоритм, основанный на контролируемой области обучения машинного обучения. Он наследует линейные отношения между своими входными переменными и единственной выходной переменной, где выходная переменная имеет непрерывный характер. Он используется для прогнозирования значения выходных данных, скажем, Y на входах, скажем, X. Когда рассматривается только один вход, это называется простой линейной регрессией.

Его можно разделить на две основные категории:

1. Простая регрессия

Принцип действия: Основная цель - найти уравнение прямой линии, которое наилучшим образом соответствует выбранным данным. Это уравнение алгебраически описывает отношения между двумя переменными. Наиболее подходящая прямая линия называется линией регрессии.

Y = β 0 + β 1 X

Где,

β представляет особенности

β 0 представляет точку пересечения

β 1 представляет коэффициент особенности X

2. Многовариантная регрессия

Он используется для прогнозирования корреляции между несколькими независимыми переменными и одной зависимой переменной. Регрессия с более чем двумя независимыми переменными основана на подборе формы к совокупности данных на многомерном графике. Форма регрессии должна быть такой, чтобы минимизировать расстояние формы от каждой точки данных.

Линейная модель отношений может быть представлена ​​математически, как показано ниже:

Y = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 + ……. + β n X n

Где,

β представляет особенности

β 0 представляет точку пересечения

β 1 представляет собой коэффициент признака X 1

β n представляет собой коэффициент признака X n

Преимущества и недостатки линейной регрессии

Ниже приведены преимущества и недостатки:

преимущества

  • Благодаря своей простоте широко используется моделирование для предсказаний и выводов.
  • Основное внимание уделяется анализу данных и предварительной обработке данных. Таким образом, он имеет дело с различными данными, не заботясь о деталях модели.

Недостатки

  • Он работает эффективно, когда данные нормально распределены. Таким образом, для эффективного моделирования следует избегать коллинеарности.

Что такое логистическая регрессия?

Это форма регрессии, которая позволяет прогнозировать дискретные переменные с помощью смеси непрерывных и дискретных предикторов. Это приводит к уникальной трансформации зависимых переменных, которая влияет не только на процесс оценки, но и на коэффициенты независимых переменных. Он затрагивает тот же вопрос, что и множественная регрессия, но без предположений о распределении предикторов. В логистической регрессии исходная переменная является двоичной. Целью анализа является оценка влияния нескольких объясняющих переменных, которые могут быть числовыми, категориальными или обоими.

Типы логистической регрессии

Ниже приведены 2 типа логистической регрессии:

1. Бинарная логистическая регрессия

Он используется, когда зависимая переменная является дихотомической, то есть как дерево с двумя ветвями. Используется, когда зависимая переменная является непараметрической.

Используется когда

  • Если нет линейности
  • Есть только два уровня зависимой переменной.
  • Если многомерная нормальность сомнительна.

2. Полиномиальная логистическая регрессия

Анализ полиномиальной логистической регрессии требует, чтобы независимые переменные были метрическими или дихотомическими. Он не делает никаких предположений о линейности, нормальности и однородности дисперсии для независимых переменных.

Используется, когда зависимая переменная имеет более двух категорий. Он используется для анализа отношений между неметрической зависимой переменной и метрической или дихотомической независимой переменной, а затем сравнивает несколько групп посредством комбинации бинарных логистических регрессий. В конце концов, он предоставляет набор коэффициентов для каждого из двух сравнений. Коэффициенты для контрольной группы принимаются за все нули. Наконец, прогнозирование основано на наибольшей вероятности.

Преимущество логистической регрессии: это очень эффективный и широко используемый метод, поскольку он не требует большого количества вычислительных ресурсов и не требует какой-либо настройки.

Недостаток логистической регрессии: ее нельзя использовать для решения нелинейных задач.

Сравнение лицом к лицу между линейной регрессией и логистической регрессией (инфографика)

Ниже приведены 6 основных различий между линейной регрессией и логистической регрессией.

Ключевая разница между линейной регрессией и логистической регрессией

Давайте обсудим некоторые из основных ключевых различий между линейной регрессией и логистической регрессией

Линейная регрессия

  • Это линейный подход
  • Он использует прямую линию
  • Он не может принимать категориальные переменные
  • Он должен игнорировать наблюдения с отсутствующими значениями числовой независимой переменной
  • Выход Y задается как

  • Увеличение на 1 единицу x увеличивает Y на α

Приложения

  • Прогнозирование цены товара
  • Прогнозирование очков в матче

Логистическая регрессия

  • Это статистический подход
  • Он использует сигмовидную функцию
  • Может принимать категориальные переменные
  • Он может принимать решения, даже если присутствуют наблюдения с отсутствующими значениями
  • Выход Y задан как, где z задан как

  • Увеличение единицы на 1 единицу увеличивает Y на логарифмические шансы α
  • Если P - вероятность события, то (1-P) - вероятность того, что оно не произошло. Шансы на успех = P / 1-P

Приложения

  • Предсказание, будет ли сегодня дождь или нет.
  • Предсказание, является ли электронная почта спамом или нет.

Линейная регрессия и сравнительная таблица логистической регрессии

Давайте обсудим лучшее сравнение между линейной регрессией и логистической регрессией

Линейная регрессия

Логистическая регрессия

Используется для решения проблем регрессииИспользуется для решения задач классификации
Он моделирует отношения между зависимой переменной и одной или несколькими независимыми переменнымиОн прогнозирует вероятность результата, который может иметь только два значения на выходе: 0 или 1.
Прогнозируемый результат является непрерывной переменнойПрогнозируемый результат является дискретной переменной
Прогнозируемый выход Y может превышать 0 и 1 диапазонПрогнозируемый выход Y лежит в пределах 0 и 1 диапазона
Прогнозируемый выход Y может превышать 0 и 1 диапазонПрогнозируемый выход

Вывод

Если объекты не способствуют прогнозированию или если они очень сильно связаны друг с другом, это добавляет шум в модель. Итак, функции, которые не вносят достаточный вклад в модель, должны быть удалены. Если независимые переменные сильно коррелированы, это может вызвать проблему мультиколлинеарности, которая может быть решена путем запуска отдельных моделей с каждой независимой переменной.

Рекомендуемые статьи

Это было руководство по линейной регрессии против логистической регрессии. Здесь мы обсуждаем ключевые различия линейной регрессии и логистической регрессии с помощью инфографики и таблицы сравнения. Вы также можете взглянуть на следующие статьи, чтобы узнать больше:

  1. Наука о данных против визуализации данных
  2. Машинное обучение против нейронной сети
  3. Контролируемое обучение против глубокого обучения
  4. Логистическая регрессия в R