Разница между линейной регрессией и логистической регрессией
В следующей статье Линейная регрессия против Логистической регрессии представлены наиболее важные различия между ними, но прежде чем мы увидим, что означает Регрессия?
регрессия
Регрессия - это, в основном, статистическая мера для определения силы взаимосвязи между одной зависимой переменной, то есть выходом Y, и рядом других независимых переменных, то есть X 1, X 2 и так далее. Регрессионный анализ в основном используется для прогнозирования и прогнозирования.
Что такое линейная регрессия?
Линейная регрессия - это алгоритм, основанный на контролируемой области обучения машинного обучения. Он наследует линейные отношения между своими входными переменными и единственной выходной переменной, где выходная переменная имеет непрерывный характер. Он используется для прогнозирования значения выходных данных, скажем, Y на входах, скажем, X. Когда рассматривается только один вход, это называется простой линейной регрессией.
Его можно разделить на две основные категории:
1. Простая регрессия
Принцип действия: Основная цель - найти уравнение прямой линии, которое наилучшим образом соответствует выбранным данным. Это уравнение алгебраически описывает отношения между двумя переменными. Наиболее подходящая прямая линия называется линией регрессии.
Y = β 0 + β 1 X
Где,
β представляет особенности
β 0 представляет точку пересечения
β 1 представляет коэффициент особенности X
2. Многовариантная регрессия
Он используется для прогнозирования корреляции между несколькими независимыми переменными и одной зависимой переменной. Регрессия с более чем двумя независимыми переменными основана на подборе формы к совокупности данных на многомерном графике. Форма регрессии должна быть такой, чтобы минимизировать расстояние формы от каждой точки данных.
Линейная модель отношений может быть представлена математически, как показано ниже:
Y = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 + ……. + β n X n
Где,
β представляет особенности
β 0 представляет точку пересечения
β 1 представляет собой коэффициент признака X 1
β n представляет собой коэффициент признака X n
Преимущества и недостатки линейной регрессии
Ниже приведены преимущества и недостатки:
преимущества
- Благодаря своей простоте широко используется моделирование для предсказаний и выводов.
- Основное внимание уделяется анализу данных и предварительной обработке данных. Таким образом, он имеет дело с различными данными, не заботясь о деталях модели.
Недостатки
- Он работает эффективно, когда данные нормально распределены. Таким образом, для эффективного моделирования следует избегать коллинеарности.
Что такое логистическая регрессия?
Это форма регрессии, которая позволяет прогнозировать дискретные переменные с помощью смеси непрерывных и дискретных предикторов. Это приводит к уникальной трансформации зависимых переменных, которая влияет не только на процесс оценки, но и на коэффициенты независимых переменных. Он затрагивает тот же вопрос, что и множественная регрессия, но без предположений о распределении предикторов. В логистической регрессии исходная переменная является двоичной. Целью анализа является оценка влияния нескольких объясняющих переменных, которые могут быть числовыми, категориальными или обоими.
Типы логистической регрессии
Ниже приведены 2 типа логистической регрессии:
1. Бинарная логистическая регрессия
Он используется, когда зависимая переменная является дихотомической, то есть как дерево с двумя ветвями. Используется, когда зависимая переменная является непараметрической.
Используется когда
- Если нет линейности
- Есть только два уровня зависимой переменной.
- Если многомерная нормальность сомнительна.
2. Полиномиальная логистическая регрессия
Анализ полиномиальной логистической регрессии требует, чтобы независимые переменные были метрическими или дихотомическими. Он не делает никаких предположений о линейности, нормальности и однородности дисперсии для независимых переменных.
Используется, когда зависимая переменная имеет более двух категорий. Он используется для анализа отношений между неметрической зависимой переменной и метрической или дихотомической независимой переменной, а затем сравнивает несколько групп посредством комбинации бинарных логистических регрессий. В конце концов, он предоставляет набор коэффициентов для каждого из двух сравнений. Коэффициенты для контрольной группы принимаются за все нули. Наконец, прогнозирование основано на наибольшей вероятности.
Преимущество логистической регрессии: это очень эффективный и широко используемый метод, поскольку он не требует большого количества вычислительных ресурсов и не требует какой-либо настройки.
Недостаток логистической регрессии: ее нельзя использовать для решения нелинейных задач.
Сравнение лицом к лицу между линейной регрессией и логистической регрессией (инфографика)
Ниже приведены 6 основных различий между линейной регрессией и логистической регрессией.
Ключевая разница между линейной регрессией и логистической регрессией
Давайте обсудим некоторые из основных ключевых различий между линейной регрессией и логистической регрессией
Линейная регрессия
- Это линейный подход
- Он использует прямую линию
- Он не может принимать категориальные переменные
- Он должен игнорировать наблюдения с отсутствующими значениями числовой независимой переменной
- Выход Y задается как
- Увеличение на 1 единицу x увеличивает Y на α
Приложения
- Прогнозирование цены товара
- Прогнозирование очков в матче
Логистическая регрессия
- Это статистический подход
- Он использует сигмовидную функцию
- Может принимать категориальные переменные
- Он может принимать решения, даже если присутствуют наблюдения с отсутствующими значениями
- Выход Y задан как, где z задан как
- Увеличение единицы на 1 единицу увеличивает Y на логарифмические шансы α
- Если P - вероятность события, то (1-P) - вероятность того, что оно не произошло. Шансы на успех = P / 1-P
Приложения
- Предсказание, будет ли сегодня дождь или нет.
- Предсказание, является ли электронная почта спамом или нет.
Линейная регрессия и сравнительная таблица логистической регрессии
Давайте обсудим лучшее сравнение между линейной регрессией и логистической регрессией
Линейная регрессия |
Логистическая регрессия |
Используется для решения проблем регрессии | Используется для решения задач классификации |
Он моделирует отношения между зависимой переменной и одной или несколькими независимыми переменными | Он прогнозирует вероятность результата, который может иметь только два значения на выходе: 0 или 1. |
Прогнозируемый результат является непрерывной переменной | Прогнозируемый результат является дискретной переменной |
Прогнозируемый выход Y может превышать 0 и 1 диапазон | Прогнозируемый выход Y лежит в пределах 0 и 1 диапазона |
![]() | ![]() |
Прогнозируемый выход Y может превышать 0 и 1 диапазон | Прогнозируемый выход |
Вывод
Если объекты не способствуют прогнозированию или если они очень сильно связаны друг с другом, это добавляет шум в модель. Итак, функции, которые не вносят достаточный вклад в модель, должны быть удалены. Если независимые переменные сильно коррелированы, это может вызвать проблему мультиколлинеарности, которая может быть решена путем запуска отдельных моделей с каждой независимой переменной.
Рекомендуемые статьи
Это было руководство по линейной регрессии против логистической регрессии. Здесь мы обсуждаем ключевые различия линейной регрессии и логистической регрессии с помощью инфографики и таблицы сравнения. Вы также можете взглянуть на следующие статьи, чтобы узнать больше:
- Наука о данных против визуализации данных
- Машинное обучение против нейронной сети
- Контролируемое обучение против глубокого обучения
- Логистическая регрессия в R