Введение в полиномиальную регрессию

Регрессия определяется как метод поиска взаимосвязи между независимой и зависимой переменными для прогнозирования результата. Первая модель полиномиальной регрессии была использована в 1815 году Жергонном. Он используется для поиска линии наилучшего соответствия, используя линию регрессии для прогнозирования результатов. Существует много типов методов регрессии, полиномиальная регрессия является одним из них. Прежде чем понимать это, желательно иметь правильные знания о линейной регрессии, поэтому будет легко отметить различия между ними.

Почему полиномиальная регрессия?

  • Это один из методов регрессии, который используется профессионалами для прогнозирования результата. Он определяется как отношение между независимой и зависимой переменными, когда зависимая переменная связана с независимой переменной, имеющей n-ую степень. Он не требует, чтобы отношения между зависимыми и независимыми переменными были линейными, поэтому, если линия является кривой, она может иметь любой полиномиальный член.
  • Основное различие между линейной и полиномиальной регрессией состоит в том, что линейная регрессия требует, чтобы зависимые и независимые переменные были линейно связаны, в то время как это может лучше соответствовать линии, если мы включим любую более высокую степень в член независимой переменной в уравнении. Уравнение полиномиальной регрессии, имеющей n-ю степень, можно записать в виде:

Y = b0 + a1x + a2x 2 + a3x 3 +…. апх п

  • Если мы добавим более высокие градусы, такие как квадратичные, то это превратит линию в кривую, которая лучше соответствует данным. Обычно он используется, когда точки в наборе данных разбросаны, а линейная модель не способна четко описать результат. Мы всегда должны следить за переоснащением и подгонкой, рассматривая эти степени в уравнении.
  • Лучше учитывать степень, которая проходит через все точки данных, но иногда взятие более высокой степени, такой как 10 или 20, может проходить через все точки данных и уменьшать ошибку, но также улавливает шум данных, который выходит за рамки модели и этого можно избежать, добавив больше образцов к набору обучающих данных. Поэтому всегда желательно выбирать оптимальную степень, соответствующую модели.

Есть два метода, которые используются при определении степени уравнения:

  • Прямой отбор. Это метод увеличения степени, пока он не станет достаточно значимым для определения модели.
  • Обратный отбор: это метод уменьшения степени, пока он не станет достаточно значимым для определения модели.

Процедура применения полиномиальной регрессии

Пожалуйста, найдите ниже шаги или процедуру для применения полиномиальной регрессии к любому набору данных:

Шаг 1: Импортируйте соответствующий набор данных на любую платформу (R или Python) и установите необходимые пакеты, необходимые для применения модели.

Шаг 2: Разделите набор данных на обучающие и тестовые наборы, чтобы мы могли применить алгоритм к набору обучающих данных и протестировать его, используя набор тестовых данных.

Шаг 3: Примените методы анализа поисковых данных для изучения фона данных, таких как среднее значение, медиана, мода, первый квартиль, второй квартиль и т. Д.

Шаг 4: Примените алгоритм линейной регрессии к набору данных и изучите модель.

Шаг 5: Примените алгоритм полиномиальной регрессии к набору данных и изучите модель, чтобы сравнить результаты RMSE или R квадрат между линейной регрессией и полиномиальной регрессией.

Шаг 6: Визуализируйте и прогнозируйте результаты линейной и полиномиальной регрессии и определите, какая модель прогнозирует набор данных с лучшими результатами.

Использование полиномиальной регрессии

  • Он используется во многих экспериментальных процедурах для получения результата с использованием этого уравнения.
  • Это обеспечивает хорошо определенную связь между независимыми и зависимыми переменными.
  • Используется для изучения изотопов отложений.
  • Он используется для изучения распространения различных заболеваний в любой популяции.
  • Он используется для изучения генерации любого синтеза.

Особенности полиномиальной регрессии

  • Это тип метода нелинейной регрессии, который сообщает нам взаимосвязь между независимой и зависимой переменными, когда зависимая переменная связана с независимой переменной n-й степени.
  • Линия наилучшего соответствия определяется степенью уравнения полиномиальной регрессии.
  • Модель, полученная из полиномиальной регрессии, зависит от выбросов, поэтому всегда лучше обрабатывать выбросы перед применением алгоритма к набору данных.
  • Функция Polynomialfeature () превращается в особенность матрицы в зависимости от степени уравнения.
  • Природа кривой может быть изучена или визуализирована с помощью простого точечного графика, который даст вам лучшее представление о соотношении линейности между переменными и примет соответствующее решение.

Вывод

Полиномиальная регрессия используется во многих организациях, когда они идентифицируют нелинейную связь между независимыми и зависимыми переменными. Это один из сложных методов регрессии по сравнению с другими методами регрессии, поэтому глубокое знание подхода и алгоритма поможет вам достичь лучших результатов.

Рекомендуемые статьи

Это руководство к полиномиальной регрессии. Здесь мы обсуждаем особенности и использование полиномиальной регрессии. Вы также можете просмотреть наши другие предлагаемые статьи, чтобы узнать больше -

  1. Алгоритм SVM
  2. Методы ядра
  3. Функция ЛИНЕЙН Excel
  4. Алгоритмы машинного обучения
  5. Линейная регрессия против логистической регрессии | Основные отличия