Формула выбросов (Содержание)

  • Формула выбросов
  • Примеры формулы выбросов (с шаблоном Excel)

Формула выбросов

В статистике выбросы - это две крайние отдаленные необычные точки в данных наборах данных. Чрезвычайно высокое значение и чрезвычайно низкие значения являются выбросными значениями набора данных. Это очень полезно при обнаружении любых ошибок или ошибок, которые произошли. Как следует из названия, выбросы - это значения, которые лежат снаружи от остальных значений в наборе данных. Например, рассмотрим студентов-инженеров и представим, что в их классе есть гномы. Таким образом, дварфы - это люди с очень низким ростом по сравнению с другими людьми с нормальным ростом. Так что это значение выброса в этом классе. Значения выбросов могут быть рассчитаны с использованием метода Тьюки.

Формула для Выбросов -

Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)

Примеры формулы выбросов (с шаблоном Excel)

Давайте рассмотрим пример, чтобы лучше понять расчет формулы Outliers.

Вы можете скачать этот шаблон выбросов здесь - шаблон выбросов

Формула выбросов - пример № 1

Рассмотрим следующий набор данных и рассчитать выбросы для набора данных.

Набор данных = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23

Восходящий порядок набора данных:

Медиана набора данных в восходящем порядке рассчитывается как:

В этом наборе данных общее количество данных равно 11. Таким образом, n = 11. Медиана = 11 + 1/2 = 12/2 = 6. Следовательно, значение, которое находится на 6- й позиции в этом наборе данных, является медианой.

Итак, медиана = 34.

Разделите набор данных на 2 половины, используя медиану.

Медиана данных нижней и верхней половины рассчитывается как:

  • В нижней половине 2, 5, 6, 7, 23, если мы найдем медиану, например, как мы нашли на шаге 2, медиана будет равна 6. Так что Q1 = 6.
  • В верхней половине 45, 56, 89, 98, 309, если мы найдем медиану, например, как мы нашли на шаге 2, медиана будет равна 89. Таким образом, Q3 = 89.

IQR рассчитывается по формуле, приведенной ниже

IQR = Q3 - Q1

  • IQR = 89 -6
  • IQR = 83

Нижний выброс рассчитывается по формуле, приведенной ниже

Нижний выброс = Q1 - (1, 5 * IQR)

  • Нижний выброс = 6 - (1, 5 * 83)
  • Нижний выброс = -118, 5

Высший выброс рассчитывается по формуле, приведенной ниже

Выше выброс = Q3 + (1, 5 * IQR)

  • Выше выброс = 89 + (1, 5 * 83)
  • Высший выброс = 213, 5

Теперь извлеките эти значения из набора данных -118, 5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213, 5, 309. Значения, которые падают ниже в нижней стороне и выше в верхней стороне являются выбросом значения. Для этого набора данных 309 является выбросом.

Формула выбросов - пример № 2

Рассмотрим следующий набор данных и рассчитать выбросы для набора данных.

Набор данных = 45, 21, 34, 90, 109.

Восходящий порядок набора данных:

Медиана набора данных в восходящем порядке рассчитывается как:

В этом наборе данных общее количество данных равно 5. Таким образом, n = 5. Медиана = 5 + 1/2 = 6/2 = 3. Следовательно, значение, которое находится на 3-й позиции в этом наборе данных, является медианой.

Итак, медиана = 45.

Разделите набор данных на 2 половины, используя медиану.

Медиана данных нижней и верхней половины рассчитывается как:

  • Q1 = 27, 5
  • Q3 = 89

IQR рассчитывается по формуле, приведенной ниже

IQR = Q3 - Q1

  • IQR = 99, 5 - 27, 5
  • IQR = 72

Нижний выброс рассчитывается по формуле, приведенной ниже

Нижний выброс = Q1 - (1, 5 * IQR)

  • Нижний выброс = 27, 5 - (1, 5 * 72)
  • Нижний выброс = -80, 5

Высший выброс рассчитывается по формуле, приведенной ниже

Выше выброс = Q3 + (1, 5 * IQR)

  • Выше выброс = 99, 5 + (1, 5 * 72)
  • Высший выброс = 207, 5

объяснение

Шаг 1: Расположите все значения в данном наборе данных в порядке возрастания.

Шаг 2: Найдите медианное значение для отсортированных данных. Медиана может быть найдена с помощью следующей формулы. Следующий расчет просто дает вам положение медианного значения, которое находится в наборе дат.

Медиана = (n + 1) / 2

Где n - общее количество данных, доступных в наборе данных.

Шаг 3: Найти нижнее значение Quartile Q1 из набора данных. Чтобы найти это, с помощью медианного значения разбейте набор данных на две половины. Из нижней половины набора значений найдите медиану для этого нижнего набора, который является значением Q1.

Шаг 4: Найти верхнее значение Quartile Q3 из набора данных. Это в точности как вышеописанный шаг. Вместо нижней половины мы должны следовать той же процедуре, что и верхняя половина набора значений.

Шаг 5: Найти значение IQR межквартильного диапазона. Чтобы найти значение Deduct Q1 из Q3.

IQR = Q3-Q1

Шаг 6: Найдите значение Внутреннего Экстрима. Конец, который выходит за пределы нижней стороны, который также можно назвать второстепенным выбросом. Умножьте значение IQR на 1, 5 и вычтите это значение из Q1, чтобы получить экстремум внутреннего нижнего уровня.

Нижний выброс = Q1 - (1, 5 * IQR)

Шаг 7: Найти значение экстремального экстремума. Конец, который выходит за пределы более высокой стороны, которую также можно назвать основным выбросом. Умножьте значение IQR на 1, 5 и суммируйте это значение с Q3, чтобы получить экстремум Outer Higher.

Выше выброс = Q3 + (1, 5 * IQR)

Шаг 8: Значения, которые выходят за пределы этих внутренних и внешних крайностей, являются значениями выбросов для данного набора данных.

Актуальность и использование формулы выбросов

Выбросы очень важны в любой проблеме анализа данных. Выброс показывает несогласованность в любом наборе данных, поскольку он определяется как необычные отдаленные значения в наборе данных от одного к другому. Это очень полезно при поиске любых недостатков, которые произошли в наборе данных. Потому что, когда вы помещаете ошибку в набор данных, это влияет на среднее значение и медиану, следовательно, может привести к большим отклонениям в результате, если в наборе данных есть выбросы. Следовательно, важно выяснить выбросы из набора данных, чтобы избежать серьезных проблем в статистическом анализе.

Рекомендуемые статьи

Это было руководство к формуле выбросов. Здесь мы обсуждаем, как рассчитать выбросы вместе с практическими примерами и загружаемым шаблоном Excel. Вы также можете посмотреть следующие статьи, чтобы узнать больше -

  1. Руководство по формуле среднего класса
  2. Примеры зарплатной формулы
  3. Калькулятор Формула ДПМО
  4. Как рассчитать распределение T?
  5. Формула квартального отклонения | Примеры