Формула выбросов (Содержание)
- Формула выбросов
- Примеры формулы выбросов (с шаблоном Excel)
Формула выбросов
В статистике выбросы - это две крайние отдаленные необычные точки в данных наборах данных. Чрезвычайно высокое значение и чрезвычайно низкие значения являются выбросными значениями набора данных. Это очень полезно при обнаружении любых ошибок или ошибок, которые произошли. Как следует из названия, выбросы - это значения, которые лежат снаружи от остальных значений в наборе данных. Например, рассмотрим студентов-инженеров и представим, что в их классе есть гномы. Таким образом, дварфы - это люди с очень низким ростом по сравнению с другими людьми с нормальным ростом. Так что это значение выброса в этом классе. Значения выбросов могут быть рассчитаны с использованием метода Тьюки.
Формула для Выбросов -
Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)
Примеры формулы выбросов (с шаблоном Excel)
Давайте рассмотрим пример, чтобы лучше понять расчет формулы Outliers.
Вы можете скачать этот шаблон выбросов здесь - шаблон выбросовФормула выбросов - пример № 1
Рассмотрим следующий набор данных и рассчитать выбросы для набора данных.
Набор данных = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23
Восходящий порядок набора данных:
Медиана набора данных в восходящем порядке рассчитывается как:
В этом наборе данных общее количество данных равно 11. Таким образом, n = 11. Медиана = 11 + 1/2 = 12/2 = 6. Следовательно, значение, которое находится на 6- й позиции в этом наборе данных, является медианой.
Итак, медиана = 34.
Разделите набор данных на 2 половины, используя медиану.
Медиана данных нижней и верхней половины рассчитывается как:
- В нижней половине 2, 5, 6, 7, 23, если мы найдем медиану, например, как мы нашли на шаге 2, медиана будет равна 6. Так что Q1 = 6.
- В верхней половине 45, 56, 89, 98, 309, если мы найдем медиану, например, как мы нашли на шаге 2, медиана будет равна 89. Таким образом, Q3 = 89.
IQR рассчитывается по формуле, приведенной ниже
IQR = Q3 - Q1
- IQR = 89 -6
- IQR = 83
Нижний выброс рассчитывается по формуле, приведенной ниже
Нижний выброс = Q1 - (1, 5 * IQR)
- Нижний выброс = 6 - (1, 5 * 83)
- Нижний выброс = -118, 5
Высший выброс рассчитывается по формуле, приведенной ниже
Выше выброс = Q3 + (1, 5 * IQR)
- Выше выброс = 89 + (1, 5 * 83)
- Высший выброс = 213, 5
Теперь извлеките эти значения из набора данных -118, 5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213, 5, 309. Значения, которые падают ниже в нижней стороне и выше в верхней стороне являются выбросом значения. Для этого набора данных 309 является выбросом.
Формула выбросов - пример № 2
Рассмотрим следующий набор данных и рассчитать выбросы для набора данных.
Набор данных = 45, 21, 34, 90, 109.
Восходящий порядок набора данных:
Медиана набора данных в восходящем порядке рассчитывается как:
В этом наборе данных общее количество данных равно 5. Таким образом, n = 5. Медиана = 5 + 1/2 = 6/2 = 3. Следовательно, значение, которое находится на 3-й позиции в этом наборе данных, является медианой.
Итак, медиана = 45.
Разделите набор данных на 2 половины, используя медиану.
Медиана данных нижней и верхней половины рассчитывается как:
- Q1 = 27, 5
- Q3 = 89
IQR рассчитывается по формуле, приведенной ниже
IQR = Q3 - Q1
- IQR = 99, 5 - 27, 5
- IQR = 72
Нижний выброс рассчитывается по формуле, приведенной ниже
Нижний выброс = Q1 - (1, 5 * IQR)
- Нижний выброс = 27, 5 - (1, 5 * 72)
- Нижний выброс = -80, 5
Высший выброс рассчитывается по формуле, приведенной ниже
Выше выброс = Q3 + (1, 5 * IQR)
- Выше выброс = 99, 5 + (1, 5 * 72)
- Высший выброс = 207, 5
объяснение
Шаг 1: Расположите все значения в данном наборе данных в порядке возрастания.
Шаг 2: Найдите медианное значение для отсортированных данных. Медиана может быть найдена с помощью следующей формулы. Следующий расчет просто дает вам положение медианного значения, которое находится в наборе дат.
Медиана = (n + 1) / 2
Где n - общее количество данных, доступных в наборе данных.
Шаг 3: Найти нижнее значение Quartile Q1 из набора данных. Чтобы найти это, с помощью медианного значения разбейте набор данных на две половины. Из нижней половины набора значений найдите медиану для этого нижнего набора, который является значением Q1.
Шаг 4: Найти верхнее значение Quartile Q3 из набора данных. Это в точности как вышеописанный шаг. Вместо нижней половины мы должны следовать той же процедуре, что и верхняя половина набора значений.
Шаг 5: Найти значение IQR межквартильного диапазона. Чтобы найти значение Deduct Q1 из Q3.
IQR = Q3-Q1
Шаг 6: Найдите значение Внутреннего Экстрима. Конец, который выходит за пределы нижней стороны, который также можно назвать второстепенным выбросом. Умножьте значение IQR на 1, 5 и вычтите это значение из Q1, чтобы получить экстремум внутреннего нижнего уровня.
Нижний выброс = Q1 - (1, 5 * IQR)
Шаг 7: Найти значение экстремального экстремума. Конец, который выходит за пределы более высокой стороны, которую также можно назвать основным выбросом. Умножьте значение IQR на 1, 5 и суммируйте это значение с Q3, чтобы получить экстремум Outer Higher.
Выше выброс = Q3 + (1, 5 * IQR)
Шаг 8: Значения, которые выходят за пределы этих внутренних и внешних крайностей, являются значениями выбросов для данного набора данных.
Актуальность и использование формулы выбросов
Выбросы очень важны в любой проблеме анализа данных. Выброс показывает несогласованность в любом наборе данных, поскольку он определяется как необычные отдаленные значения в наборе данных от одного к другому. Это очень полезно при поиске любых недостатков, которые произошли в наборе данных. Потому что, когда вы помещаете ошибку в набор данных, это влияет на среднее значение и медиану, следовательно, может привести к большим отклонениям в результате, если в наборе данных есть выбросы. Следовательно, важно выяснить выбросы из набора данных, чтобы избежать серьезных проблем в статистическом анализе.
Рекомендуемые статьи
Это было руководство к формуле выбросов. Здесь мы обсуждаем, как рассчитать выбросы вместе с практическими примерами и загружаемым шаблоном Excel. Вы также можете посмотреть следующие статьи, чтобы узнать больше -
- Руководство по формуле среднего класса
- Примеры зарплатной формулы
- Калькулятор Формула ДПМО
- Как рассчитать распределение T?
- Формула квартального отклонения | Примеры