Формула дисперсии (Содержание)

  • формула
  • Примеры

Что такое формула дисперсии?

Термин «дисперсия» относится к степени дисперсии точек данных набора данных от его среднего значения, которое вычисляется как среднее квадрата отклонения каждой точки данных от среднего значения совокупности. Формула для дисперсии может быть получена путем суммирования квадрата отклонения каждой точки данных и последующего деления результата на общее количество точек данных в наборе данных. Математически это представляется как

σ 2 = ∑ (X i – μ) 2 / N

где,

  • X i = i- я точка данных в наборе данных
  • μ = средняя численность населения
  • N = количество точек данных в популяции

Примеры формулы отклонения (с шаблоном Excel)

Давайте рассмотрим пример, чтобы лучше понять расчет дисперсии.

Вы можете скачать этот шаблон Excel с формулой дисперсии здесь - шаблон Excel с формулой дисперсии

Формула дисперсии - пример № 1

Давайте возьмем пример классной комнаты с 5 студентами. У класса был медицинский осмотр, в котором они были взвешены, и были получены следующие данные. Рассчитать дисперсию набора данных на основе предоставленной информации.

Решение:

Средняя численность населения рассчитывается как:

  • Средняя численность населения = (30 кг + 33 кг + 39 кг + 29 кг + 34 кг) / 5
  • Средняя численность населения = 33 кг

Теперь нам нужно вычислить отклонение, т.е. разницу между точками данных и средним значением.

Аналогичным образом рассчитайте для всех значений набора данных.

Теперь давайте вычислим квадратичные отклонения каждой точки данных, как показано ниже,

Дисперсия рассчитывается по формуле, приведенной ниже

σ 2 = ∑ (X i - μ) 2 / N

  • σ 2 = (9 + 0 + 36 + 16 + 1) / 5
  • σ 2 = 12, 4

Следовательно, дисперсия набора данных составляет 12, 4 .

Формула дисперсии - пример № 2

Давайте возьмем пример начинающей компании, которая состоит из 8 человек. Возраст всех членов указан. Рассчитать дисперсию набора данных на основе предоставленной информации.

Решение:

Средняя численность населения рассчитывается как:

  • Средняя численность населения = (23 года + 32 года + 27 лет + 37 лет + 35 лет + 25 лет + 29 лет + 40 лет) / 8
  • Средняя численность населения = 31 год

Теперь нам нужно вычислить отклонение, т.е. разницу между точками данных и средним значением.

Аналогичным образом рассчитайте для всех значений набора данных.

Теперь давайте вычислим квадратичные отклонения каждой точки данных, как показано ниже,

Дисперсия рассчитывается по формуле, приведенной ниже

σ 2 = ∑ (X i - μ) 2 / N

  • σ 2 = (64 + 1 + 16 + 36 + 16 + 36 + 4 + 81) / 8
  • σ 2 = 31, 75

Следовательно, дисперсия набора данных составляет 31, 75 .

объяснение

Формула для дисперсии может быть получена с помощью следующих шагов:

Шаг 1: Во-первых, создайте совокупность, состоящую из большого количества точек данных. Эти точки данных будут обозначены X i .

Шаг 2: Затем вычислите количество точек данных в популяции, которые обозначены буквой N.

Шаг 3: Затем вычислите совокупное значение, сложив все точки данных, а затем разделив результат на общее количество точек данных (шаг 2) в совокупности. Значения популяции обозначаются через µ.

μ = X 1 + X 2 + X 3 + X 4 + X 5 / N

или

μ = ∑ X i / N

Шаг 4: Затем вычтите среднее значение совокупности из каждой точки данных совокупности, чтобы определить отклонение каждой из точек данных от среднего значения, т. Е. (X 1 - μ) является отклонением для первой точки данных, а ( X 2 - μ) для второй точки данных и т. Д.

Шаг 5: Затем определите квадрат всех соответствующих отклонений, рассчитанных на шаге 4, т.е. (X i - μ) 2 .

Шаг 6: Затем суммируйте все соответствующие квадратичные отклонения, рассчитанные на шаге 5, т.е. (X 1 - μ) 2 + (X 2 - μ) 2 + (X 3 - μ) 2 + …… + (X n - μ) 2 или ∑ (X i - μ) 2 .

Шаг 7: Наконец, формула для дисперсии может быть получена путем деления суммы квадратов отклонений, рассчитанных на шаге 6, на общее количество точек данных в совокупности (шаг 2), как показано ниже.

σ 2 = ∑ (X i - μ) 2 / N

Актуальность и использование формулы дисперсии

С точки зрения статистики, дисперсия является очень важной концепцией для понимания, поскольку она часто используется в распределении вероятностей для измерения изменчивости (волатильности) набора данных по отношению к его среднему значению. Волатильность служит мерой риска и, таким образом, отклонение помогает оценить риск портфеля инвестора. Нулевая дисперсия означает, что все переменные в наборе данных идентичны. С другой стороны, более высокая дисперсия может указывать на тот факт, что все переменные в наборе данных далеки от среднего значения, тогда как более низкая дисперсия означает с точностью до наоборот. Пожалуйста, имейте в виду, что дисперсия никогда не может быть отрицательным числом.

Рекомендуемые статьи

Это было руководство к формуле дисперсии. Здесь мы обсудим, как рассчитать дисперсию вместе с практическими примерами и загружаемым шаблоном Excel. Вы также можете посмотреть следующие статьи, чтобы узнать больше -

  1. Примеры формулы отклонения портфеля (шаблон Excel)
  2. Руководство по формуле дисперсии населения
  3. Что такое квартильная формула?
  4. Формула для расчета размера выборки