ANOVA (анализ отклонений)

ANOVA расшифровывается как дисперсионный анализ. ANOVA была основана Рональдом Фишером в 1918 году. Название Analysis Of Variance было получено на основе подхода, в котором метод использует дисперсию, чтобы определить, являются ли они различными или равными.

Это статистический метод, используемый для проверки различий между двумя или более средними. Он используется для проверки общих различий, а не конкретных различий между средствами. Он оценивает значимость одного или нескольких факторов путем сравнения средних значений переменной отклика на разных уровнях факторов.

Нулевая гипотеза утверждает, что все популяции равны. Альтернативная гипотеза доказывает, что по крайней мере одно среднее значение

Это дает возможность проверить различные нулевые гипотезы одновременно.

Общее назначение ANOVA

Причина выполнения ANOVA заключается в том, чтобы увидеть, существует ли какая-либо разница между группами по некоторой переменной. Сегодня исследователи используют ANOVA во многих отношениях. Использование ANOVA полностью зависит от дизайна исследования.

Вы можете использовать t-критерий для сравнения средних значений двух образцов, но если нужно сравнить более двух образцов, ANOVA является лучшим методом для использования.

Предположения ANOVA

Есть четыре основных предположения

  • Ожидаемые значения ошибок равны нулю
  • Дисперсии всех ошибок равны друг другу
  • Ошибки независимы
  • Они нормально распределены

ANOVA Типы

  1. Один путь между группами

One Way ANOVA используется, чтобы проверить, есть ли существенная разница между средствами трех или более не связанных между собой групп. Это главным образом проверяет нулевую гипотезу.

H₀: µ₁ = µ₂ = µ₃ =… .. = µₓ

Где µ означает среднее значение для группы, а x означает количество групп. One Way ANOVA дает значительный результат. Одним из способов ANOVA является сводная статистика теста, которая не позволит вам узнать, какие конкретные группы отличались друг от друга. Для того чтобы узнать конкретную группу или группы, которые отличались от других, вам необходимо выполнить специальный тест.

Пример One Way ANOVA

20 человек отобраны для проверки эффекта пяти различных упражнений. 20 человек разделены на 4 группы по 5 человек в каждой. Их вес записывается через несколько дней. Влияние упражнений на 5 группу мужчин сравнивается. Здесь вес является единственным фактором.

Предположения

Зависимая переменная обычно распределяется в каждой группе

Существует однородность дисперсий

Независимость наблюдений

  1. One Way ANOVA повторные измерения

Повторные измерения ANOVA более или менее равны One Way ANOVA, но используются для сложных группировок. Повторные измерения исследуют 1. изменения средних баллов за три или более временных моментов.

2. различия в средних баллах при разных условиях.

Пример повторных измерений

Вы можете исследовать влияние 6-месячной программы упражнений на снижение веса у некоторых людей. Вы рассчитываете вес в три разных момента времени в течение тренировочного периода, чтобы разработать временной курс для любого эффекта от упражнений.

Вы можете побаловать себя одним и тем же человеком, чтобы есть разные виды продуктов, снижающих вес, и оценить их по вкусу.

В этом примере один и тот же набор людей измеряется более одного раза по одной и той же зависимой переменной.

  1. Два пути между группами

Двухстороннее ANOVA сравнивает среднюю разницу между группами, которые были разделены на два фактора. Основная цель двухстороннего ANOVA - выяснить, существует ли какое-либо взаимодействие между двумя независимыми переменными на зависимых переменных. Он также позволяет узнать, одинаково ли влияние одной из ваших независимых переменных на зависимую переменную для всех значений другой независимой переменной.

пример

Исследование влияния удобрений на урожайность риса. Вы вносите пять удобрений разного качества на пять участков земли, на каждом из которых выращивается рис. Урожай с каждого участка регистрируется и наблюдается разница между каждым участком. Здесь влияние плодородия участков также может быть изучено. Таким образом, есть два фактора, удобрения и плодородия.

Предположения

Прежде чем начать с двухстороннего ANOVA, ваши данные должны пройти шесть предположений, чтобы убедиться, что ваших данных достаточно для выполнения двухстороннего ANOVA. Шесть предположений перечислены ниже

  • Ваша зависимая переменная должна измеряться на непрерывном уровне
  • Ваши две независимые переменные должны содержать две или более категориальных независимых группы для каждой
  • Вы должны иметь независимость от наблюдений
  • Избегайте любых выбросов
  • Ваша зависимая переменная должна быть нормально распределена для каждой комбинации групп двух независимых переменных
  • Однородность дисперсий
  1. Двухсторонние повторные измерения

Двухстороннее повторение измеряет средние различия между группами, которые были разделены на две в пределах независимых переменных. Двухстороннее повторное измерение часто используется в исследованиях, где зависимая переменная измеряется более двух раз при двух или более условиях.

пример

Исследователь здоровья хочет найти лучший способ уменьшить хроническую боль в суставах, от которой страдают люди. Исследователь выбирает два различных типа лечения, чтобы уменьшить уровень боли. Два типа лечения известны как «условия». Лечение А - это программа массажа, а Лечение В - это программа иглоукалывания. Оба лечения даны всем пациентам в течение 8 недель.

Пациенты проходят тестирование в три момента времени - в начале программы, в середине программы и в конце программы.

Исследователь отбирает 30 пациентов для участия в исследовании. Но когда первые 15 пациентов проходят лечение A, остальные 15 пациентов проходят лечение B и наоборот.

В конце 8 недель исследователь использует двухсторонние повторные измерения ANOVA, чтобы выяснить, есть ли какие-либо изменения в боли в результате взаимодействия между типом лечения и в какой момент времени.

Предположения

Ваши данные должны соответствовать пяти допущениям, которые необходимы для двухстороннего повторного измерения ANOVA для получения точного результата.

  • Ваша зависимая переменная должна измеряться на непрерывном уровне
  • Ваши два предметных фактора должны состоять как минимум из двух категориальных связанных групп
  • Там не должно быть никаких выбросов
  • Зависимая переменная должна быть нормально распределена между каждой комбинацией связанных групп
  • Дисперсии различий между всеми комбинациями связанных групп должны быть равны

Параметрический и непараметрический тест ANOVA

Если информация о населении полностью известна посредством ее параметров, то выполняемый статистический тест называется параметрическим тестом.

Если информация о совокупности или параметрах неизвестна, но все же требуется проверить гипотезу, то она называется непараметрической проверкой.

Когда у вас есть категориальные данные, вы не можете использовать метод ANOVA, вам нужно использовать критерий хи-квадрат, который имеет дело с взаимодействием ANOVA.

Процедура проверки гипотезы - One way ANOVA

  1. Проверьте все необходимые предположения и напишите нулевую и альтернативную гипотезу

Для выполнения одностороннего ANOVA должны быть определенные предположения. Предположения следующие

  • Каждая выборка является независимой случайной выборкой
  • Распределение переменной ответа следует нормальному распределению
  • Дисперсии населения одинаковы по ответам для групповых уровней. Это можно выяснить путем деления наибольшего стандартного отклонения выборки на наименьший стандарт выборки, и оно не превышает двух, тогда предположим, что дисперсии совокупности равны.
  1. Рассчитать соответствующую статистику теста

Один из способов ANOVA использует F-тестовую статистику. Ручные вычисления требуют много шагов для вычисления коэффициента F, но статистическое программное обеспечение, такое как SPSS, рассчитает коэффициент F для вас и создаст исходную таблицу ANOVA.

Таблица ANOVA предоставит вам информацию об изменчивости между группами и внутри групп. Таблица даст вам все формулы. Ниже приведен пример односторонней таблицы ANOVA

ИсточникSSDFМИЗF
ЛечениеSSTк-1ССТ / (к-1)MST / MSE
ошибкаSSENkSSE / (Nk)
Всего (исправлено)SSN-1

SST означает сумму квадратов обработок, SSE означает сумму квадратов ошибок

DFT, который равен k-1, означает степень свободы для лечения, DFE, который равен Nk, означает степень свободы для ошибок.

  1. Определите значение ap, связанное со статистикой теста
  2. Определить между нулевой и альтернативной гипотезой

Если нулевая гипотеза неверна, тогда MST должен быть больше, чем MSE

  1. Дать заключение

Основываясь на вашем результате, напишите заключение в соответствии с вашим вопросом исследования анова.

Несколько сравнительных тестов

Если вы обнаружите, что существует значительное различие между группами, которое не связано с ошибкой выборки, тогда необходимо выполнить несколько t-тестов, чтобы проверить средние значения между группами. Есть несколько тестов, проведенных для контроля частоты ошибок первого типа.

  • Тест Шеффе
  • Модифицированный тест Бонферрони
  • Тест Даннетт
  • Тест Тьюки

вычисления

Расчеты ANOVA можно выполнить тремя способами - ручные расчеты, лист Excel и программное обеспечение SPSS. Давайте узнаем обо всех расчетах подробно ниже

  1. ANOVA ручные расчеты

  • Шаг 1

Compute CM

CM = (Всего всех наблюдений) 2 / N Всего

  • Шаг 2

Вычислить общий SS

Total SS = Сумма квадратов всех наблюдений - CM

  • Шаг 3

Вычислить SST (сумма квадратов для лечения)

SST = ∑ 3 i = 1 T2i / n i - CM

  • Шаг 4

Вычислить SSE (сумма квадратов для ошибок)

SSE = SS (Всего) - SST

  • Шаг 5

Вычислить MST, MSE и их соотношение F

MST = SST / k-1

MSE = SSE / Nk

F = MST / MSE

  1. ANOVA с использованием Excel

Чтобы выполнить один фактор ANOVA в Excel, выполните следующие простые шаги

  • Перейти на вкладку данных
  • Нажмите Анализ данных
  • Выберите Anova: однофакторный и нажмите кнопку ОК (есть и другие варианты, например Anova: двухфакторный с репликацией и Anova: двухфакторный без репликации)
  • Щелкните поле «Диапазон ввода» и выберите диапазон
  • Щелкните поле «Выходной диапазон», выберите выходной диапазон и нажмите «ОК».
  • Вы получите результат, отображаемый в листе Excel
  • Если F больше, чем F крит, то нулевая гипотеза отклоняется
  1. ANOVA с использованием SPSS

Сначала загрузите программное обеспечение SPSS для выполнения ANOVA. Здесь мы можем увидеть, как выполнить односторонний ANOVA с использованием SPSS

SPSS всегда предполагает, что независимая переменная представлена ​​численно. В примере набора данных MAJOR является строкой. Поэтому сначала преобразуйте строковую переменную в числовую переменную. Как только ваше обращение закончится, вы готовы сделать ANOVA

  • Откройте программное обеспечение SPSS
  • Нажмите Анализ à Сравнить Средство à One Way ANOVA
  • Одностороннее диалоговое окно ANOVA появляется на экране
  • В левой части диалогового окна вы увидите список всех зависимых переменных, которые были измерены вами. Переместите его в список зависимых с правой стороны, используя верхнюю кнопку со стрелкой
  • Таким же образом переместите независимую переменную из списка слева в поле Фактор справа.
  • Нажмите кнопку Post Hoc, чтобы выбрать тип многократного сравнения, которое вы хотите сделать.
  • Выберите любой Post hoc тест, который подходит для вашего исследования, установив флажок рядом с тестом.
  • Нажмите Продолжить, и вы попадете в диалоговое окно One way ANOVA.
  • Выберите любую статистику и нажмите на флажки слева от опции, чтобы выбрать ее
  • Нажмите на график «Средство», чтобы получить новый график средних значений условий.
  • Нажмите Продолжить и нажмите ОК

Появится окно вывода SPSS с шестью основными разделами

  • Описательный раздел
  • Тест на однородность отклонений
  • ANOVA
  • Несколько Сравнений
  • Средний балл
  • график

Что нужно учитывать при запуске ANOVA

Уровень данных и предположения играют решающую роль в ANOVA.

Исследователь должен выяснить, являются ли данные скрещенными или вложенными. Если данные пересекаются, все группы получают все аспекты.

Если данные являются вложенными, то каждая группа получит свой метод ANOVA.

Более важно рассчитать величину эффекта анова. Размер эффекта может сказать вам степень, в которой нулевая гипотеза неверна. Средний размер эффекта всегда предпочтительнее

Надеюсь, что эта статья дала вам краткий обзор ANOVA и интерпретацию результатов с его помощью.

Связанные курсы: -

  1. ANOVA Использование Minitab
  2. R Студия Anova Техника Курс