Обзор двухстороннего ANOVA в R
Двухсторонний ANOVA (анализ отклонений) помогает нам понять связь между одной непрерывной зависимой переменной и двумя категориальными независимыми переменными. В этой теме мы узнаем о двухстороннем ANOVA в R.
Ниже приведены гипотезы интереса под двухсторонним ANOVA
- H₀: Назовите это главным эффектом, который является первым фактором, который зависит от непрерывной переменной
- H₀: Основной эффект также касается влияния второй переменной на зависимую непрерывную переменную.
- H₀: взаимодействие - это совокупное влияние как первой, так и второй факторной переменной на зависимую переменную
Ниже приведены нормы, которым должен удовлетворять двусторонний ANOVA.
- Наблюдения должны быть независимыми
- Наблюдения должны быть нормально распределены.
- Должна быть одинаковая дисперсия в наблюдениях
- Нет выбросов в дизайне
- Ошибки должны быть независимыми.
Заметка
Нам нужно преобразовать наши данные, если нарушается нормальность и равная дисперсия.
Пример двухстороннего ANOVA в R
Давайте выполним односторонний тест ANOVA для набора данных уровней рака, который содержит 48 строк и 3 переменные данных:
Время, затраченное на выживание: время выживания животного
Различные уровни рака 1 - 3
Лечение: лечение от 1-3
Перед тестированием нам понадобятся следующие данные.
- Импорт данных
- Удалить ненужную переменную
- Преобразуйте переменные (уровни Рака) в упорядоченный уровень.
Ниже приведен набор данных.
Наблюдения: 48
Переменные: 3
время для выживания 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0…
уровни рака 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 1, 2, 2, 2…
Обработка A, A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …
Цели
- H₀: без изменений среднего времени выживания между группами
- H₀: время выживания отличается по крайней мере для одной группы.
меры
- Проверьте уровень рака. Мы можем видеть три символьных значения, потому что мы преобразовываем их в факторы с глаголом мутации.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Вычислить среднее и стандартное отклонение
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
Выход:
Тибл: 3 х 4
Уровни ракового заболевания count_cancerlevels mean_time sd_time
1 1 16 0, 617500 0, 20942779
2 2 16 0, 544375 0, 28936641
3 3 16 0, 276250 0, 06227627
- На третьем шаге вы можете графически проверить, есть ли разница между распределениями. Обратите внимание, что вы включаете точечную точку.
- Запустите тест с командой AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
Синтаксис:
y ~ X1 + X2 +… + Xn (X1 + X2 +… относится к независимым переменным)
у ~. Используйте все оставшиеся переменные в качестве независимых переменных
Обязательно сохраните модель и распечатайте резюме.
Код
- aov (время ~ уровни рака, данные = df): запустить тест ANOVA по следующей формуле
- summary (anova_one_way): распечатать резюме теста
Df Sum Sq Среднее Sq F значение Pr (> F)
Уровни рака 2 1, 033 0, 5165 11, 79 7, 66e-05 ***
Остатки 45 1, 972 0, 0438
-
Signif. коды: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0, 1 '' 1
Значение р ниже порога 0, 05. Статистическая разница обозначена '*' в приведенном выше случае.
Односторонний тест на двухстороннюю анову в R
Давайте посмотрим, как односторонний тест может быть расширен до двухстороннего ANOVA. Тест похож на односторонний ANOVA, но формула отличается и добавляет в формулу еще одну переменную группы.
у = х1 + х2
- H0 : Средние значения равны для обеих переменных (факторных переменных)
- H3 : средства различны для обеих переменных
Вы добавляете переменные в нашу модель. Эта переменная указывает на лечение, данное пациенту. Вам интересно узнать, существует ли статистическая зависимость между уровнями рака и лечением, предоставляемым пациенту.
Мы корректируем наш код, добавляя удовольствие с другой независимой переменной.
Df Sum Sq Среднее Sq F значение Pr (> F)
Уровни рака 2 1, 0330 0, 5165 20, 64 5, 7e-07 ***
Лечить 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***
Остатки 42 1, 0509 0, 0250
Как уровень рака, так и лечение статистически отличаются от 0. Таким образом, мы можем отвергнуть гипотезу NULL. Также подтвердите, что изменение лечения или типа рака влияет на время выживания.
Тестовое задание
Односторонний ANOVA: H3 - среднее значение отличается по крайней мере для одной группы
Двухсторонний ANOVA: H3 - среднее значение для обеих групп разное.
Разница между односторонним и двухсторонним ANOVA
Различия между односторонним ANOVA и двухсторонним ANOVA
Односторонний ANOVA | Двухсторонний ANOVA |
Предназначен для проверки равенства между 3 или более средствами | Предназначен для оценки взаимосвязи двух независимых переменных с зависимой переменной. |
Включает одну независимую переменную | Включает две независимые переменные |
Анализируется в 3 или более категориальных группах. | Сравнивает несколько групп двух факторов |
Должен удовлетворять двум принципам - тиражирование и рандомизация | Должен удовлетворять трем принципам: репликация, рандомизация и локальное управление. |
Преимущества двухстороннего ANOVA
- В приведенном выше примере возраст и пол в нашем примере - помогают уменьшить количество ошибок, делая дизайн более эффективным.
- Двухсторонняя ANOVA позволяет нам проверять влияние двух факторов одновременно.
Приложения ANOVA
- Сравнивая пробег разных транспортных средств, видов топлива и дорожных.
- Ознакомление с влиянием температуры, давления или химической концентрации на некоторые химические реакции (энергетические реакторы, химические заводы и т. Д.)
- Влияние различных катализаторов на скорости химических реакций
- Понимание влияния рекламы и разного количества отзывов клиентов.
- Влияние производительности, качества и скорости производства в биологии (процесс основан на количестве клеток, на которые они делятся)
Рекомендуемые статьи
Это руководство к двухстороннему ANOVA в R. Здесь мы обсудим примеры, цели, шаги и разницу между односторонним и двухсторонним ANOVA. Вы также можете взглянуть на следующие статьи, чтобы узнать больше -
- ANOVA в R
- Как интерпретировать результаты с помощью теста ANOVA
- Регрессия против ANOVA
- GLM в R