Revisión de supuestos de ANOVA: Los supuestos del ANOVA son exactamente los mismos que los de la prueba t para comparar dos grupos1. 1.
Independencia ver ejemplo tomates
En el libro de Hopkins & Hopkins & Glass aparece una discusión detallada sobre la verificación de supuestos página 202-207. 1
2.
Normalidad de los residuos
Será un problema en caso de que las poblaciones tengan distribuciones marcadamente asimétricas y en direcciones opuestas. La prueba F es robusta Alternativas: transformar datos o estadística no paramétrica. Verificación: Gráficos y test de Normalidad: test de Kolmogorov-Smirnov y Shapiro-Wilk. La hipótesis será: H 0 : los residuos del grupo i son normales H1 : los residuos del grupo i NO son normales .
Si el valor-p > 0,05 no podemos rechazar la hipótesis nula y por lo tanto asumimos que se cumple el supuesto de Normalidad.
Pruebas de normalidad para los tomates con SPSS Gráfico Q-Q normal de Altura en cms.
Gráfico Q-Q normal de Altura en cms.
Para FERTIL= A
Para FERTIL= B 1.0
.5
.5
0.0
0.0
Normal esperado
Normal esperado
1.0
-.5
-1.0 30
32
34
36
38
40
-.5
-1.0 40
Valor observado
41
42
43
44
45
46
Valor observado
Gráfico Q-Q normal de Altura en cms. Para FERTIL= C 1.0
.5
Normal esperado
0.0
-.5
-1.0 34.5
35.0
35.5
36.0
36.5
37.0
37.5
38.0
38.5
Valor observado
FERTILIZA Kolmogorov-Smirnov(a) Shapiro-Wilk Estadístico gl Sig. Estadístico gl Sig. A .215 5 .200(*) .901 5 .415 B .141 5 .200(*) .979 5 .928 C .237 5 .200(*) .961 5 .814 * Este es un límite inferior de la significación verdadera. a Corrección de la significación de Lilliefors
47
3.
Homocedasticidad: Test de Levene Hipótesis
Test Esta Distribución bajo Ho dístic o
F
F de Fisher con (k-1, n-k) gl
Si valor-p > 0,05 no podemos rechazar la hipótesis nula y concluimos que se cumple el supuesto de homocedasticidad. Si el valor-p fuera menor de 0,05, entonces no se cumple el supuesto de homocedasticidad. En este caso ya no podemos usar el test F para comparar las medias. Existe otro test de comparación de medias que toma en cuenta este problema y se llama
el test de Welch, pero es aconsejable intentar otras medidas para corregir este problema. Prueba de homogeneidad de varianzas con SPSS Estadístico de Levene gl1 5.450 2
gl2 12
Sig. .021
Pruebas robustas de igualdad de las medias Estadístico(a) gl1 gl2 Sig. Welch 22.565 2 6.942 .001 a Distribuidos en F asintóticamente.
Comparaciones múltiples Hipótesis ANOVA: H 0 : µ1 = µ2 =... = µk H 1 : al menos dos medias
no son iguales .
Si acepto H , las medias son iguales, no hay más comparaciones que hacer. 0
Si rechazo H , las medias difieren, entonces la pregunta siguiente es: ¿cuáles medias difieren? 0
Métodos a-priori y post-hoc En este curso revisaremos los contrastes (apriori) y el método de Tukey (post-hoc), SPSS realiza muchos otros métodos que pudieran ser útiles y que siguen la misma filosofía de Tukey.
Contrastes Realizar contrastes es equivalente a realizar test t para comparar medias de todos los posibles pares de combinaciones: t=
yi − y j
(
M C Dn1i +
1 nj
) ~ t (n − k )
Donde MCD es la media cuadrática dentro o la estimación de la varianza poblacional. En SPSS tenemos que indicar cuales son los pares a comparar indicándole cuales son los coeficientes de los contrastes. Cada contraste tiene que sumar cero:
SPSS: Coeficientes de los contrastes Contraste Fertilizante A B C 1 1 -1 0 2 1 0 -1 3 0 1 -1
El contraste 1 equivale a docimar la hipótesis: , es decir El contraste 2 equivale a docimar la hipótesis: , es decir El contraste 3 equivale a docimar la hipótesis: , es decir
SPSS: Pruebas para los contrastes ALTURA
Contraste 1 2 3
Valor del contraste -8.00 -1.20 6.80
Error típico 1.536 1.536 1.536
T -5.208 -.781 4.426
Sig. gl (bilateral) 12 .000 12 .450 12 .001
Test de Tukey El test de Tukey es bastante conocido y aceptado en la literatura. La prueba estadística que utiliza el método de Tukey es la estadística o test de rango estudentizado, q, donde q=
yi − y j MCD q
~ q (k , n − k )
Existen tablas para la estadística de rango estudentizado pero no las vamos a necesitar, usaremos los resultados de SPSS:
SPSS: Comparaciones múltiples (Tukey): Intervalo de confianza al 95%
HSD de Tukey
(I) Fertilizante A
(J) Fertilizante B C
B
A C
C
Diferencia de medias (I-J) -8.00(*) -1.20
A B
Error típico 1.536 1.536
Sig. .001 .721
Límite inferior -12.10 -5.30
Límite superior -3.90 2.90
8.00(*)
1.536
.001
3.90
12.10
6.80(*) 1.20 -6.80(*)
1.536 1.536 1.536
.002 .721 .002
2.70 -2.90 -10.90
10.90 5.30 -2.70
Notar que el error estándar es el mismo, lo que cambia es la distribución que estamos usando como referencia, y por lo tanto cambia el valor-p. SPSS: Subconjuntos homogéneos Fertilizante N HSD de Tukey(a)
A C B
5 5 5
Subconjunto para alfa = .05 1 2 35.20 36.40 43.20
Sig. .721 1.000 Se muestran las medias para los grupos en los subconjuntos homogéneos. a Usa el tamaño muestral de la media armónica = 5.000.
Pasos en ANOVA de un factor: 1.
Describir los grupos, se recomienda una descripción numérica (promedio y error estándar) y descripción gráfica (box).
Gráfico de cajas para la altura de los tomates 50
40
ALTURA
30
20 N=
5
5
5
A
B
C
Fertilizante
Este gráfico es bueno para el análisis exploratorio de los datos, es decir al inicio del estudio.
Gráfico de medias para la altura de los tomates 50
45
40
95% IC ALTURA
35
30
25
20 N=
5
5
5
A
B
C
Fertilizante
Descripción numérica: N A B C Total
5 5 5 15
Media 35.20 43.20 36.40 38.27
Desviación típica 3.564 1.924 1.140 4.284
2.
Verificar los supuestos: Normalidad: Test de Kolmogorov-Smirnov y Shapiro-Wilks Homocedasticidad: Test de Levene 2a) Si no se obtiene normalidad, se pueden trasformar los datos2 o usar métodos no paramétricos (capítulo siguiente). 2b) Si no se obtiene homogeneidad de varianza: se pueden trasformar los datos o usar métodos no paramétricos o realizar el Test de Welch para comparar medias
3. Tabla de ANOVA 3a) Si F grande, valor-p < 0,05 entonces: Test de comparaciones múltiples 2
Ver Aron & Aron cap. 15
3b) Si valor-p > 0,05 quiere decir que no hay diferencias estadísticamente significativas entre los promedios y por lo tanto no hay más preguntas.