ANOVA con Álgebra Matricial: Un Ejemplo Sencillo para Pizarrón
El Análisis de Varianza (ANOVA) puede ser formulado como un caso del Modelo Lineal General. Esto nos permite resolverlo usando álgebra matricial.
El modelo es: **y = Xβ + ε**
- **y**: Vector de observaciones.
- **X**: Matriz de diseño (indica a qué grupo pertenece cada observación).
- **β**: Vector de parámetros (las medias de los grupos que queremos estimar).
- **ε**: Vector de errores.
---
### **Paso 1: Datos y Definición de Matrices**
Supongamos que tenemos 3 grupos de tratamiento:
- **Grupo 1:** 4, 5, 6
- **Grupo 2:** 7, 8
- **Grupo 3:** 9, 10, 11
**1. Vector de Observaciones (y):**
y = [4, 5, 6, 7, 8, 9, 10, 11]ᵀ
**2. Vector de Parámetros (β):** (Las medias de cada grupo)
β = [μ₁, μ₂, μ₃]ᵀ
**3. Matriz de Diseño (X):** (Matriz 8x3 que asigna cada observación a su media)
X = [[1, 0, 0],
[1, 0, 0],
[1, 0, 0],
[0, 1, 0],
[0, 1, 0],
[0, 0, 1],
[0, 0, 1],
[0, 0, 1]]
**Paso 2: Estimar los Parámetros (β̂)**
La estimación de mínimos cuadrados para β se calcula con la ecuación normal:
**β̂ = (XᵀX)⁻¹ Xᵀy**
**1. Calcular XᵀX:**
XᵀX = [[3, 0, 0], (n₁=3)
[0, 2, 0], (n₂=2)
[0, 0, 3]] (n₃=3)
**2. Calcular la inversa (XᵀX)⁻¹:**
(XᵀX)⁻¹ = [[1/3, 0, 0 ],
[0, 1/2, 0 ],
[0, 0, 1/3]]
**3. Calcular Xᵀy:** (Suma de las observaciones en cada grupo)
Xᵀy = [4+5+6, 7+8, 9+10+11]ᵀ = [15, 15, 30]ᵀ
**4. Calcular β̂:**
β̂ = (XᵀX)⁻¹ Xᵀy = [[1/3 * 15], [1/2 * 15], [1/3 * 30]]ᵀ = [5, 7.5, 10]ᵀ
Como se puede ver, **β̂ = [μ̂₁, μ̂₂, μ̂₃]ᵀ**, que son exactamente las medias de cada grupo:
- Media G1 = (4+5+6)/3 = 5
- Media G2 = (7+8)/2 = 7.5
- Media G3 = (9+10+11)/3 = 10
**Paso 3: Partición de la Suma de Cuadrados (SC)**
**Factor de Corrección (FC):**
FC = (Σy)² / N = (60)² / 8 = 3600 / 8 = 450
**Suma de Cuadrados Total (SCT):**
SCT = yᵀy - FC
SCT = (4²+5²+6²+7²+8²+9²+10²+11²) - 450 = 492 - 450 = **42**
**Suma de Cuadrados del Modelo/Regresión (SCM):** (Variabilidad entre grupos)
SCM = β̂ᵀXᵀy - FC
SCM = [5, 7.5, 10] * [15, 15, 30]ᵀ - 450
SCM = (5*15 + 7.5*15 + 10*30) - 450 = (75 + 112.5 + 300) - 450 = 487.5 - 450 = **37.5**
**Suma de Cuadrados del Error (SCE):** (Variabilidad dentro de los grupos)
SCE = yᵀy - β̂ᵀXᵀy
SCE = 492 - 487.5 = **4.5**
**Verificación:** SCT = SCM + SCE => 42 = 37.5 + 4.5 (Correcto)
**Paso 4: Tabla ANOVA**
| Fuente de Variación | SC (Suma de Cuadrados) | gl (Grados de Libertad) | CM (Cuadrado Medio) | F (Estadístico F) |
|---------------------|------------------------|-------------------------|---------------------|-------------------|
| Modelo (Entre Grupos) | 37.5 | k-1 = 2 | 37.5 / 2 = 18.75 | 18.75 / 0.9 = **20.83** |
| Error (Dentro Grupos) | 4.5 | N-k = 5 | 4.5 / 5 = 0.9 | |
| Total | 42.0 | N-1 = 7 | | |
### **Conclusión**
El estadístico F calculado es **20.83**. Este valor se compararía con un valor F crítico de las tablas de distribución (con 2 y 5 grados de libertad) para un nivel de significancia (ej. α=0.05). Si F calculado > F crítico, se rechaza la hipótesis nula y se concluye que hay una diferencia significativa entre las medias de los grupos.
No hay comentarios:
Publicar un comentario