jueves, 9 de octubre de 2025

ANOVA con Álgebra Matricial

ANOVA con Álgebra Matricial: Un Ejemplo Sencillo para Pizarrón


El Análisis de Varianza (ANOVA) puede ser formulado como un caso del Modelo Lineal General. Esto nos permite resolverlo usando álgebra matricial.


El modelo es: **y = Xβ + ε**

- **y**: Vector de observaciones.

- **X**: Matriz de diseño (indica a qué grupo pertenece cada observación).

- **β**: Vector de parámetros (las medias de los grupos que queremos estimar).

- **ε**: Vector de errores.


---


### **Paso 1: Datos y Definición de Matrices**


Supongamos que tenemos 3 grupos de tratamiento:

- **Grupo 1:** 4, 5, 6

- **Grupo 2:** 7, 8

- **Grupo 3:** 9, 10, 11


**1. Vector de Observaciones (y):**

   y = [4, 5, 6, 7, 8, 9, 10, 11]ᵀ


**2. Vector de Parámetros (β):** (Las medias de cada grupo)

   β = [μ₁, μ₂, μ₃]ᵀ


**3. Matriz de Diseño (X):** (Matriz 8x3 que asigna cada observación a su media)

   X = [[1, 0, 0],

        [1, 0, 0],

        [1, 0, 0],

        [0, 1, 0],

        [0, 1, 0],

        [0, 0, 1],

        [0, 0, 1],

        [0, 0, 1]]


**Paso 2: Estimar los Parámetros (β̂)**


La estimación de mínimos cuadrados para β se calcula con la ecuación normal:

**β̂ = (XᵀX)⁻¹ Xᵀy**


**1. Calcular XᵀX:**

   XᵀX = [[3, 0, 0],  (n₁=3)

          [0, 2, 0],  (n₂=2)

          [0, 0, 3]]  (n₃=3)


**2. Calcular la inversa (XᵀX)⁻¹:**

   (XᵀX)⁻¹ = [[1/3, 0,   0  ],

              [0,   1/2, 0  ],

              [0,   0,   1/3]]


**3. Calcular Xᵀy:** (Suma de las observaciones en cada grupo)

   Xᵀy = [4+5+6, 7+8, 9+10+11]ᵀ = [15, 15, 30]ᵀ


**4. Calcular β̂:**

   β̂ = (XᵀX)⁻¹ Xᵀy = [[1/3 * 15], [1/2 * 15], [1/3 * 30]]ᵀ = [5, 7.5, 10]ᵀ


Como se puede ver, **β̂ = [μ̂₁, μ̂₂, μ̂₃]ᵀ**, que son exactamente las medias de cada grupo:

- Media G1 = (4+5+6)/3 = 5

- Media G2 = (7+8)/2 = 7.5

- Media G3 = (9+10+11)/3 = 10

**Paso 3: Partición de la Suma de Cuadrados (SC)**

**Factor de Corrección (FC):**

FC = (Σy)² / N = (60)² / 8 = 3600 / 8 = 450


**Suma de Cuadrados Total (SCT):**

SCT = yᵀy - FC

SCT = (4²+5²+6²+7²+8²+9²+10²+11²) - 450 = 492 - 450 = **42**


**Suma de Cuadrados del Modelo/Regresión (SCM):** (Variabilidad entre grupos)

SCM = β̂ᵀXᵀy - FC

SCM = [5, 7.5, 10] * [15, 15, 30]ᵀ - 450

SCM = (5*15 + 7.5*15 + 10*30) - 450 = (75 + 112.5 + 300) - 450 = 487.5 - 450 = **37.5**


**Suma de Cuadrados del Error (SCE):** (Variabilidad dentro de los grupos)

SCE = yᵀy - β̂ᵀXᵀy

SCE = 492 - 487.5 = **4.5**

**Verificación:** SCT = SCM + SCE  =>  42 = 37.5 + 4.5 (Correcto)

**Paso 4: Tabla ANOVA**


| Fuente de Variación | SC (Suma de Cuadrados) | gl (Grados de Libertad) | CM (Cuadrado Medio) | F (Estadístico F) |

|---------------------|------------------------|-------------------------|---------------------|-------------------|

| Modelo (Entre Grupos) | 37.5             | k-1 = 2                 | 37.5 / 2 = 18.75    | 18.75 / 0.9 = **20.83** |

| Error (Dentro Grupos)  | 4.5               | N-k = 5                 | 4.5 / 5 = 0.9          |                   |

| Total                              | 42.0             | N-1 = 7                 |                              |                   |



### **Conclusión**


El estadístico F calculado es **20.83**. Este valor se compararía con un valor F crítico de las tablas de distribución (con 2 y 5 grados de libertad) para un nivel de significancia (ej. α=0.05). Si F calculado > F crítico, se rechaza la hipótesis nula y se concluye que hay una diferencia significativa entre las medias de los grupos.


No hay comentarios:

Publicar un comentario

Ejercicio de Análisis de Varianza Multivariado (MANOVA) - Paso a Paso

Ejercicio de Análisis de Varianza Multivariado (MANOVA) - Paso a Paso Este documento detalla el cálculo manual de un MANOVA para un conjunto...