jueves, 9 de octubre de 2025

Ejercicio de Análisis de Varianza Multivariado (MANOVA) - Paso a Paso

Ejercicio de Análisis de Varianza Multivariado (MANOVA) - Paso a Paso


Este documento detalla el cálculo manual de un MANOVA para un conjunto de datos simulados de la Peste Porcina Africana (PPA). El objetivo es determinar si existen diferencias significativas en las variables medidas (X1, X2, X3) entre las granjas con PPA (PPA=1) y sin PPA (PPA=0).


**Hipótesis:**

- **Hipótesis Nula (H₀):** Los vectores de medias de los dos grupos son iguales. No hay un efecto multivariado de la PPA.

- **Hipótesis Alternativa (H₁):** Los vectores de medias de los dos grupos son diferentes. Hay un efecto multivariado de la PPA.


**Paso 1: Datos Originales y Separación de Grupos**


Se utilizan datos de 6 granjas.


**Grupo 1 (PPA = 1):**

- Granja 1: (X1=9.0, X2=1.0, X3=2.5)

- Granja 2: (X1=8.0, X2=1.5, X3=2.8)

- Granja 3: (X1=10.0, X2=0.5, X3=2.2)


**Grupo 2 (PPA = 0):**

- Granja 4: (X1=2.0, X2=9.0, X3=7.5)

- Granja 5: (X1=2.5, X2=8.5, X3=7.2)

- Granja 6: (X1=1.5, X2=9.5, X3=7.8)


---


### **Paso 2: Cálculo de los Vectores de Medias**


**Media del Grupo 1 (PPA=1):**

- X1_g1 = (9.0 + 8.0 + 10.0) / 3 = 9.0

- X2_g1 = (1.0 + 1.5 + 0.5) / 3 = 1.0

- X3_g1 = (2.5 + 2.8 + 2.2) / 3 = 2.5

**Vector de Media G1 = [9.0, 1.0, 2.5]**


**Media del Grupo 2 (PPA=0):**

- X1_g2 = (2.0 + 2.5 + 1.5) / 3 = 2.0

- X2_g2 = (9.0 + 8.5 + 9.5) / 3 = 9.0

- X3_g2 = (7.5 + 7.2 + 7.8) / 3 = 7.5

**Vector de Media G2 = [2.0, 9.0, 7.5]**


**Media General (Total):**

- X1_total = (9.0 + 8.0 + 10.0 + 2.0 + 2.5 + 1.5) / 6 = 5.5

- X2_total = (1.0 + 1.5 + 0.5 + 9.0 + 8.5 + 9.5) / 6 = 5.0

- X3_total = (2.5 + 2.8 + 2.2 + 7.5 + 7.2 + 7.8) / 6 = 5.0

**Vector de Media General = [5.5, 5.0, 5.0]**


**Paso 3: Cálculo de las Matrices de Sumas de Cuadrados y Productos Cruzados (SSCP)**


**A. Matriz Intra-grupos (Within-groups), W (o E, de Error)**


Esta matriz representa la variabilidad dentro de cada grupo. Se calcula sumando las matrices de covarianzas de cada grupo.


**Para Grupo 1:**

- Desviaciones de la media G1:

  - d1 = [9-9, 1-1, 2.5-2.5] = [0, 0, 0]

  - d2 = [8-9, 1.5-1, 2.8-2.5] = [-1, 0.5, 0.3]

  - d3 = [10-9, 0.5-1, 2.2-2.5] = [1, -0.5, -0.3]

- Matriz W1 = d1'd1 + d2'd2 + d3'd3

  W1 = [[2.0, -1.0, -0.6], [-1.0, 0.5, 0.3], [-0.6, 0.3, 0.18]]


**Para Grupo 2:**

- Desviaciones de la media G2:

  - d4 = [2-2, 9-9, 7.5-7.5] = [0, 0, 0]

  - d5 = [2.5-2, 8.5-9, 7.2-7.5] = [0.5, -0.5, -0.3]

  - d6 = [1.5-2, 9.5-9, 7.8-7.5] = [-0.5, 0.5, 0.3]

- Matriz W2 = d4'd4 + d5'd5 + d6'd6

  W2 = [[0.5, -0.5, -0.3], [-0.5, 0.5, 0.3], [-0.3, 0.3, 0.18]]


**Matriz W Total = W1 + W2:**

W = [[2.5, -1.5, -0.9],

     [-1.5, 1.0, 0.6],

     [-0.9, 0.6, 0.36]]


#### **B. Matriz Inter-grupos (Between-groups), B (o H, de Hipótesis)**


Esta matriz representa la variabilidad entre los grupos.


- Desviación de G1 respecto a la media general: d_g1 = [9.0-5.5, 1.0-5.0, 2.5-5.0] = [3.5, -4.0, -2.5]

- Desviación de G2 respecto a la media general: d_g2 = [2.0-5.5, 9.0-5.0, 7.5-5.0] = [-3.5, 4.0, 2.5]

- B = n1*(d_g1'*d_g1) + n2*(d_g2'*d_g2)

  B = 3 * [[12.25, -14.0, -8.75], [-14.0, 16.0, 10.0], [-8.75, 10.0, 6.25]] + 3 * [[12.25, -14.0, -8.75], [-14.0, 16.0, 10.0], [-8.75, 10.0, 6.25]]

  B = [[36.75, -42.0, -26.25], [-42.0, 48.0, 30.0], [-26.25, 30.0, 18.75]] + [[36.75, -42.0, -26.25], [-42.0, 48.0, 30.0], [-26.25, 30.0, 18.75]]


**Matriz B Total:**

B = [[73.5, -84.0, -52.5],

     [-84.0, 96.0, 60.0],

     [-52.5, 60.0, 37.5]]


**C. Matriz Total (T)**


Esta matriz representa la variabilidad total de los datos. Se verifica que T = W + B.


T = [[2.5+73.5, -1.5-84.0, -0.9-52.5],

     [-1.5-84.0, 1.0+96.0, 0.6+60.0],

     [-0.9-52.5, 0.6+60.0, 0.36+37.5]]


**Matriz T Total:**

T = [[76.0, -85.5, -53.4],

     [-85.5, 97.0, 60.6],

     [-53.4, 60.6, 37.86]]


**Paso 4: Cálculo del Estadístico de Prueba (Lambda de Wilks)**


El estadístico más común para MANOVA es la Lambda de Wilks (Λ), que se calcula como:

Λ = det(W) / det(T)


**Cálculo del determinante de W (det(W)):**

det(W) = 2.5 * (1.0*0.36 - 0.6*0.6) - (-1.5) * (-1.5*0.36 - 0.6*(-0.9)) + (-0.9) * (-1.5*0.6 - 1.0*(-0.9))

det(W) = 2.5 * (0.36 - 0.36) + 1.5 * (-0.54 + 0.54) - 0.9 * (-0.9 + 0.9)

**det(W) = 0**


*Nota: El determinante es cero porque los datos simulados son perfectamente simétricos, haciendo que la matriz W sea singular. En datos reales, este valor sería muy pequeño pero no exactamente cero.*


**Cálculo del determinante de T (det(T)):**

det(T) = 76 * (97*37.86 - 60.6*60.6) - (-85.5) * (-85.5*37.86 - 60.6*(-53.4)) + (-53.4) * (-85.5*60.6 - 97*(-53.4))

det(T) = 76 * (3672.42 - 3672.36) + 85.5 * (-3237.03 + 3236.04) - 53.4 * (-5181.3 + 5180.8)

det(T) = 76 * (0.06) + 85.5 * (-0.99) - 53.4 * (-0.5)

det(T) = 4.56 - 84.645 + 26.7

**det(T) ≈ -53.385**


**Cálculo de Lambda de Wilks (Λ):**

Λ = 0 / -53.385

**Λ = 0**


**Paso 5: Conclusión e Interpretación**


La Lambda de Wilks (Λ) varía entre 0 y 1.

- Un valor cercano a 1 sugiere que no hay diferencias entre los grupos.

- Un valor cercano a 0 sugiere que hay diferencias significativas entre los grupos.


En este caso, **Λ = 0**, el valor más pequeño posible. Esto indica una separación perfecta entre los grupos en el espacio multivariado. La variabilidad entre los grupos es máxima en comparación con la variabilidad dentro de los grupos (que en este caso idealizado es nula en una de sus dimensiones).


**Decisión:**

Se rechaza la hipótesis nula (H₀).


**Conclusión Final:**

Existe una diferencia estadísticamente significativa en el conjunto de variables (X1, X2, X3) entre las granjas que tienen PPA y las que no. El estatus de PPA tiene un efecto multivariado significativo en las características medidas de las granjas.


No hay comentarios:

Publicar un comentario

Ejercicio de Análisis de Varianza Multivariado (MANOVA) - Paso a Paso

Ejercicio de Análisis de Varianza Multivariado (MANOVA) - Paso a Paso Este documento detalla el cálculo manual de un MANOVA para un conjunto...