Pruebas de Ji Cuadrada

No siempre los datos a analizar provienen de mediciones, es decir, hay ocasiones en que se necesita analizar variables discretas y estas necesitan un trato diferente de las variables continuas.

Algunos ejemplos podrían ser :

  • Clasificación de palmas en compactas, supercompactas, normales.
  • Clasificación de individuos en muertas, enfermas, sanas.
  • Clasificación de individuos por colores.
  • Clasificación de individuos en hembras y machos.

Pruebas de frecuencias observadas

Trata de probar si los resultados a partir de una muestra tienen concordancia con los esperados.

Slide1.JPG (4533 bytes)

donde "o" es el valor observado para cada una de dos o mas clases, y "e" es el valor esperado correspondiente.

Para evaluar esta expresión, primero hay que determinar el valor esperado para cada clase de individuos, de acuerdo al planteamiento de la hipótesis.

Ejemplo:

Se sabe que en un cruce T x T de palma, la descendencia de duras, teneras y pisiferas esta en una proporción de 1:2:1. En una muestra de 104 palmas se obtuvieron 28 duras, 49 teneras y 27 pisiferas. Se ajustan estos datos a la proporción esperada?

Calculo :

Durase = 104 * 1
                      4

Tenerase 104 * 1
                    2

Pisiferase = 104 * 1
                           4

Categoría Esperado Observado (o-e)2/e
Duras 26 28 0.1538
Teneras 52 49 0.1731
Pisiferas 26 27 0.0385
Total 104 104 0.3654

 

X2c = 0.365 y  Gl = 2

Los grados de libertad (Gl) se obtienen restándole 1 al número de categorías.

Haciendo uso de la tabla de probabilidades de x2 y con los grados de libertad obtenidos, se determina el valor crítico al nivel de significancia deseado. En este caso para Gl = 2 y para un nivel de 0.05 P se obtiene x2 = 5.991.

Como x2c < x2t entonces se acepta la hipótesis planteada y se concluye que los datos corresponden a una proporción de 1:2:1.

Prueba de la Independencia

Trata de probar si dos variables tienen algún grado de relación o si son completamente independientes.

En el análisis de una relación entre 2 variables, resulta más conveniente plantearse la hipótesis de que ambos son independientes. Para hallar los valores esperados se emplea la teoría de probabilidades que establece : si dos acontecimientos son independientes, la probabilidad de que ambos ocurran simultáneamente es el producto de sus probabilidades individuales de ocurrir.

Ejemplo:

Cien palmas de vivero fueron tratadas con un fungicida y después de cierto tiempo, fueron examinados en busca de síntomas de enfermedad. A otro grupo de 200 palmas no se les administro el fungicida para usarlos como control.

Resultados
Tratamiento Sanos Enfermos Total
Tratado 88 12 100
No tratado 143 57 200
Total 231 69 300

Se someterá a prueba la hipótesis de si existe relación entre el tratamiento con fungicida y la incidencia de enfermedad. Si estas dos variables son independientes la proporción esperada de palmas tratadas saludables será igual a la proporción de animales saludables por la proporción de palmas tratados por la cantidad de palmas total.

231   *  100    =   77      *      300      = 77
300       300       300

77 es el número de palmas esperadas tratadas y saludables.

Con esta información ya se puede construir la tabla de contingencia 2 x 2.

Tratamiento Sanas Enfermas Total
Tratadas 88 (77) 12 (23) 100
No tratadas 143 (154) 57 (46) 200
Total 231 69 300

Puesto que se espera que 77 de las palmas tratadas fueran saludables, las 23 restantes serán enfermas; así mismo, si se espera que 77 de las palmas sanas estuvieran en la clase de las tratadas, el resto de las 231 estarán en la clase de las no tratadas (154); de las 200 palmas no tratadas, se espera que 154 sean sanas, entonces el resto (46) estarán enfermas.

Una característica especial de la tabla 2 x 2 es que la diferencia entre lo observado y lo esperado es igual para cada casilla de la tabla, con la excepción del signo (88-77 = 11, 12-23 = -11,etc.).

La formula general para determinar los grados de libertad en una tabla de contingencia es :

(r - 1) * (c - 1)

donde r son las hileras y c son las columnas. En nuestro caso nos da 1 * 1 = 1, y esto nos conlleva a otra consideración: Cuando los grados de libertad den 1, la fórmula general debe ser modificada por la corrección de Yates.

Slide2.JPG (4615 bytes)

Y para nuestro ejemplo entonces sería :

X2  (10.5)2    +   (10.5)2   +  (10.5)2   +   (10.5)2   =   9.34
              77                   23               154              46

Consultando en la tabla de X2 tenemos que el valor a 0.05 de probabilidad es 3.841

Como la X2c > X2t al nivel de 0.05 P, se declara significativa y se concluye que si hay relación entre el fungicida y la incidencia de la enfermedad.