TESTS DE CONTRASTE DE HIPÓTESIS |
INTRODUCCIÓN
Veremos ahora la forma de tomar una decisión en base a datos estadísticos, controlando el margen de error que podemos cometer.
Supongamos que una empresa privada, decide otorgar una premio a aquellos centros, en los que la nota media de una prueba realizada por los alumnos supere los 7 puntos.
Como no puede (por razones económicas, de tiempo, disponibilidad, etc) realizar la prueba en todos los alumnos en cada centro, decide elegir una muestra aleatoria de 45 alumnos de cada centro, y que sean ellos los que realicen la prueba.
Imagina
que en nuestro centro, se han obtenido los siguientes resultados:
(recuerda que s
podía considerarse un buen sustituto de la desviación típica de la
población, y que por tanto a partir de ahora asumiremos que
s=2'95)
Ahora bien, la empresa se plantea la siguiente duda, ¿puede afirmar con seguridad que la media del centro es superior a 7, o por el contrario el resultado obtenido se debe al azar en la elección de la muestra ( es decir, en la muestra entraron por casualidad muchos empollones)?.
Nuestro centro, dado su convencimiento de merecer el premio, propone el siguiente proceso:
Para probar que " la media m es superior a 7 " (1), supondremos en principio lo contrario, es decir que " la media es menor o igual que 7 " (2), y veremos en términos probabilísticos la posibilidad de que esto último ocurra. Llegan al acuerdo de que si la probabilidad de que " la media sea menor o igual a 7 " es menor del 5%, se aceptará la hipótesis del centro y se concederá el premio.
El centro argumenta lo siguiente:
Si la hipótesis (2) fuera cierta, es decir, la media menor o igual a 7,en el caso extremo la media sería 7, y la distribución muestral de medias sería N(7, 0'44).
Si esto es así, en como mínimo (*) el 95% de los casos, la media muestral habría de ser menor que el valor t=7,726 para el que se verifica que
(*) Cambia el valor de la media hasta por ejemplo 6.5. La probabilidad de valores superiores a t (área gris) es inferior a la que corresponde en el caso extremo (rojo).
(**) Cambia el nivel de significación (cambiando el valor asociado k), y podrás observar el efecto sobre la región crítica.
|
Este valor t se obtiene buscando en primer lugar la puntuación típica k para la que p(Z<k)=0,95 , que resulta ser k=1,65. Los valores que se encuentran a más de 1,96 desviaciones de la media, es decir, superiores a t=7+1,65x0,44=7,726 son los que forman la región crítica, es decir las notas medias que tienen una probabilidad de producirse menor del 5%.
Podría ocurrir que la hipótesis (2) fuera cierta y la media muestral 7'9 perteneciera a esa distribución y fuera un valor correspondiente a la región crítica (y la probabilidad de que ello ocurra es del 5%), o bien que lo que ocurra realmente, es que (2) sea falsa, y la media obtenida pertenezca a una distribución muestral con media m superior ( por ejemplo 7,5 ), con lo cual tal valor no sería tan raro.
En estadística, "se apuesta" a lo que tiene mayor probabilidad de ocurrir, por lo que se considera que la segunda elección es la correcta. (aunque nunca podremos saber si lo que realmente sucede es esto)
Puesto que suponiendo que la media muestral es como máximo 7 en al menos 95 de cada 100 muestras la media muestral debería de ser menor que 7,726, y dado que la media muestral obtenida fue 7,9 (que se encuentra en la región crítica), el centro concluye que:
"Con un nivel de significación del 5%, ( probabilidad de equivocarnos al rechazar que la media pueda ser menor o igual a 7), existe evidencia suficiente de que la media del centro es superior a 7 ".
Si el nivel de significación fuera menor , la región crítica disminuiría, y tendremos más confianza en una decisión de rechazo de la hipótesis nula (**)
Si hubiéramos obtenido de la muestra que
, al
nivel de significación especificado no podríamos rechazar que realmente la
media del centro fuera inferior a 7, es decir., "no existiría
evidencia suficiente de que la media fuera superior a 7".
Es evidente que al no rechazar que la media poblacional sea menor o
igual a 7, también estaríamos arriesgándonos a cometer un error.
En cualquier caso, lo que hacemos es tomar una decisión, una vez vistas las evidencias (datos obtenidos de la muestra), y asumido un margen de error para nuestra decisión.
ELEMENTOS DE LOS TESTS DE HIPÓTESIS
El proceso que hemos descrito en el apartado anterior se denomina "test de contraste de hipótesis", y ahora detallaremos de forma más precisa, los elementos que intervienen en él.
En primer lugar se han de hacer dos hipótesis (1) y (2) que barran el conjunto de posibilidades para la media ( o en general el parámetro poblacional sobre el que se quiere tomar una decisión). En el caso estudiado fué:
A la hipótesis (2) que en principio se consideró cierta, se la denomina hipótesis nula (H0 ) ,por ser el punto de partida, y siempre ha de incluir una igualdad . Esta es la hipótesis que se trata de contrastar, de forma que al final del proceso, la rechazaremos o no.
A la hipótesis (1) que es complementaria de la (2), se la denomina hipótes¡s alternativa (HA ) El rechazo de la hipótesis nula lleva emparejado la aceptación de la hipótesis alternativa.
Cuando se lleva a cabo un test de contraste de hipótesis, se ha de comenzar por establecer las hipótesis nula y alternativa, recordando que la hipótesis nula ha de contener obligatoriamente una igualdad.
Por lo general, se establece como hipótesis alternativa, la que trata de probar algo que significa un cambio sobre lo que se encuentra preestablecido (por resultados anteriores al test o por inercia) y que está representado por la hipótesis nula. La hipótesis nula es siempre conservadora, frente a la alternativa que propugna el cambio.
Establecidas las hipótesis nula y alternativa, Se toma la muestra, y se calculan los datos necesarios para el contraste, en nuestro caso, la media, y la desviación típica muestral
En segundo lugar se establece el nivel de significación que es la probabilidad de que rechacemos la hipótesis nula, siendo en realidad cierta. Utilizaremos la letra a para denominarlo. Este nivel de significación es la cantidad de error que nos podemos permitir, y su elección depende en cada caso de la persona que realiza el test. Los más usuales son 10%, 5%, 1% , 0,1%. Se le denomina error de tipo I
Puede también ocurrir que no rechacemos la hipótesis nula, y sea en realidad falsa. Este tipo de error denominado de tipo II y denotado con la letra b, es un error que va directamente ligado al valor a Se comentará más extensamente en el ANEXO 2
Para este nivel de significación habrá de estudiarse la región crítica asociada. En el caso anterior, dado que la hipótesis nula establece que la media es igual o inferior a 7, la región crítica queda a la derecha. Cuando la hipótesis nula establezca que la media es igual o superior a un valor, la región crítica quedará a la izquierda. Por último, si la hipótesis nula establece que la media tiene un valor determinado, la región crítica se habrá de establecer a ambos lados, de forma que el área total que ocupen las dos subregiones sea igual al nivel de significación:
Se estudia para el nivel de significación dado, si se puede rechazar o no la hipótesis nula. Esto se hace viendo si la media obtenida se encuentra dentro de la región crítica asociada al nivel de significación, o si por el contrario, está fuera.
Si "se rechaza la hipótesis nula", la conclusión debe ser redactada:
"Existe evidencia suficiente al nivel de significación a para indicar que ..(significado de la hipótesis alternativa)"
Si por el contrario la decisión es "no se puede rechazar la hipótesis nula", la conclusión debería ser redactada:
"No existe suficiente evidencia al nivel de significación a que indique que ...(significado de la hipótesis alternativa)"
Veremos ahora varios ejemplos que nos ilustrarán sobre el proceso y los diferentes casos que pueden presentarse. Un método alternativo para realizar los tests está expuesto en el ANEXO 1
Para la comprensión de todos estos conceptos, resultará muy recomendable hacer las actividades propuestas en la hoja de cálculo: Tests de contraste de hipótesis
Para complementar lo que has leído sobre el contraste de hipótesis, puedes realizar la lectura: Naturaleza del Contraste de Hipótesis
EJEMPLO 1:
El instituto cree poder probar que la edad media de los alumnos del turno de Noche es inferior a los 30 años. Se ha tomado una muestra de 40 alumnos, y ha resultado que la media es 29,5 , y la desviación típica muestral es s=2.
Se deberá en primer lugar establecer las hipótesis nula y alternativa, que deberían ser:
En segundo lugar elegimos nivel de significación. Dado que no es demasiado grave equivocarse, se elige un nivel del 10%.
Razonando de forma similar al ejemplo anterior, la región crítica correspondiente a un 10% de significación, sería la que correspondiese a la figura:
Donde
y k=1'28 es la puntuación típica asociada a un 10% de significación.
Puesto que la media muestral 29,5 está dentro de la región crítica, tendremos que rechazar la hipótesis nula, y por tanto:
"A un nivel de significación del 10%, existe evidencia suficiente de que la media de edad en el turno de noche es inferior a 30 años"
EJEMPLO 2:
Un estudiante, ha leído en la prensa, que el coste medio de un menú en las cafeterías de Las Palmas es de 500 pts. Como no está conforme, hace un test de hipótesis, para tratar de probar que no es así.
Establece como hipótesis:
H0:
HA:
Fija un nivel de significación del 5%, y obtiene una muestra aleatoria de 45 cafeterías, obteniendo como media 518 pts, y s=70 pts.
La región crítica asociada a este nivel de significación para las hipótesis planteadas sería:
Ahora
k=1'96 y por tanto
,
y
En consecuencia, no puede rechazarse a este nivel de significación la hipótesis nula y por tanto:
"A un nivel de significación del 5% no existe evidencia suficiente de que la media de precios sea diferente de 500 pts."
De hecho, esto no significa que sea cierta la hipótesis nula, sino sólo que no se puede rechazar a este nivel de significación. Si hubiéramos tomado un nivel de significación del 10%, la región crítica correspondiente habría estado delimitada por los valores 482'78 y 517'22, con lo que habríamos rechazado la hipótesis nula para ese nivel de significación.
De la misma forma que hemos estado realizando tests sobre medias, pueden ser realizados tests sobre otros parámetros de una población. En particular resulta muy interesante hacerlo sobre una proporción en una determinada población. Veremos ahora un ejemplo de como hacerlo:
EJEMPLO 3:
Antonio dice a Luis que al menos un 15% de los alumnos del Instituto, tiene una moto. Como discrepan, Luis realiza una encuesta aleatoria a 200 compañeros del Instituto, y encuentra que 18 de ellos tiene moto. A un nivel de significación del 10%, ¿cual de los dos tiene estadísticamente la razón?
Establecemos la hipótesis nula y alternativa.
Encontramos que la proporción buscada en la muestra es p'= 18/200=0,09.
Supongamos que H0 es cierta, y que por tanto en el peor de los casos sería p=0,15. Sabemos que si así fuera, las proporciones muestrales, se habrían de distribuir según:
Puesto que a un nivel de significación del 10%, la región crítica es la correspondiente a valores menores que k=0,15-1,65x0,0252=0,108 , ésta la forman los porcentajes inferiores al 10,8%. El porcentaje obtenido en la muestra queda dentro de esta región y por tanto rechazamos la hipótesis nula, redactando la conclusión como:
"A un nivel de significación del 10%, existe suficiente evidencia de que la proporción de alumnos con bicicleta es inferior al 15%".
Aunque el resultado dé la razón a Luis, podemos habernos equivocado (con una probabilidad del 10%), . Si hubiera sido otro el resultado, y le hubiéramos dado la razón a Antonio, también podríamos habernos equivocado (recuerda el error de tipo II).