Esta actividad debera ser realizada en idioma espanol. Para realizar este documento usted debera leer los siguientes docuementos: (TEMA 13, TEMA 14, TEMA 15, TEMA 16, TEMA 17). REALIZAR UN DOCUMENTO

Iniciación a la investigación educativa Tema 1 6 . Contraste de hipótesis y comparación de medias Iniciación a la investigación educativa Tema 1 6. Contraste de hipótesis y comparación de medias 2 © Copyright Universidad Europea. Todos los derechos reservados. Índice Objetivos de aprendizaje ................................ ............................... 3 1. Presentación ................................ ................................ ........... 3 2. Hipótesis científica e hipótesis matemática ................................ ...... 3 3. Conclusiones de una prueba de significación ................................ ..... 5 4. Pruebas de bondad de ajuste o de normalidad ................................ .. 6 5. Pruebas de conformidad, homogeneidad y de independencia ................. 7 6. Principales pruebas estadísticas ................................ .................... 9 7. Comparación de medias para dos muestras independientes ................. 10 8. Comparación de medias para dos muestras emparejadas .................... 11 9. Comparación de dos medias para distribuciones no paramétricas .......... 12 10. Comparación de medias: análisis de la varianza ............................. 12 11. Resumen ................................ ................................ ............ 13 Referencias bibliográficas ................................ ............................ 14 Iniciación a la investigación educativa Tema 1 6. Contraste de hipótesis y comparación de medias 3 © Copyright Universidad Europea. Todos los derechos reservados. Objetivos de aprendizaje Los objetivos que se pretenden alcanzar en este recurso son los siguientes: • Introducirse en el planteamiento de hipótesis e identificar los principales problemas que se pueden observar. • Enunciar hipótesis correctamente. • Conocer las principales pruebas y cuándo se utilizan. • Detectar los errores que se cometen en la investigación. 1. Presentación El planteamiento de hipótesis y su fundamentación matemática llevan al investigador a buscar la asociación entre una causa y el efecto que produce. Un problema que se observa en la práctica educativa se transforma en una hipótesis y esta en hipótesis estadística, desdoblándose en dos: la nu la y la alternativa , mutuamente excluyentes. Este tema está dedicado a la aplicación de las pruebas de hipótesis cuando se comparan dos variables, la independiente de tipo cualitativo, con dos o más categorías, y la dependiente de tipo cuantitativo, a las variables cuantitativas. Estas últimas pueden pertenecer a las escalas de medida de intervalo o de razón . Los tipos de hipótesis que se generan plantean cuatro tipos de situaciones : • Comparar si una variable cuantitativa sigue una distribución normal . • Estud iar la relación entre una variable cualitativa con dos categorías y una cuantitativa. Son las pruebas de homogeneidad para muestras independientes. • Analizar si existe diferencia entre los valores de una variable perteneciente a los mismos sujetos, apuntada antes de un tratamiento o después, son las pruebas de homogeneidad para muestras emparejadas . • Estudiar la relación entre una variable cualitativa con más de dos categorías y una cuantitativa. Son las pruebas donde se comparan medias, llamadas de análisis de la varianza . 2. Hipótesis científica e hipótesis matemática Las hipótesis “son enunciados que aseveran una respuesta posible de ser verdadera y contrastable” (Flores, 2014, p. 165). Ante la observación de un problema, se formulan preguntas y se buscan respuestas a las mismas de por qué está ocurriendo: causa desencadenante . Así, por ejemplo, afirmar que los estudiantes de primaria de familias cuyo nivel socioeconómico y cultural (NSEC) es bajo tienen tendencia a presentar un rendimiento académico más bajo, es cierto, aunque no siempre ocurre, pero sí con cierta frecuencia. Iniciación a la investigación educativa Tema 1 6. Contraste de hipótesis y comparación de medias 4 © Copyright Universidad Europea. Todos los derechos reservados. Es entonces cuando se enuncia la hipótesis científica nacida de la observación: el nivel socioeconómico y cultural de las familias influye en el rendimiento académico de los es tudiantes de primaria. Esta hipótesis científica solo es una suposición, que se tiene que demostrar mediante un planteamiento estadístico , es decir, de forma matemática, demostrando que existe una asociación causa -efecto que no se debe al azar. Es en este momento cuando se transforma la hipótesis científica en una hipótesis estadística demostrable. Para ello, se formulan dos tipos de hipótesis que deben ser mutuamente excluyentes, o lo que es lo mismo, si se cumple una es imposible que se cumpla la otra. Hi pótesis nula H0 e hipótesis alternativa H1: • Hipótesis nula H 0. Es la afirmación que se toma como verdadera a priori (antes de realizar el estudio) y se comprueba estadísticamente. Es la proposición que va a ser sometida a examen para ver si es cierta o no. En el ejemplo anterior, “el NSEC no influye en el rendimiento académico de los estudiantes de primaria” • Hipótesis alternativa H 1. Es la afirmación contraria a la nula, que se cumplirá si no se cumple esta. En el ejemplo anterior “el NSEC influye en el rendimiento académico de los estudiantes de primaria”. La estadística, mediante la contrastación de hipótesis , nos permite decidir cuál de las dos es cierta, con un riesgo de error admitido. ¿Qué objetivo persigue la contrastación de hipótesis? En la con trastación de hipótesis, se demuestra que existe una asociación entre una causa -efecto , de forma que la causa al actuar produce un efecto, que no se debe al azar. Por consiguiente, si ante dos o más variables que correlacionan, una es la variable independi ente, que es aquella que al aparecer provoca un cambio en las otras variables, es decir, en las variables dependientes : • Cuando se demuestra estadísticamente como ciertas las hipótesis alternativas, se afirma que la aparición de las variables independientes modifica (cambian los valores) las dependientes. • Cuando se demuestra estadísticamente como cierta la hipótesis nula, se afirma que la variable independiente no tiene efecto sobre las dependientes. Iniciación a la investigación educativa Tema 1 6. Contraste de hipótesis y comparación de medias 5 © Copyright Universidad Europea. Todos los derechos reservados. 3. Conclusiones de una prueba de significación Las pruebas estadísticas son soluciones probabilísticas que contemplan un error con un riesgo calculado que el investigador tendrá que tener presente. La prueba será más potente cuanto menor sea el riesgo de cometer el error. 1. Tipos de er rores La prueba de significación conduce siempre a un error, en concreto son posibles dos tipos de error (García -García, Reding -Bernal y López -Alvarenga, 2013): • Error tipo I : es aquel que se comete al rechazar la hipótesis nula (H 0) siendo cierta. La probabilidad de cometer este error se denomina riesgo α. • Error tipo II : se comete al aceptar la hipótesis nula (H 0) siendo cierta la hipótesis alternativa (H 1). La probabilidad de cometer este error se denomina riesgo ß. La probabilidad de cometer cada uno de los riesgos de error se puede estudiar utilizando las probabilidades condicionadas: • Riesgo α: P (rechazar H0 / siendo cierta H0). • Riesgo ß: P (aceptar H0 / siendo cierta H1). Las zonas de rechazo y de aceptación de las hipótesis se basan en un riesgo p equeño, generalmente el riesgo que se fija es del 5 % (0,05) para definir la zona de aceptación. 2. Potencia de una prueba Se denomina potencia de una prueba a la capacidad que tiene un test estadístico de detectar cuáles son las diferencias que existen entre las dos hipótesis , es decir, cuál es la verdadera. La potencia de una prueba es el suceso complementario del riesgo ß. Potencia = 1 - Riesgo ß. Es decir, la probabilidad de aceptar la hipótesis alternativa siendo la cierta: P (aceptar H1 / s iendo cierta H1). Iniciación a la investigación educativa Tema 1 6. Contraste de hipótesis y comparación de medias 6 © Copyright Universidad Europea. Todos los derechos reservados. 4. Pruebas de bondad de ajuste o de normalidad Antes de realizar cualquier prueba estadística se tiene que comprobar si las muestras siguen la Ley Normal o distribución normal , “conocida por millones de personas como la curva en forma de campana o la curva acampanada” (Stahl, Másmela y Rincón, 2015, p. 13). Según la Ley Normal, para que una distribución muestral siga esta ley, los valores del coeficiente de asimetría y el de apuntamiento de la curva tienen que ser iguales a 0, o sus valores alejarse del cero menos de dos veces el valor del error estándar. Otra forma de hacer la comprobación es a través de las pruebas de hipótesis de Kolmogorov -Smirnov y la de Shapiro -Wilk . Ambas pruebas plantean las siguientes hipótesis : • H0: la distribución de la muestra sigue la Ley Normal. • H1: la distribución de la muestra no sigue la Ley Normal. Al realizar la prueba de normalidad, si el nivel de significación es mayor de 0,05 , se acepta H0 y se asumirá que la muestra sigue una distribución normal, también denominada muestra paramétrica . Si al realizar la prueba, el nivel de significación fuera menor o igual a 0,05 , se asumirá que se cumple la hipótesis alternativa (H 1) y por lo tan to la muestra sería no paramétrica . La prueba de Shapiro -Wilk se utiliza cuando las muestras son pequeñas ( n < 30 sujetos). El peso Se valora el peso en una muestra de 65 mujeres y se desea comprobar si en la población de origen el peso se distribuye se gún la Ley Normal. Iniciación a la investigación educativa Tema 1 6. Contraste de hipótesis y comparación de medias 7 © Copyright Universidad Europea. Todos los derechos reservados. 5. Pruebas de conformidad, homogeneidad y de independencia Además de las pruebas de bondad de ajuste, existen otras tres pruebas de hipótesis: las pruebas de conformidad, las de homogeneidad y las de independencia . 1. Pruebas de conformidad Mediante las pruebas de conformidad , se pretende averiguar si una muestra proviene de una población teórica previamente especificada. Verifican si los estadíst icos calculados en la muestra se corresponden con los parámetros poblacionales. En este caso, las hipótesis a contrastar serán: • H0: la muestra proviene de la población teórica. • H1: la muestra no proviene de dicha población teórica. La competencia en matemáticas en estudiantes de 15 años En una muestra de 65 estudiantes de 15 años, se ha medido la competencia matemática mediante una prueba utilizada en el estudio PISA. Se desea comprobar si la muestra procede de una población con nivel de competencia en matemáticas medio (es decir, el de la media aritmética de PISA). 2. Pruebas de homogeneidad Las pruebas de homogeneidad son estudios comparativos de la respuesta observada en los dos grupos. La pregunta que se formula es si dos o más mues tras observadas provienen de una misma población teórica no especificada. Las hipótesis serían las siguientes: • H0: las muestras provienen de una misma población. • H1: las muestras no provienen de una misma población sino de poblaciones diferentes. Iniciación a la investigación educativa Tema 1 6. Contraste de hipótesis y comparación de medias 8 © Copyright Universidad Europea. Todos los derechos reservados. Cáncer de mama y herencia En un estudio se quiere probar la asociación entre el cáncer de mama y la herencia. Se registran los casos de cáncer de mama en mujeres ingresadas en un hospital, en el último año, y otras mujeres también ingresad as en el hospital con las mismas características de edad, número de hijos, estado civil, etc., excepto que están sanas para el cáncer de mama. El enunciado de las hipótesis sería: • H0: ambas muestras provienen de la misma población con la misma proporción de familiares con cáncer de mama. • H1: las muestras provienen de distintas poblaciones con diferente proporción de cáncer de mama. 3. Pruebas de independencia o de relación A través de las pruebas de independencia o de relación , se desea averiguar si la muestra obtenida proviene de una población en la cual las variables en estudio no están relacionadas. Cuando se estudian dos variables en los mismos individuos, se permite averiguar si estas dos variables están relacionadas, es de cir, si los valores que tome una de ellas condicionan los valores que toma la otra en la población de donde procede la muestra. • H0: las variables son independientes en la población de origen. • H1: las variables no son independientes en la población de orige n, o sea, están relacionadas. Accidente de tráfico Se quiere demostrar si los accidentes de tráfico se encuentran asociados al estado civil. Iniciación a la investigación educativa Tema 1 6. Contraste de hipótesis y comparación de medias 9 © Copyright Universidad Europea. Todos los derechos reservados. 6. Principales pruebas estadísticas Según sea el tipo de variables que se estudie, el investigador utilizará distintas pruebas estadísticas . No será igual estudiar si existe relación entre dos variables cualitativas, el género y la elección de la titulación universitaria, que estimar la relación entre el cociente intelectual y el rendimient o en matemáticas en estudiantes de educación secundaria, que en este caso son dos variables cuantitativas. Para ello, el siguiente cuadro muestra las principales pruebas de planteamiento de hipótesis para muestras paramétricas y no paramétricas : Tabla 1. Principales pruebas de planteamiento de hipótesis para muestras paramétricas y no paramétricas . Variable independiente Variable dependiente Pruebas paramétricas Pruebas no paramétricas Cualitativa con dos categorías. Cuantitativa. Comparación de medias: t d e Student. Homogeneidad de varianzas: F de Snedec. Comparación de medias: U de Mann Whitney (muestras independientes). Comparación de medias: T de Wilcoxon (muestras emparejadas). Homogeneidad de varianzas: Levene. Cualitativa con más de dos categorías. Cuantitativa. Análisis de la varianza: prueba de ANOVA. Prueba de Krustal - Wallis (muestras independientes). Prueba de Friedman (datos emparejados). Cualitativa (independiente del número de categorías). Cualitativa (independiente del número de categorías). Prueba Chi -cuadrado. Prueba de McNemar (datos pareados). Prueba de Fisher (muestras pequeñas). Prueba de Chi - cuadrado. Cuantitativa. Cuantitativa. Correlación y regresión: coeficiente de Pearson. Correlación y regresión: coeficiente de Spearm an. Iniciación a la investigación educativa Tema 1 6. Contraste de hipótesis y comparación de medias 10 © Copyright Universidad Europea. Todos los derechos reservados. 7. Comparación de medias para dos muestras independientes La situación clásica de disponer de dos grupos (por ejemplo, chicos y chicas o un grupo en el que se ha utilizado una metodología innovadora para la enseñanza -aprendizaje de las matemáticas y otro que ha seguido con la metodología tradicional) y el deseo de averiguar cuál es mejor de los dos, se representa con la siguiente situación: se quiere saber si las medias obtenidas de dos muestras diferentes pertenecen a dos poblaciones de iguales medias. Para ello, se puede actuar de dos formas : 1. La metodología innovadora y la tradicional se aplican a dos grupos diferentes de estudiantes (datos independientes) y se mide el rendimiento de los mismos. Las hipótesis que se plantean son si amb as metodologías ofrecen el mismo rendimiento de los estudiantes en matemáticas (no existen diferencias entre las medias de los dos grupos H0) o si por el contrario una es mejor que la otra (existen diferencias significativas entre ambas medias no debidas a l azar del muestreo H1). 2. En dos muestras de tamaños n1 y n2, sacadas de dos poblaciones con medias y varianzas desconocidas (el caso de conocer la varianza de las poblaciones es muy raro, por eso el planteamiento de varianza poblacional conocida se va a om itir), se desean contrastar las siguientes hipótesis: 0:1= 2 1:1≠ 2 Una vez comprobado que las medias muestrales siguen distribuciones normales, la H0 estima que ambas medias son iguales. Por tanto, su diferencia es 0. ̅1→ (1,1√1) ̅2→ (2,2√2) Se debe recurrir a la t de Student , pero incorporando una transformación para aumentar la potencia de la prueba. Al ser las varianzas de los dos grupos estimaciones de la misma varianza, se utiliza una varianza conjunta, pero teniendo en cu enta los diferentes tamaños de las dos muestras y considerando los grados de libertad : = ̅1− ̅2 √2 1+ 2 2 La t de Student se tiene que aplicar en muestras grandes (>30 para n1 y n2) ya que si las muestras son pequeñas, además de que la variable siga u na distribución normal, es necesario comprobar que proceden de poblaciones con igual varianza, comprobación que se tiene que hacer antes del estudio de las medias mediante la prueba de Levene . Iniciación a la investigación educativa Tema 1 6. Contraste de hipótesis y comparación de medias 11 © Copyright Universidad Europea. Todos los derechos reservados. 8. Comparación de medias para dos muestras emparejadas En este tipo de prueba, se está ante la situación de que los datos obtenidos pertenecen a los mismos individuos de la muestra, antes y después de someterles a una metodología innovadora para la enseñanza -aprendizaje de las matemáticas , por ejem plo . El procedimiento consiste en medir el rendimiento en matemáticas antes de aplicar la nueva metodología y obtener la media correspondiente, así como volver a medir la misma variable después de la intervención, obtener otra media y comparar si ambas med ias son iguales o, por el contrario, existen discrepancias que no se deban al azar. La nueva variable resultará de la diferencia del valor de la variable antes y después del proceso de intervención. Lógicamente esta operación se hace con cada uno de los individuos y el valor más representativo de esta nueva variable será la media de todas las diferencias . ̅= ̅1− ̅2 A partir de la nueva variable, se construyen las siguientes pruebas de hipótesis : • H0: el valor de la variable no sufre modificaciones por la intervención, la media de sus diferencias es igual a 0. • H1: el valor de la variable a estudio sufre modificaciones por la intervención, la media de sus diferencias es diferente a 0. Como no se conoce la varianza teórica, se estimará c on la misma muestra (S 2d). De esta forma, el cociente: = ̅ √2 Sigue una t de Student con ( n - 1) grados de libertad bajo la hipótesis nula, siempre que la distribución original de las diferencias siga la Ley Normal : = ̅ √2 Lo que permitirá dec idir entre una de las hipótesis con la técnica habitual: • Si t calculada es menor o igual que t de las tablas, se acepta H0. • Si t calculada es mayor que t de las tablas, se acepta H1, con un riesgo α de equivocación. Iniciación a la investigación educativa Tema 1 6. Contraste de hipótesis y comparación de medias 12 © Copyright Universidad Europea. Todos los derechos reservados. 9. Comparación de dos medias para distribuciones no paramétricas Cuando se comparan dos medias, siempre hay que comprobar el supuesto de normalidad de las muestras mediante las pruebas de normalidad de Kolmogorov - Smirnov o Shapiro -Wilk (para muestras pequeñas). Si dan valores de significac ión menores o iguales a 0,05, la distribución no sigue la Ley Normal y entonces, para hacer la comparación de dos medias, hay que utilizar pruebas no paramétricas . Las pruebas no paramétricas utilizadas son la prueba U de Mann - Whitney, cuando las medias proceden de dos muestras independientes, y la prueba de Wilcoxon cuando las medias son de datos emparejados. El planteamiento de las hipótesis es el mismo y la selección de la misma lo resuelve el nivel de significación, que como anteriormente se cumplirá H0 si este nivel es mayor de 0,05 o H1 si en valor de la significación fuera mayor. 10. Comparación de medias: análisis de la varianza Mediante estas pruebas se compara la respuesta de una variable cuantitativa cuando actúa sobre ella una cualitativa con más de dos categorías. Es el caso de comprobar si el ejercicio físico practicado de forma intensa, moderada o nula influye en el peso de las personas, o bien el caso en el que se quiera evaluar el efecto de una determinada interven ción comparándola con el de otras intervenciones alternativas. • En el primer caso, la variable exposición es ordinal y la prueba de ANOVA aproxima al investigador a la correlación lineal. • En el segundo caso, la variable exposición es categórica . En todos estos casos, los grupos de comparación son tres o más. Supongamos que se quiere estudiar el efecto sobre el ejercicio físico que practican las personas en tres categorías: Nulo (0), moderado (1) e intenso (2) y su posible relación con el peso. Las hi pótesis planteadas son: • 0: 0= 1= 2 • 1: 0≠ 1≠ 2 Existen al menos dos medias diferentes. La prueba estadística que resuelve este problema es la prueba de ANOVA . No obstante, este tipo de cálculos resultan bastante engorrosos para realizarlos manua lmente y por ello, hoy en día se utilizan programas informáticos estadísticos como el SPSS o R. Iniciación a la investigación educativa Tema 1 6. Contraste de hipótesis y comparación de medias 13 © Copyright Universidad Europea. Todos los derechos reservados. 11. Resumen En este tema se ha tratado cómo una hipótesis, que es una solución tentativa a un problema observado en la práctica de un investigador, se transform a en una hipótesis estadística a través de la formulación de dos supuestos mutuamente excluyentes en los que se contrastan dos variables: la llamada independiente , que al aparecer actúa sobre la dependiente , provocando un cambio en su frecuencia. Las prueb as de significación siguen un planteamiento matemático que precisa de la interpretación de los valores de significación . Los diferentes tipos de errores que un investigador puede cometer al asumir un supuesto calculado a través de cálculos de probabilidad son: • Error tipo I. • Error tipo II. Cuando el investigador realiza el planteamiento tiene que tener en cuenta una serie de consideraciones, pues la comparación de las medias conlleva la variación de: • El número de muestras que se comparan. • Las muestras son in dependientes o emparejadas. • Las muestras siguen la distribución normal o, por el contrario, son no paramétricas. • Planteamiento claro de las hipótesis. • Resolución del problema a través de la significación alcanzada. Iniciación a la investigación educativa Tema 1 6. Contraste de hipótesis y comparación de medias 14 © Copyright Universidad Europea. Todos los derechos reservados. Referencias bibliográficas Álvarez, R. (2007). Estadística aplicada a las ciencias de la salud. Madrid: Díaz de Santos. Domenech, J. M. y Granero, R. (2007). Fundamentos de diseño y estadística. Barcelona: Signo. Flores, M. I. N. (2014). Las variables: Estructura y fu nción en la hipótesis. Investigación educativa, 11 (20), 163 -182. García, J. A., Reding, A., y López, J. C. (2013). Cálculo del tamaño de la muestra en investigación en educación médica. Investigación en educación médica, 2 (8), 217 - 224. Lara, A. M. (2000). Estadística para ciencias biológicas y ciencias ambientales: problemas y exámenes resueltos. Granada: Proyecto Sur. D. L. Martínez, M. Á. (2009). Bioestadística amigable. Madrid: Díaz de Santos. Miró, J. H. A. , Nieto, R. , Paredes, S. , y Baos, J. (2005). Va loración de la escala de dolor de caras -revisada (faces pain scale -revised ) para evaluar la intensidad del dolor pediátrico en niños castellano parlantes. Revista de la Sociedad Española del Dolor, 12, 407 -416. Sentís, J. (2003). Manual de bioestadística. Barcelona: Masson. Stahl, S., Másmela, L., y Rincón, W. (2015). La evolución de la distribución normal.

Comunicaciones en Estadística, 1 (1), 13 -32. Iniciación a la investigación educativa Tema 1 6. Contraste de hipótesis y comparación de medias 15 © Copyright Universidad Europea. Todos los derechos reservados. © Todos los derechos de propiedad intelectual de esta obra pertenecen en exclusiva a la Universidad Europea de Madrid, S.L.U. Queda terminantemente prohibida la reproducción, puesta a disposición del público y en general cualquier otra forma de explotación de toda o parte de la misma. La utilización no autorizada de esta obra, así como los perjuicios ocasionados en los derechos de propiedad intelectual e industrial de la Universidad Europea de Madrid, S.L.U., darán lugar al ejercicio de las acciones que legalmente le correspondan y, en su caso, a las responsabilidades que de dicho ejercicio s e deriven.