INTRODUCCION A LOS CONTRASTES DE HIPOTESIS

Tamaño: px
Comenzar la demostración a partir de la página:

Download "INTRODUCCION A LOS CONTRASTES DE HIPOTESIS"

Transcripción

1 x N(µ 0, σ n ) 1- α x N(µ a, σn ) x µ µ 0 -a 0 µ 0 +a α β 1 β µ a INTRODUCCION A LOS CONTRASTES DE HIPOTESIS José Luis Vicente Villardón Departamento de Estadística Universidad de Salamanca

2 INDICE 0.- INTRODUCCIÓN Y MOTIVACIÓN CONCEPTOS GENERALES DE CONTRASTE EL CONTRASTE PARA LA MEDIA DE UNA POBLACIÓN NORMAL PLANTEAMIENTO GENERAL VARIANZA (DESVIACIÓN TÍPICA) CONOCIDA LA POTENCIA DEL CONTRASTE EL P-VALOR DEL CONTRASTE LOS CONTRASTES UNILATERALES VARIANZA DESCONOCIDA CONTRASTES PARA MUESTRAS GRANDES EL CONTRASTE PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES NORMALES CON DATOS INDEPENDIENTES PLANTEAMIENTO GENERAL VARIANZAS CONOCIDAS VARIANZAS DESCONOCIDAS PERO IGUALES VARIANZAS DESCONOCIDAS Y DISTINTAS CONTRASTES DE COMPARACIÓN DE MEDIAS PARA MUESTRAS GRANDES OBTENCIÓN DE DATOS PARA LA COMPARACIÓN DE MEDIAS EL CONTRASTE PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES NORMALES CON DATOS APAREADOS ARBOL DE DECISIONES PARA LA COMPARACIÓN DE MEDIAS DE DOS POBLACIONES NORMALES CONTRASTES PARA LA COMPARACIÓN DE LA TENDENCIA CENTRAL CUANDO LAS POBLACIONES NO SON NORMALES COMPARACIÓN DE MEDIANAS DE DOS POBLACIONES CON DATOS INDEPENDIENTES: EL CONTRASTE U DE MANN-WITHNEY COMPARACIÓN DE MEDIANAS DE DOS POBLACIONES CON DATOS APAREADOS: EL TEST DE WILCOXON COMPARACIÓN DE VARIAS POBLACIONES. INTRODUCCIÓN AL PROBLEMA DE LAS COMPARACIONES MÚLTIPLES VALIDACIÓN DE LAS HIPÓTESIS DE PARTIDA...40

3 0.- INTRODUCCIÓN Y MOTIVACIÓN Antes de comenzar con el desarrollo del tema se supone que el lector conoce los conceptos fundamentales de muestreo, los principales estimadores de los parámetros de distribuciones normales y sus correspondientes distribuciones muestrales. Trataremos de explicar alguna de las ideas generales impòrtantes para pasar despues a la explicación de algunos de los contrastes más habituales en la práctica. Comenzaremos ilustrando las ideas generales sobre el contraste más simple, el de la media de una población normal, para ir extendiendo progresivamente las ideas a dos poblaciones, a la comparación de proporciones y a las poblaciones no normales. Analizaremos la problemática de realizar un número elevado de contrastes sobre el mismo conjunto de datos, y extenderemos las ideas fundamentales al diseño de experimentos con varios grupos experimentales. 1.- CONCEPTOS GENERALES DE CONTRASTE Una hipótesis estadística es una afirmación que se hace acerca de una o varias características de una población. Las características pueden ser los parámetros de una distribución de probabilidad predeterminada, seleccionada para la población. En este caso hablaremos de hipótesis paramétricas. En algunas situaciones las características a estudiar no son parámetros de una distibucion concreta y decimos que las hipótesis son no paramétricas. Un contraste de hipótesis es un procedimiento para decidir si una hipótesis se acepta como válida o se rechaza. Dos son las hipótesis que generalmente se contrastan, la que denominamos hipótesis nula (H 0 ) que es la hipótesis en la que se basa el procedimeineto de contraste, y la que denominamos hipótesis alternativa (H a ) que es la hipótesis que se acepta cuando se rechaza la nula y viceversa. Generalmente la hipótesis nula está formada por un único valor del parámetro mientras que la hipótesis alternativa está formada por un conjunto de valores. A la hipótesis alternativa se la denomina también hipótesis de trabajo o hipótesis a investigar ya que, en la mayor parte de las situaciones practicas reales es la hipótesis alternativa la que se desea aceptar. Para realizar el contraste de una hipótesis seleccionamos una muestra aleatoria de la población y trataremos de tomar una decisión de acuerdo con la información que nos proporcionan los

4 valores muestrales, a través de una estimación de la característica (parámetro) a estudiar y de su distribución muestral. Denominaremos estadígrafo o estadistico de contraste a una variable aleatoria con distribución conocida cuando la hipótesis nula es cierta. La variable aletoria es una transformación directa de la distribución muestral. Obviamente, la única forma de estar seguros de cual es la hipótesis correcta sería investigar toda la población, cosa que no es posible ya que, en general, estamos trabajando con poblaciones infinitas. Como disponemos de la información limitada que nos proporciona la muestra podemos realizar decisiones erróneas. Dos son los tipos de errores que podemos cometer: Error de tipo I: Rechazar H 0 cuando es verdadera. Error de tipo II: Aceptar H 0 cuando es falsa. A la probabilidad de cometer un error de tipo I la denominaremos nivel de significación y la denotaremos con α. A la probabilidad de cometer un error de tipo II la denotaremos con β a su complemento 1-β lo denominamos potencia del contraste, y se define como la probabilidad de rechazar cuando es falsa. Seleccionaremos, si es posible, aquel procedimiento de contraste en el que los errores sean lo más pequeños posible. Desgraciadamente, ambos covarian de forma inversa, es decir, cuando α aumenta β disminuye y viceversa. Como no es posible fijar ambos, se toma como norma fijar el nivel de significación para realizar el contraste. Explicaremos estos conceptos con más detalle en el capítulo siguiente. Utilizando un α fijo dividimos los valores del estdígrafo de contraste en dos regiones mutuamente excluyentes: La región de aceptación: Conjunto de valores del estadígrafo de contraste que nos llevan a aceptar la hipótesis nula. La región crítica: Conjunto de valores del estadígrafo de contraste que nos llevan a rechazar la hipótesis nula (y aceptar la alternativa). De acuerdo con lo explicado, los pasos que se han de realizar `para llevar a cabo un contraste de hipótesis son los siguientes: - Determinar las hipótesis nula y alternativa, traduciendo hipótesis básicas de trabajo en hipótesis acerca de parámetros (o características) de una distribución de probabilidad asignada a la población. - Fijar un nivel de significación: Generalmente el 0.05 (5%) y 0.01 (1%). - Determinar cual es el estadígrafo de contraste y su distribución muestral. - Determinar la región crítica y la región de aceptación. - Seleccionar una muestra y calcular el valor experimental del estadísgrafo de contraste. - Tomar la decisión estadística de acuerdo con el valor experimental obtenido. - Sacar conclusiones de tipo no estadistico.

5 Los procedimientos de contraste pueden diseñarse tambien utilizando alguna media de la discrepancia o de la similitud entre el valor teórico de la hipótesis nula y el valor estimado a partir de la muestra, la hipótesis se rechaza cuando la discrepencia es muy grande. Este tipo de medida se denomina p-valor y se explicará detalladamente más adelante..- EL CONTRASTE PARA LA MEDIA DE UNA POBLACIÓN NORMAL.1.- Planteamiento general Consideremos un caso muy simple mediante un ejemplo concreto. Supongamos que pertenecemos al consejo regulador de la denominación de origen de los vinos de Ribera de Duero. Sabemos que los vinos jóvenes de años anteriores tienen un grado alcohólico medio de 1.5 grados, tal y como aparece en la etiqueta. Para el año actual, el consejo regulador, de acuerdo con todos sus miembros, ha decidido cambiar algunos de los pasos del proceso de fabricación. El primer problema que se plantea es : Se ha modificado el grado alcohólico al modificar el proceso de fabricación?. La definición del problema a estudiar nos permite determinar la población que queremos estudiar, los vinos jóvenes de ribera de Duero en el año actual; la variable que queremos medir, el grado alcohólico de los mismos, y la hipótesis de trabajo inicial Se ha modificado el grado alcohólico?. El paso siguiente consiste en suponer un modelo de comportamiento teórico para la población (a priori). Suponemos que la variable que estamos midiendo en la población a estudiar sigue una distribución normal. La suposición de normalidad la haremos de acuerdo con el conocimiento previo que tengamos sobre la población objeto de estudio tratando de que las características de la distribución reflejen en la mayor medida posible las de la población, se trata simplemente de buscar un modelo probabilístico que aproxime la variable a estudiar. En el caso que nos ocupa, parece razonable suponer, a priori, que el grado alcohólico se concentra de forma simétrica alrededor de un valor medio. Si consideráramos, por ejemplo, los salarios de una empresa la hipótesis de normalidad no es plausible puesto que cabe esperar que la distribución de los mismos sea marcadamente asimétrica debido a los altos salarios de un grupo reducido de ejecutivos.

6 Formularemos ahora la hipótesis de trabajo en términos de los parámetros del modelo (media y/o desviación típica en el caso de la normal). La hipótesis principal la denominamos hipótesis nula (H 0 ). H 0 = µ = µ 0 =1.5 La hipótesis nula suele ser la de igualdad del parámetro a un único valor concreto µ 0 procedente de la hipótesis de trabajo. Junto con la hipótesis nula planteamos la que denominamos hipótesis alternativa (H a o H 1 ) que será aceptada cuando se rechace la nula y viceversa. Por el momento tomaremos la más sencilla, la hipótesis e que la media es diferente de 1 que resultará en un contraste bilateral. H a = µ µ 0 = 1.5 Trataremos de diseñar un procedimiento para decidir entre ambas hipótesis a partir de la información contenida en una muestra de tamaño n, por ejemplo 14 observaciones. Supongamos que la muestra ha sido seleccionada al azar de la población y que se han obtenido los resultados siguientes. RIBERA DE DUERO 1,8 1,8 1,5 11,9 1,5 1,1 1, 1,6 13,0 1,4 1,6 1, 1,8 13,0 Tabla 1: Grado alcohólico de 14 vinos de la denominación de Ribera de Duero. La primera cuestión que hemos de tener en cuenta es que la decisión por una hipótesis concreta ha de tomarse con un cierto riesgo de equivocarse al no disponer de la información de todos los individuos de la población. Trabajaremos con la media muestral como estimador de la media poblacional desconocida. En el ejemplo la media muestral es de 1,59, que como ya sabemos no coincide con la media poblacional. Trataremos de decidir entre las dos hipótesis a partir del valor de la media muestral pero, si la media muestral no coincide con la media poblacional, será la diferencia entre el valor observado y el teórico lo suficientemente grande como para rechazar la hipótesis nula? ó la diferencia observada es lo suficientemente pequeña como para ser debida simplemente al azar o al desconocimiento de la población?. Daremos respuesta a ambas preguntas utilizando los conceptos sobre distribuciones aprendidos en temas anteriores.

7 ..- Varianza (desviación típica) conocida Supondremos, por el momento, que la varianza de la población es σ = 0. 5 conocida. Sabemos que la media muestral para distintas muestras sigue una distribución normal N(µ, σ ), luego, cuando la hipótesis nula es cierta n σ x N( µ 0, n ) En la práctica, este resultado tiene implicaciones importantes. Veámoslo con un dibujo. x N(µ 0, σn ) µ 0 x Figura 3 : Distribución de la media muestral. El dibujo muestra como, aunque los valores de la media muestral no coinciden con la media poblacional, se concentran en torno a ella y por tanto es muy probable que sean cercanos aunque, con el modelo supuesto puede tomar cualquier valor. Obsérvese también que cuanto mayor es el tamaño muestral más se concentran los valores de la media muestral en torno a la media poblacional. Intuitivamente, aceptaremos la hipótesis nula cuando la media muestral sea próxima a µ 0 y la rechazaremos (aceptando la alternativa) cuando la media muestral sea muy diferente de µ 0, es decir, utilizamos la media muestral como estadístico, o estadígrafo, de contraste. Nos queda por determinar cual es el criterio para decidir si la media muestral está próxima o no al valor teórico propuesto utilizando el concepto de riesgo tipo I definido previamente. Fijamos el riesgo tipo Y en α (por ejemplo en 0.05 o el 5%)

8 Nos plantearemos el contraste como un juicio en el que la media muestral es inocente (procede de una población con media µ 0 ) y no la declararemos culpable (no procede de una población con media µ 0 ) hasta que no se demuestre claramente lo contrario. Sobre la distribución de la media seleccionamos dos puntos µ 0 a y µ 0 + a, simétricos alrededor de µ 0 de forma que si la hipótesis nula cierta en el (1-α)100% (por ejemplo el 95%) de las muestras la media muestral esté entre esos dos valores (figura 4). P( µ 0 a x µ 0 + a) = 1 α Aceptaremos la hipótesis nula si la media muestral está dentro del intervalo seleccionado y la rechazaremos en caso contrario. Es claro que si la media está fuera del intervalo seleccionado hay una clara evidencia de que la hipótesis no es cierta ya que toma los valores correspondientes solo en el 5% de los casos en los que la hipótesis nula es cierta. Por supuesto, estamos asumiendo un riesgo del 5% de equivocarnos y rechazar indebidamente. Como ya es conocido, al conjunto de valores que nos llevan a aceptar la hipótesis nula lo denominamos Región de Aceptación, y al conjunto de valores que nos llevan a rechazarla lo denominaremos Región Crítica. En este caso la región crítica se ha dividido en las dos colas de la distribución por lo que se dice que el contraste es bilateral o de dos colas. x N(µ 0, σn ) α/ = α=0.95 α/ = 0.05 µ 0 -a µ 0 µ 0 +a x Región crítica Región de Aceptación Región crítica Figura 4: Procedimiento de contraste a partir de la media muestral

9 En la práctica no se trabaja directamente con la media muestral y su distribución asociada sino con la distribución normal estándar. Teniendo en cuenta las propiedades de la normal podemos escribir P( µ 0 a x µ 0 + a) = P( z α/ x µ 0 σ n z α/ ) = 1 α de forma que el procedimiento descrito se convierte ahora en el que se muestra en la figura 5. El estadígrafo de contraste es ahora x µ 0 σ n y mide la discrepancia entre el valor observado de la media y el valor teórico de la misma, en la escala de la desviación típica. No es lo mismo una diferencia de una unidad en una escala de centímetros que en una escala de kilómetros. x µ 0 σ n N(0, 1) 1-α=0.95 α/ = 0.05 α/ = z α/ 0 z α/ x µ 0 σ n Región crítica Región de Aceptación Región crítica Figura 4: Procedimiento de contraste a partir de la media muestral estandarizada. La interpretación intuitiva del nuevo procedimiento sigue siendo clara, rechazaremos la hipótesis nula solamente cuando la discrepancia entre la media observada y la teórica ( x µ 0 ) sea grande, en relación a la variabilidad intrínseca medida por σ. La magnitud de la diferencia n necesaria para rechazar se determina a través del riesgo de tipo 1 mediante la distribución normal estándar.

10 A los valores de z α/ se les suele denominar valores críticos ya que determinan la frontera entre la región crítica y la región de aceptación. El cuadro siguiente muestra el procedimiento completo con los pasos que se siguen habitualmente en la construcción de cualquier contraste. HIPOTESIS: H 0 : µ = µ 0 H a :µ µ 0 NIVEL DE SIGNIFICACION: α ESTADIGRAFO DE CONTRASTE: Z = x µ 0 σ n DISTRIBUCION DEL ESTADIGRAFO CUANDO H { } REGION CRITICA : { Z / Z > z α/ } REGION DE ACEPTACION : Z / Z z α/ 0 ES CIERTA: N(0,1) Cuadro : Contraste para la media de una población normal con varianza conocida. Una vez que hemos determinado la forma general del contraste pasamos a aplicarlo a los datos del problema inicial que nos ocupa. Hipótesis: Nivel de significación: 5% y 1%. H 0 : µ = 1.5 H a :µ 1.5 Estadígrafo de contraste: Z = x µ = = 0.17 σ 0.5 n 14 Valores críticos : para el 5% z 0.05 = 1,96 para el 1% z =,57 Decisión estadística: El valor del estadígrafo de contraste pertenece a la región de aceptación, por tanto aceptamos la hipótesis nula. Conclusión no estadística: La modificación en el proceso de fabricación no ha modificado significativamente el grado alcohólico. Cuadro 3: Aplicación del contraste para la media de una población normal con varianza conocida al problema de la modificación en el grado alcohólico del vino de Ribera de Duero. Una vez que hemos tomado la decisión final, no sabemos si es correcta o no, simplemente

11 esperamos que sea del 95% de las muestras en las que aceptamos la hipótesis correctamente. Si aceptamos la hipótesis nula no quiere decir que sea cierta y el grado medio sea exactamente de 1.5 grados (probablemente no lo es), sería más correcto interpretar que, con la información de la que disponemos no hemos encontrado evidencia suficiente de que la media sea distinta de 1.5. Evidentemente, los valores muestrales son compatibles con muchos otros posibles valores teóricos. Si aumentamos el tamaño de muestra indefinidamente, la variabilidad de la media sería cada vez menor y conseguiríamos que la pequeña diferencia observada sea lo suficientemente grande como para considerarla significativa. Es por esto por lo que en Estadística decimos que es tan malo tener un tamaño de muestra demasiado alto como tenerlo demasiado bajo ya que en el primer caso cualquier pequeña diferencia es considerada como significativa mientras que en el segundo no se declara significación incluso en el caso en el que la diferencia sea elevada..3.- La potencia del contraste En todo el proceso descrito hasta el momento solamente se ha utilizado el riesgo de tipo I en el desarrollo del contraste. Sabemos que esta asociado con el riesgo de tipo II de forma que cuando uno aumenta, el otro disminuye. Tampoco hemos hecho ninguna afirmación acerca de un concepto importante como es el de potencia del contraste (probabilidad de rechazar la hipótesis nula cuando es falsa). No es posible calcular la potencia del contraste porque para ello necesitaríamos un único valor en la hipótesis alternativa (revísese el ejemplo de los cirróticos utilizado como aplicación de la distribución normal), aunque si podemos realizar el cálculo para distintos valores en la alternativa (función de potencia) y analizar lo que ocurre. Veámoslo con un ejemplo. Cual sería la potencia del contraste obtenido para detectar que la media no es 1.5 si en realidad la media fuera 13 (y suponiendo un nivel de significación del 5%). En términos de la media muestral el procedimiento de contraste consiste en aceptar la hipótesis nula si la media muestral está entre 1.38 y La probabilidad de cometer un error de tipo (aceptar indebidamente) si la media real fuera de 13 se podría calcular como

12 P(1.38 X 1.76) en una normal de media 13 y desviación típica probabilidad es de forma que la potencia es esquematizada aparece en la figura Esta = La situación x N(µ 0, σ n ) 1- α x N(µ a, σn ) x µ µ 0 -a 0 µ 0 +a µ a α β 1 β Figura 5: Cálculo de la potencia del contraste para una alternativa predeterminada. En la figura 6 se muestra la función de potencia para distintos valores posibles de la hipótesis alternativa. 1,1 1,9,8,7 Potencia,6,5,4,3,,1 0 11,5 11,75 1 1,5 1,5 1, ,5 13,5 alternativa Figura 6: Función de potencia para distintos valores de la alternativa.

13 El gráfico muestra como la potencia es mayor cuando los valores de la alternativa se alejan del valor para la hipótesis nula. En la práctica este hecho tiene una implicación obvia: es más fácil detectar diferencias o efectos experimentales de gran magnitud. Aunque no es posible un control directo de la potencia, a la vista de la figura 5 es claro que la potencia puede modificarse modificando el nivel de significación o el tamaño muestral ya que la forma de las curvas depende de éste. Cuanto mayor sea el tamaño muestral más concentrada es la curva normal y, por tanto, mayor es la potencia para el mismo nivel de significación. En la práctica suele hacerse un estudio de potencia para los contrastes no significativos, calculando cual sería el tamaño muestral necesario para que la diferencia observada en los datos sea significativa. Si este tamaño es muy grande es difícil declarar la significación por lo que consideraremos que estamos haciendo lo correcto, si el tamaño muestral necesario es pequeño, sería conveniente revisar el experimento. El cálculo es muy simple cuando se trabaja con distribuciones normales. La hipótesis nula se rechaza cuando valor de n será x µ 0 σ n > z α/ de forma que, para que la diferencia sea significativa el n > z α/ σ x µ 0 para el ejemplo del grado alcohólico, n> 1141,97, es decir, para que la diferencia observada fuera significativa tendríamos que haber recogido más de 114 observaciones lo que da una idea de que la diferencia observada es muy pequeña y, por tanto es muy probable que la hipótesis nula sea cierta..4.- El p-valor del contraste Una forma habitual de medir la significación en los contrastes de hipótesis es el denominado p- valor del contraste. Su utilización en la investigación aplicada es debida a que es la forma de presentación de los resultados de un contraste usada por la mayor parte de los programas de ordenador.

14 Se puede definir el p-valor de un contraste como la probabilidad de obtener un valor muestral más extremo que el obtenido en nuestro caso particular (cuando H0 es cierta). Si el p-valor es muy pequeño rechazaremos la hipótesis nula ya que el valor experimental es muy extremo, mientras que si el p-valor es grande aceptaremos la hipótesis nula ya que el valor es compatible con la misma. De forma general, el p-valor para el contraste actual se puede calcular como P( Z > x µ 0 σ n ) en una distribución normal estándar. Para el ejemplo anterior el p-valor es 1-P(-0.17 < Z < 0.17) = P(Z > 0.17) = 0.885, es decir el p-valor puede considerarse grande. En la práctica se suele adoptar el criterio de aceptar la hipótesis cuando el p-valor es mayor que el nivel de significación fijado en el procedimiento de contraste. p-valor x µ 0 σ n N(0, 1) -z α/ 0 z α/ ± Z exp erimental Región crítica Región de Aceptación Región crítica Figura 7: El p-valor de un contraste bilateral..5.- Los contrastes unilaterales En algunas situaciones concretas no estamos interesados en todos los posibles valores de la hipótesis alternativa propuesta en un contraste bilateral. Supongamos, por ejemplo, que en el caso práctico anterior sospechamos a priori que la modificación en el procedimiento de

15 fabricación produce un incremento en el contenido alcohólico. En este caso sería conveniente modificar la hipótesis alternativa para que sea de la forma H a :µ > µ 0. El procedimiento de contraste es muy similar al anterior y se muestra en el cuadro siguiente. H 0 : µ = µ 0 HIPOTESIS: H a :µ > µ 0 NIVEL DE SIGNIFICACION: α ESTADIGRAFO DE CONTRASTE: Z = x µ 0 σ n DISTRIBUCION DEL ESTADIGRAFO CUANDO H 0 { } { } REGION DE ACEPTACION : Z / Z z α REGION CRITICA : Z / Z > z α ES CIERTA: N(0,1) Cuadro 4: Contraste unilateral superior para la media de una población normal con varianza conocida. El contraste así obtenido se denomina contraste unilateral superior ya que solo estamos interesados en las desviaciones positivas. La diferencia fundamental con el contraste bilateral es que se produce un incremento en la potencia para detectar diferencias positivas de la hipótesis nula y un decremento drástico para detectar las negativas. El p-valor sigue teniendo la misma interpretación aunque ahora se calcula como P(Z > x µ 0 σ n ). x µ 0 σ n N(0, 1) p-valor 0 z α Z exp erimental Figura 8: El p-valor de un contraste unilateral superior.

16 De la misma manera que se ha construido el contraste unilateral superior es posible construir el contraste unilateral inferior si estamos interesados exclusivamente en detectar diferencias negativas con respecto a la hipótesis nula. La construcción del contraste es completamente análoga con la correspondiente modificación de la hipótesis alternativa. El contraste unilateral inferior incrementa la potencia para detectar diferencias negativas aunque no tiene potencia para detectar las positivas. H 0 : µ = µ 0 HIPOTESIS: H a :µ < µ 0 NIVEL DE SIGNIFICACION: α ESTADIGRAFO DE CONTRASTE: Z = x µ 0 σ n DISTRIBUCION DEL ESTADIGRAFO CUANDO H 0 { } { } REGION DE ACEPTACION : Z / Z z α REGION CRITICA : Z / Z < z α p-valor: P(Z < x µ 0 σ n ) ES CIERTA: N(0,1) Cuadro 5: Contraste unilateral inferior para la media de una población normal con varianza conocida. x µ 0 σ n N(0, 1) p-valor -z α 0 Z exp erimental Figura 9: El p-valor de un contraste unilateral inferior. La decisión por el tipo de contraste debe hacerse a priori, antes de tomar los datos. Supongamos, por ejemplo, que sospechamos, antes de realizar el experimento, que la modificación en el proceso de fabricación, aumenta el grado alcohólico. El procedimiento de

17 contraste para los datos de la tabla 1 se muestra en el cuadro siguiente Hipótesis: H 0 : µ = 1. 5 H a :µ >1. 5 Nivel de significación: 5% y 1%. Estadígrafo de contraste: Z = x µ 0 σ n = La función de potencia para distintos valores de la alternativa aparece en la figura siguiente. Obsérvese como el contraste no tiene ninguna potencia para detectar valores a la izquierda de la hipótesis nula = Valores críticos : para el 5% z 0.05 = 1,65 para el 1% z =,33 p-valor: Decisión estadística: El valor del estadígrafo de contraste pertenece a la región de aceptación, por tanto aceptamos la hipótesis nula. Conclusión no estadística: La modificación en el proceso de fabricación no ha aumentado significativamente el grado alcohólico. Cuadro 6: Aplicación del contraste para la media de una población normal con varianza conocida al problema de la modificación en el grado alcohólico del vino de Ribera de Duero 1, 1,8 Potencia(uni),6,4, 0 -, 11,5 11,5 11,75 1 1,5 1,5 1, ,5 13,5 alternativa Figura 10: Función de potencia para un contraste unilateral superior.

18 .6.- Varianza desconocida En la mayor parte de las aplicaciones prácticas la varianza de la distribución es también desconocida y ha de ser estimada a partir de los datos. El problema es que ya no es posible seguir utilizando la distribución normal para el procedimiento de contraste ya que es necesario eliminar el parámetro σ del estadígrafo de contraste. De acuerdo con la teoría, además de la distribución muestral de la media sabemos que (n 1) S ˆ σ sigue una distribución ji-cuadrado con n-1 grados de libertad. Si suponemos que media y varianza son independientes 1, es posible combinar las correspondientes distribuciones muestrales para obtener una distribución t de Student y eliminar el parámetro σ. Utilizando la definición de distribución t de Student con n-1 grados de libertad como el cociente entre una normal estándar y la raíz cuadrada de una ji-cuadrado con n-1 grados de libertad dividida por sus grados de libertad, y ambas independientes, obtenemos que la variable aleatoria t = x µ 0 σ n (n 1) ˆ S σ (n 1) = x µ 0 S ˆ n sigue una distribución t de Student con n-1 grados de libertad. El procedimiento de contraste en este caso es análogo al anterior pero sustituyendo la distribución normal por la distribución t. El cuadro 6 muestra el procedimiento de contraste completo. 1

19 HIPOTESIS H 0 : µ = µ 0 H a :µ µ 0 NIVEL DE SIGNIFICACION: α ESTADIGRAFO DE CONTRASTE: t = x µ 0 ˆ S n DISTRIBUCION DEL ESTADIGRAFO CUANDO LA HIPOTESIS NULA ES CIERTA: t n-1 { } REGION DE ACEPTACION : t / t t n 1,α REGION CRITICA : { t / t > t n 1,α } Cuadro 6: Contraste para la media de una población normal con varianza desconocida. En la práctica, la sustitución de la distribución normal por la distribución t de Student implica un aumento de la dispersión por lo que es más difícil detectar diferencias. La situación se muestra el la figura siguiente en la que se comparan la distribución normal estándar (en línea discontinua) y la distribución t (en línea continua). t = x µ 0 ^ S n α/ t n 1 1 α α/ -t 0 α tα Figura 11: Diferencia entra la distribución normal y la distribución t de Student. Es posible construir contrastes unilaterales de la misma manera que en el caso de varianza conocida. El cuadro 7 muestra el contraste unilateral superior, el contraste unilateral inferior se deja como ejercicio al lector. t n-1,α es el valor crítico de la t de Student tal que P(-t n-1,α t n-1 t n-1,α ) = 1-α. Se ha denotado con el α

20 H 0 : µ = µ 0 HIPOTESIS: H a :µ > µ 0 NIVEL DE SIGNIFICACION: α ESTADIGRAFO DE CONTRASTE: t = x µ 0 ˆ S n DISTRIBUCION DEL ESTADIGRAFO CUANDO H 0 ES CIERTA: t n-1 { } 3 REGION DE ACEPTACION : t / t t n 1,α REGION CRITICA : { t / t > t n 1,α } Cuadro 7: Contraste para la media de una población normal con varianza desconocida. Para el ejemplo del grado alcohólico de los vinos de la denominación de origen de Ribera de Duero los resultados del contraste bilateral se muestran en el cuadro 8. Nivel de significación: 5% y 1%. Hipótesis: H 0 : µ = 1.5 H a :µ 1.5 Estadígrafo de contraste: t = x µ = = S ˆ n 14 Valores críticos : para el 5% t 18, =.101 para el 1% t 18, =.878 p-valor : 0,7571 Decisión estadística: El valor del estadígrafo de contraste pertenece a la región de aceptación, por tanto aceptamos la hipótesis nula. Conclusión no estadística: La modificación en el proceso de fabricación no ha modificado significativamente el grado alcohólico. Cuadro 8: Aplicación del contraste para la media de una población normal con varianza desconocida al problema de la modificación en el grado alcohólico del vino de Ribera de Duero Todos los conceptos explicados para el contraste de la media de una población normal con varianza conocida siguen siendo válidos aquí. 3 t n-1, α es el valor crítico de la t de Student tal que P( t n-1 > t n-1,α ) = α. Se ha denotado con el subíndice α

21 .7.- Contrastes para muestras grandes Cuando las muestras de las que se dispone son muestras grandes (aproximadamente mayores de 30 observaciones) es posible utilizar directamente la distribución normal ya que es muy similar a la t de Student. Además el teorema central del límite permite relajar la hipótesis de normalidad ya que la normalidad de la distribución muestral de medias está garantizada, bajo ciertas condiciones de regularidad, aunque la población original no sea normal. Hay que tener en cuenta que se trata sólo de una aproximación y, cuanto mayor es el tamaño de la muestra mejor es la aproximación normal obtenida. El procedimiento de contraste para muestras grandes se muestra en el cuadro 9. Mostramos solamente el contraste bilateral ya que los unilaterales se construyen exactamente de la misma manera que en los casos anteriores. HIPOTESIS: H 0 : µ = µ 0 H a :µ µ 0 NIVEL DE SIGNIFICACION: α ESTADIGRAFO DE CONTRASTE: Z = x µ 0 S ˆ n DISTRIBUCION DEL ESTADIGRAFO CUANDO LA HIPOTESIS NULA ES CIERTA: N(0, 1) { } REGION CRITICA : { Z / Z > z α/ } REGION DE ACEPTACION : Z / Z z α/ Cuadro 9: Contraste para la media de una población normal con varianza desconocida cuando la muestra es grande.

22 3.- EL CONTRASTE PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES NORMALES CON DATOS INDEPENDIENTES Planteamiento general En la investigación aplicada la situación más habitual es aquella en la que se quieren comparar dos poblaciones a las que se les ha aplicado, por ejemplo, dos tratamientos diferentes. Pongámonos en el mismo supuesto que en el ejemplo que sirvió para ilustrar el contraste para una población, y supongamos que lo que deseamos es conocer si los vinos de nuestra denominación de origen tienen el mismo contenido alcohólico que los de otra denominación de origen, por ejemplo la de Toro. Se trata de saber si existe una clara diferenciación en los mismos ya que, debido a la proximidad geográfica de ambas regiones, es posible que haya fraudes y se intercambien vinos de ambas dependiendo del mercado de los mismos. La hipótesis de trabajo inicial es entonces Existen diferencias en el grado alcohólico de ambas denominaciones?. Procediendo de la misma manera que en el caso de una población, suponemos una distribución de probabilidad para la población que es la distribución normal. En la primera población (Ribera de Duero) el grado alcohólico sigue una distribución normal N(µ 1, σ 1 ); en la segunda población (Toro) el grado alcohólico sigue una distribución normal N(µ, σ ). Formulamos a continuación las hipótesis de trabajo en términos de los parámetros de los modelos. Las hipótesis nula y alternativa son ahora H 0 : µ 1 = µ (µ 1 µ = 0) H a :µ 1 µ (µ 1 µ 0) para el contraste bilateral. Vemos como el contraste de que las medias son iguales es equivalente al contraste de que la diferencia de medias vale 0. Supongamos que los datos obtenidos son los siguientes para muestras aleatorias de tamaño n 1 = 14 y n = 6.

23 Ribera de Duero 1,8 1,8 1,5 11,9 1,5 1,1 1, 1,6 13,0 1,4 1,6 1, 1,8 13,0 Toro 13,0 14,0 13, 13,4 13, 13,9 Tabla : Grado alcohólico de 0 vinos de las denominaciones de origen de Ribera y Toro. Se supone que las muestras se han obtenido de forma independiente en ambas denominaciones. La estadística descriptiva básica para ambos grupos aparece en la tabla siguiente. Descriptiva básica grado, Total grado, Ribera grado, Toro Media 1,805 1,59 13,450 Desv. Tip.,557,338,409 Error Estd.,14,090,167 n Minim0 11,900 11,900 13,000 Maximo 14,000 13,000 14,000 Tabla 3: Descriptiva básica del grado alcohólico. Una primera aproximación a las diferencias entre los dos grupos sería la construcción de gráficos comparativos que muestren la estructura de los mismos, por ejemplo, un Box-Plot con los grupos separados. 14, ,75 13,5 Box Plot Ribera Toro 13,5 13 1,75 1,5 1,5 1 11,75 grado Figura 1: Box plot para la comparación del grado alcohólico de las denominaciones de Ribera y Toro.

24 Una simple inspección visual del gráfico nos muestra que hay una clara diferencia entre los grados de ambas denominaciones, a pesar de que la diferencia muestral es muy evidente necesitamos un procedimiento más formal para establecer si las diferencias observadas pueden ser consideradas estadísticamente significativas. Construiremos el procedimiento de contraste en varios supuestos comenzando desde el más sencillo hasta los más complejos Varianzas conocidas Supongamos, para simplificar que las desviaciones típicas son conocidas, por ejemplo σ 1 = 0.5 y σ = 0.6 para las denominaciones de Ribera de Duero y Toro respectivamente. Desarrollaremos el procedimiento general para después aplicarlo a los datos de los que disponemos. Conocemos la distribución de la media muestral en ambas poblaciones. x 1 N(µ 1, x N(µ, σ 1 n 1 ) σ n ) y ambas distribuciones son independientes. El estimador de la diferencia de medias poblacionales será la diferencia de medias muestrales y, como la diferencia de normales independientes es también una distribución normal, tenemos que x 1 x N( µ 1 µ, σ 1 + σ ) n 1 n Estandarizando se obtiene que Z = ( x 1 x ) (µ 1 µ ) σ 1 + σ n 1 n N(0,1) Cuando la hipótesis nula es cierta µ 1 µ = 0 y se tiene que

25 Z = ( x 1 x ) σ 1 + σ n 1 n N(0,1) luego Z será el estadígrafo de contraste que utilizaremos. El procedimiento de contraste completo se muestra el cuadro 9. Solo se incluye el contraste bilateral ya que la construcción de los correspondientes unilaterales es la misma que en los casos previos y se deja como ejercicio al lector. H 0 : µ 1 = µ (µ 1 µ = 0) HIPOTESIS: H a :µ 1 µ (µ 1 µ 0) NIVEL DE SIGNIFICACION: α ESTADIGRAFO DE CONTRASTE: Z = ( x 1 x ) σ 1 + σ n 1 n DISTRIBUCION DEL ESTADIGRAFO CUANDO H 0 ES CIERTA: N(0, 1) { } { } REGION DE ACEPTACION : Z / Z z α/ REGION CRITICA : Z / Z > z α/ Cuadro 10: Contraste para la diferencia de medias de dos poblaciones normales con varianza conocida. Si aplicamos el contraste a los datos del ejemplo, obtenemos los resultados del cuadro 10. H 0 : µ 1 = µ (µ 1 µ = 0) HIPOTESIS: H a :µ 1 µ (µ 1 µ 0) NIVEL DE SIGNIFICACION: α= 0.05 (5%) ó 0.01 (1%) ( ) ESTADIGRAFO DE CONTRASTE: Z = = Valores críticos : para el 5% z 0.05 = 1,96 para el 1% z =,57 Decisión estadística: El valor del estadígrafo de contraste pertenece a la región crítica, por tanto rechazamos la hipótesis nula. Conclusión no estadística: Los grados alcohólicos medios de las dos denominaciones son diferentes. Cuadro 11: Contraste para la diferencia de medias de dos poblaciones normales con varianza desconocida aplicado al ejemplo de la comparación del grado alcohólico en dos denominaciones de origen.

26 3.3.- Varianzas desconocidas pero iguales Supongamos ahora que las varianzas son desconocidas pero iguales (σ 1 = distribución de la diferencia de medias muestrales es ahora σ = σ). La Z = ( x 1 x ) (µ 1 µ ) σ n 1 n N(0,1) Tenemos que eliminar el parámetro σ, para lo cual utilizaremos las distribuciones muestrales asociadas a las cuasi-varianzas muestrales (n 1 1) ˆ S 1 σ χ n1 1 y (n 1) ˆ S σ χ n 1 La suma de dos ji-cuadrado es también una ji-cuadrado, sumando las dos anteriores (n 1 1) ˆ S 1 σ + (n 1) ˆ S σ = (n 1 1) S ˆ 1 + (n 1) S ˆ σ χ n1 +n Suponiendo que ambas distribuciones son independientes 4, podemos combinarlas para obtener una distribución t de Student. La variable aleatoria t = (x 1 x ) (µ 1 µ ) σ n 1 n (n 1 1)ˆ S 1 + (n 1) S ˆ σ n 1 + n = (x 1 x ) (µ 1 µ ) S ˆ n 1 n con ˆ S = (n 1 1) S ˆ 1 + (n 1) S ˆ n 1 + n sigue una t de Student con n 1 + n - grados de

27 libertad. Si la hipótesis nula es cierta, el estadígrafo de contraste que utilizaremos es t = (x 1 x ) S ˆ n 1 n = t n1 +n Es posible considerar un estadígrafo de contraste alternativo si se utilizan las varianzas muestrales en lugar de las cuasi-varianzas. Para ello basta tener en cuenta que las distribuciones muestrales asociadas a las varianzas son n 1 S 1 σ χ n1 1 y n S σ χ n 1 El nuevo estadígrafo de contraste es de la forma t = (x 1 x ) S 1 n n = t n1 +n con S = n 1 S ˆ 1 + n S ˆ n 1 + n. Los dos estadísticos toman exactamente el mismo valor por lo que pueden utilizarse indistintamente. Usaremos el calculado a partir de las cuasi-varianzas porque son estimadores insesgados de la varianza poblacional. En ambos casos lo que se ha hecho es estimar la varianza común de ambas poblaciones mediante una media ponderada de las varianzas estimadas en cada población, y se ha cambiado la distribución normal por la t de Student con el correspondiente aumento en la dispersión que hace que sea más difícil encontrar diferencias. En este caso es necesario que las varianzas sean iguales para poder despejarlas y eliminarlas en el cálculo del estadígrafo de contraste. La comprobación de la igualdad de varianzas se hará 4 La demostración puede encontrarse en cualquier libro de Estadística Matemática. No se ha incluido aquí porque

28 posteriormente aunque sea un paso previo a la decisión del tipo de contraste. Las cuestiones relacionadas con la potencia del contraste se interpretan de la misma manera que en todos los casos anteriores. Cuanto mayor sea la diferencia que queremos detectar mayor será la potencia para detectarla. Cuanto más pequeño sea el efecto que queremos detectar mayor será el tamaño de muestra necesario para hacerlo. Si aumentamos indefinidamente el tamaño muestral conseguiremos que la diferencia muestral sea siempre estadísticamente significativa por pequeña que sea. El contraste completo se muestra en el cuadro siguiente. HIPOTESIS: H 0 : µ 1 = µ (µ 1 µ = 0) H a :µ 1 µ (µ 1 µ 0) NIVEL DE SIGNIFICACION: α ESTADIGRAFO DE CONTRASTE: t = (x 1 x ) S ˆ n 1 n ó t = (x 1 x ) S 1 n n con ˆ S = (n 1 1) S ˆ 1 + (n 1) S ˆ n 1 + n ó S = n 1 S ˆ 1 + n S ˆ n 1 + n DISTRIBUCION DEL ESTADIGRAFO CUANDO LA HIPOTESIS NULA ES CIERTA: t de Student t n1 +n { } { } REGION DE ACEPTACION : t / t t n1 +n,α REGION CRITICA : t / t > t n1 +n,α Cuadro 10: Contraste para la diferencia de medias de dos poblaciones normales con varianzas desconocidas pero iguales. El contraste se ha aplicado a los datos del ejemplo inicial y se han obtenido los siguientes resultados.

29 H 0 : µ 1 = µ (µ 1 µ = 0) HIPOTESIS: H a :µ 1 µ (µ 1 µ 0) NIVEL DE SIGNIFICACION: α= 0.05 (5%) ó 0.01 (1%) ( ) ESTADIGRAFO DE CONTRASTE: t = = Valores críticos : para el 5% t 18,0.05 =.101 para el 1% t 18,0.005 =.878 Decisión estadística: El valor del estadígrafo de contraste pertenece a la región crítica, por tanto rechazamos la hipótesis nula. Conclusión no estadística: El grado alcohólico es significativamente diferente en Ribera de Duero y Toro. Cuadro 11: Contraste para la diferencia de medias de dos poblaciones normales con varianzas desconocidas pero iguales, aplicado a los datos sobre el grado alcohólico Varianzas desconocidas y distintas Supongamos ahora que las varianzas son desconocidas y distintas (σ 1 σ ) de forma que ya no es posible eliminar el parámetro en el cálculo de la t de Student. Se han propuesto diversas aproximaciones para la aproximación de la distribución del estadígrafo de contraste. Describiremos aquí la aproximación de Welch. La demostración completa está fuera de los propósitos de este trabajo.

30 H 0 : µ 1 = µ (µ 1 µ = 0) HIPOTESIS: H a :µ 1 µ (µ 1 µ 0) NIVEL DE SIGNIFICACION: α ESTADIGRAFO DE CONTRASTE: t = (x 1 x ) S ˆ 1 S ˆ + n 1 n DISTRIBUCION DEL ESTADIGRAFO CUANDO LA HIPOTESIS NULA ES CIERTA: t de Student t f donde f es el entero más próximo a S ˆ 1 S ˆ + n 1 n f = S ˆ 1 S ˆ n 1 n n n + 1 REGION DE ACEPTACION : { t / t t f,α } REGION CRITICA : { t / t > t f,α } Cuadro 11: Contraste para la diferencia de medias de dos poblaciones normales con varianzas desconocidas y distintas Contrastes de comparación de medias para muestras grandes. Como ya se comentó para el caso de una única población, el teorema central del límite permite asignar distribuciones normales a las medias muestrales aunque la distribución en la población no sea normal. Si disponemos de una muestra de tamaño grande y estimamos la varianza poblacional a través de la cuasivarianza muestral, podemos construir un contraste aproximado de comparación de medias utilizando la distribución normal.

31 H 0 : µ 1 = µ (µ 1 µ = 0) HIPOTESIS: H a :µ 1 µ (µ 1 µ 0) NIVEL DE SIGNIFICACION: α ESTADIGRAFO DE CONTRASTE: t = (x 1 x ) S ˆ 1 S ˆ + n 1 n DISTRIBUCION DEL ESTADIGRAFO CUANDO LA HIPOTESIS NULA ES CIERTA: N(0,1) { } REGION CRITICA : { Z / Z > z α/ } REGION DE ACEPTACION : Z / Z z α/ Cuadro 1: Contraste para la diferencia de medias de dos poblaciones normales con varianzas desconocidas y tamaños muestrales grandes. Obsérvese que estamos suponiendo implícitamente que la cuasi-varianza muestral es un buen estimador de la varianza poblacional, próximo al verdadero valor Obtención de datos para la comparación de medias. Dos son los tipos de datos de los que es posible disponer para la comparación de las medias - Datos procedentes de estudios observacionales. - Datos procedentes de estudios experimentales. En el primer caso se toman muestras aleatorias en dos poblaciones. La muestra aleatoria garantiza la representatividad. A este tipo de datos corresponde el ejemplo que hemos utilizado como guía para la explicación. Los datos experimentales se corresponden con experimentos planificados en los que se asignan dos tratamientos distintos a un grupo de individuos. En este tipo de diseños es necesario que todas las características que no intervienen en el diseño y puedan modificar la respuesta, estén controlados y sean similares en los dos grupos a comparar. Por ejemplo, si se desea hacer un ensayo clínico en el que se dispone de un grupo de pacientes de forma que a un subconjunto se le aplicará el tratamiento a comparar y el resto será utilizado como control sobre el que se utilizará un placebo (substancia no activa) con la misma apariencia que el tratamiento, los pacientes de ambos grupos han de ser similares en composición con respecto a características

32 como la edad peso u otros factores que pudieran alterar la respuesta y que no intervienen directamente en el diseño. Se tratará de evitar sesgos de forma que los efectos puedan ser asignados a los tratamientos, por ejemplo, en un experimento con ratones de laboratorio en el que se dispone de dos camadas distintas, no sería correcto asignar un tratamiento diferente a cada una de las camadas ya que sería imposible separar los efectos del tratamiento y de la camada. En Estadística decimos que los tratamientos están confundidos. La forma de asignar tratamientos a individuos para que no existan errores sistemáticos es hacerlo al azar, por ejemplo, sorteando cual es el tratamiento que se aplica a cada individuo. A este procedimiento se le denomina aleatorización, y juega un papel fundamental en el diseño de experimentos planificados. Hay que hacer notar que al azar no significa de cualquier manera o cualquiera de los tratamientos, para conseguir una verdadera aleatorización es necesario utilizar la probabilidad. En los experimentos diseñados es muy importante realizar estudios previos sobre el tamaño de muestra necesario para detectar un determinado efecto. Este problema está fuera del alcance de un curso introductorio aunque las ideas básicas fueron expuestas cuando se trató con los intervalos de confianza. Este tipo de experimentos se comenzó en Agricultura para extenderse después a otras aplicaciones como la Industria o la Medicina. Actualmente los ensayos clínicos controlados, basados fundamentalmente en conceptos de Estadística, forman una parte importante de la investigación médica. Todo el mundo ha oído alguna vez en las noticias los resultados de ensayos clínicos controlados antes de lanzar al mercado un nuevo medicamento. 4.- EL CONTRASTE PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES NORMALES CON DATOS APAREADOS. En el caso de datos independientes en el punto anterior, se dispone de dos conjuntos distintos de individuos para cada una de las situaciones experimentales que se quiere compara. Una forma de controlar la variabilidad debida a los propios sujetos consiste en aplicar todos los tratamientos en estudio a todos los individuos de la muestra en dos ocasiones diferentes. A este tipo de datos lo denominaremos datos apareados, relacionados, o ligados y consisten en dos mediadas tomadas sobre el mismo conjunto d individuos en dos ocasiones diferentes. Para ilustrar los procedimientos utilizaremos datos tomados de MARTIN ANDRES y LUNA

33 CASTILLO (1990). Supongamos que deseamos saber si la presión sistólica de personas alcohólicas se modifica cuando dejan el hábito de beber, para ello se toma una muestra de 10 personas que ingresan en en el hospital para tratar su alcoholismo y se toma una medida de la presión sistólica antes y después de dos meses de haber dejado de beber. El experimento fue diseñado de esta manera ya que aunque se espera una reducción en la presión sanguínea, esta depende del valor inicial en cada individuo. Los resultados obtenidos para la presión sistólica mediada en milímetros de mercurio fueron los siguientes: Individuo Antes Después Reducción Como las variables están relacionadas, todos los cálculos que realizamos en el caso de datos independientes ya no son válidos. Para evitar este problema nos centraremos en una sola variable aleatoria que es la diferencia entre los dos valores obtenidos para cada uno de los individuos estudiados que mide el efecto del tratamiento aplicado. Tenemos ahora una nueva variable D que suponemos que tiene una distribución normal de media µ d desviación típica σ d. La hipótesis de interés es ahora que, en promedio, el tratamiento aplicado a los individuos es 0, es decir, µ d = 0. El contraste es ahora exactamente igual que el descrito para la media de una población normal (ahora la población de las diferencias. Describimos a continuación el contraste para muestras pequeñas y varianza desconocida para datos apareados. Llamaremos d, a la media muestral de las diferencias y ˆ S d a la cuasi desviación típica. El contraste se muestra en el cuadro??.

34 HIPOTESIS: H 0 : µ d = 0 H a :µ d 0 NIVEL DE SIGNIFICACION: α d ESTADIGRAFO DE CONTRASTE: t = S ˆ d n DISTRIBUCION DEL ESTADIGRAFO CUANDO H 0 ES CIERTA: t n-1 { } REGION DE ACEPTACION : t / t t n 1,α REGION CRITICA : { t / t > t n 1,α } Cuadro 6: Contraste para la diferencia de medias de dos poblaciones normales con datos apareados. El resto de los contrastes se construye de la misma manera que en el caso de una sola población. El cuadro?? muestra ejemplo. HIPOTESIS: H 0 : µ d = 0 H a :µ d 0 Nivel de significación: 5% y 1% ESTADIGRAFO DE CONTRASTE: t = =.50 DISTRIBUCION DEL ESTADIGRAFO CUANDO H 0 ES CIERTA: t 9 Valores críticos : para el 5% t 9, 0.05 =,6 para el 1% t 9, 0.01 = 3,50 p-valor : 0,0510 Decisión estadística: El valor del estadígrafo de contraste pertenece a la región de aceptación, por tanto aceptamos la hipótesis nula. Conclusión no estadística: Con los datos de los que disponemos no existe una evidencia significativa de que exista una diferencia entre la presión sistólica antes y después de haber dejado de beber. Cuadro 6: Contraste para la diferencia de medias de dos poblaciones normales con datos apareados aplicado al ejemplo de la reducción de la tensión arterial en alcohólicos.

35 5.- ARBOL DE DECISIONES PARA LA COMPARACIÓN DE MEDIAS DE DOS POBLACIONES NORMALES. La figura siguiente muestra de forma esquemática el proceso de decisión por el tipo de contraste a utilizar en poblaciones normales. M. GRANDES VARIANZA CONOCIDA O DESCONOCIDA test Z Z = (x 1 x ) σ 1 n + σ n 1 = N(0,1) VARIANZA CONOCIDA test Z Z = (x 1 x ) σ 1 n + σ n 1 = N(0,1) INDEPEND. M. PEQUEÑAS IGUALES test t C (x 1 x ) t c = s 1 n + 1 n 1 =t n +n - 1 s = (n 1 1)s + (n 1 1)s n + n 1 NORMALES VARIANZAS DESCONOCIDAS DISTINTAS test t(welch) t w = (x 1 x ) s 1 n + s n 1 f = = t f s 1 n + s n 1 s 1 s n 1 (n +1) + n (n +1) 1 test U Z a = d σ d n N(0,1) M. GRANDES test Za d =media de las diferencias σ d = desviación de las diferencias APAREADOS t a = d S d t n 1 M. PEQUEÑAS test t a n 1 d =media de las diferencias S d = desviación de las diferencias Figura : Arbol de de decisiónes para el contraste de comparación de las medias de dos poblaciones normales.

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis Facultad de Ciencias Sociales, UdelaR Índice 1. Introducción: hipótesis estadística, tipos de hipótesis, prueba de hipótesis 2.

Más detalles

Caso particular: Contraste de homocedasticidad

Caso particular: Contraste de homocedasticidad 36 Bioestadística: Métodos y Aplicaciones 9.5.5. Caso particular: Contraste de homocedasticidad En la práctica un contraste de gran interés es el de la homocedasticidad o igualdad de varianzas. Decimos

Más detalles

Técnicas de Inferencia Estadística II. Tema 2. Contrastes de hipótesis en poblaciones normales

Técnicas de Inferencia Estadística II. Tema 2. Contrastes de hipótesis en poblaciones normales Técnicas de Inferencia Estadística II Tema 2. Contrastes de hipótesis en poblaciones normales M. Concepción Ausín Universidad Carlos III de Madrid Grado en Estadística y Empresa Curso 2010/11 Tema 2. Contrastes

Más detalles

Caso 105. Tamaño de muestra y potencia de una prueba. Diseño de experimentos. Jesús López Fidalgo

Caso 105. Tamaño de muestra y potencia de una prueba. Diseño de experimentos. Jesús López Fidalgo Caso 105. Tamaño de muestra y potencia de una prueba. Diseño de experimentos. Jesús López Fidalgo Caso Práctico El objetivo de este ejercicio es analizar diferentes tipos de pruebas estadísticas en las

Más detalles

Teorema Central del Límite (1)

Teorema Central del Límite (1) Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico

Más detalles

Tema 9: Contraste de hipótesis.

Tema 9: Contraste de hipótesis. Estadística 84 Tema 9: Contraste de hipótesis. 9.1 Introducción. El objetivo de este tema es proporcionar métodos que permiten decidir si una hipótesis estadística debe o no ser rechazada, en base a los

Más detalles

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA www.jmontenegro.wordpress.com UNI ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA PROF. JOHNNY MONTENEGRO MOLINA Objetivos Desarrollar el concepto de estimación de parámetros Explicar qué es una

Más detalles

Contrastes de hipótesis. 1: Ideas generales

Contrastes de hipótesis. 1: Ideas generales Contrastes de hipótesis 1: Ideas generales 1 Inferencia Estadística paramétrica población Muestra de individuos Técnicas de muestreo X 1 X 2 X 3.. X n Inferencia Estadística: métodos y procedimientos que

Más detalles

Tema 13 : Intervalos de probabilidad y confianza. Hipótesis y decisiones estadísticas.

Tema 13 : Intervalos de probabilidad y confianza. Hipótesis y decisiones estadísticas. Tema 13 : Intervalos de probabilidad y confianza. Hipótesis y decisiones estadísticas. ---Intervalo de probabilidad (IP) Permite predecir el comportamiento de las muestras. Si de una población se sacan

Más detalles

Universidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre Profesor: Jaime Soto

Universidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre Profesor: Jaime Soto Universidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre 2011-1 Profesor: Jaime Soto PRUEBA DE HIPÓTESIS Ejemplo El jefe de la Biblioteca de la URBE manifiesta

Más detalles

Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad para

Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad para VII. Pruebas de Hipótesis VII. Concepto de contraste de hipótesis Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad

Más detalles

Tema 8: Contraste de hipótesis

Tema 8: Contraste de hipótesis Tema 8: Contraste de hipótesis 1 En este tema: Conceptos fundamentales: hipótesis nula y alternativa, nivel de significación, error de tipo I y tipo II, p-valor. Contraste de hipótesis e IC. Contraste

Más detalles

Tema 7. Contrastes de Hipótesis

Tema 7. Contrastes de Hipótesis 7.1. Conceptos básicos Tema 7. Contrastes de Hipótesis Uno de los problemas comunes en inferencia consiste en contrastar una hipótesis estadística. Ejemplo: El fabricante de un determinado tipo de piezas

Más detalles

Hipótesis Alternativa H 1 : ϑ Θ 1

Hipótesis Alternativa H 1 : ϑ Θ 1 INFERENCIA ESTADÍSTICA Tema 3.3: Contrastes de signicación Objetivos Dominar el esquema conceptual y el lenguaje propios de los contrastes de hipótesis. Construir contrastes de hipótesis para los parámetros

Más detalles

Proyecto Tema 8: Tests de hipótesis. Resumen teórico

Proyecto  Tema 8: Tests de hipótesis. Resumen teórico Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Tema 8: Tests de hipótesis Resumen teórico Tests de hipótesis Concepto de test de hipótesis Un test de hipótesis (o

Más detalles

UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES ESCUELA DE SOCIOLOGÍA DEPARTAMENTO DE ESTADÍSTICA INFERENCIA ESTADÍSTICA

UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES ESCUELA DE SOCIOLOGÍA DEPARTAMENTO DE ESTADÍSTICA INFERENCIA ESTADÍSTICA UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES ESCUELA DE SOCIOLOGÍA DEPARTAMENTO DE ESTADÍSTICA INFERENCIA ESTADÍSTICA ANOTACIONES SOBRE CONSTRASTE DE Prof. Simón Cabrera

Más detalles

Contrastes de hipótesis estadísticas. Contrastes paramétricos

Contrastes de hipótesis estadísticas. Contrastes paramétricos Índice 7 Contrastes de hipótesis estadísticas. Contrastes paramétricos 7.1 7.1 Introducción.......................................... 7.1 7.2 Conceptos básicos...................................... 7.2

Más detalles

4. Prueba de Hipótesis

4. Prueba de Hipótesis 4. Prueba de Hipótesis Como se ha indicado anteriormente, nuestro objetivo al tomar una muestra es extraer alguna conclusión o inferencia sobre una población. En nuestro interés es conocer acerca de los

Más detalles

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo Estructura de este tema Tema 3 Contrastes de hipótesis José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Qué es un contraste de hipótesis? Elementos de un contraste: hipótesis,

Más detalles

INFERENCIA ESTADISTICA

INFERENCIA ESTADISTICA INFERENCIA ESTADISTICA ESTIMACION 2 maneras de estimar: Estimaciones puntuales x s 2 Estimaciones por intervalo 2 ESTIMACION Estimaciones por intervalo Limites de Confianza LCI

Más detalles

Contraste de Hipótesis

Contraste de Hipótesis Contraste de Hipótesis Introducción Ejemplo El peso de plantines de un arbusto forrajero, almacenado a temperatura y humedad relativa ambientes, obtenido a los 20 días desde la germinación es en promedio

Más detalles

Tema 8: Introducción a la Teoría sobre Contraste de hipótesis

Tema 8: Introducción a la Teoría sobre Contraste de hipótesis Tema 8: Introducción a la Teoría sobre Contraste de hipótesis Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 8: Introducción a la Teoría

Más detalles

6. Inferencia con muestras grandes. Informática. Universidad Carlos III de Madrid

6. Inferencia con muestras grandes. Informática. Universidad Carlos III de Madrid 6. Inferencia con muestras grandes 1 Tema 6: Inferencia con muestras grandes 1. Intervalos de confianza para μ con muestras grandes 2. Determinación del tamaño muestral 3. Introducción al contraste de

Más detalles

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación Facultad de Ciencias Sociales, UdelaR Índice 1. Repaso: estimadores y estimaciones. Propiedades de los estimadores. 2. Estimación puntual.

Más detalles

CONTRASTE DE HIPÓTESIS

CONTRASTE DE HIPÓTESIS CONTRASTE DE HIPÓTESIS Antonio Morillas A. Morillas: Contraste de hipótesis 1 CONTRASTE DE HIPÓTESIS 1. Introducción 2. Conceptos básicos 3. Región crítica óptima i. Teorema de Neyman-Pearson ii. Región

Más detalles

Tests de Hipótesis basados en una muestra. ESTADÍSTICA (Q) 5. TESTS DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN NORMAL CON VARIANZA CONOCIDA

Tests de Hipótesis basados en una muestra. ESTADÍSTICA (Q) 5. TESTS DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN NORMAL CON VARIANZA CONOCIDA 2 5. TESTS DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN NORMAL CON VARIANZA CONOCIDA 5. Desarrollo de un ejemplo Interesa saber si el método de absorción atómica de vapor frío para determinar mercurio introduce

Más detalles

CONTRASTE DE HIPÓTESIS

CONTRASTE DE HIPÓTESIS CONTRASTE DE HIPÓTESIS Antonio Morillas A. Morillas: Contraste de hipótesis 1 CONTRASTE DE HIPÓTESIS 1. Introducción 2. Conceptos básicos 3. Región crítica óptima i. Teorema de Neyman-Pearson ii. Región

Más detalles

Ejemplos Resueltos Tema 4

Ejemplos Resueltos Tema 4 Ejemplos Resueltos Tema 4 01 1. Intervalo de Confianza para la Media µ (con σ conocida Dada una muestra de tamaño n, para un nivel de confianza 1-α y la desviación típica de la población σ, el Intervalo

Más detalles

Técnicas de Muestreo Métodos

Técnicas de Muestreo Métodos Muestreo aleatorio: Técnicas de Muestreo Métodos a) unidad muestral elemental: a.1) muestreo aleatorio simple a.2) muestreo (seudo)aleatorio sistemático a.3) muestreo aleatorio estratificado b) unidad

Más detalles

Estimación de Parámetros.

Estimación de Parámetros. Estimación de Parámetros. Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona información sobre el valor del parámetro. Por ejemplo la media muestral es un

Más detalles

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:

Más detalles

Unidad 15 Estadística inferencial. Estimación por intervalos. Pruebas de hipótesis

Unidad 15 Estadística inferencial. Estimación por intervalos. Pruebas de hipótesis Unidad 15 Estadística inferencial. Estimación por intervalos. Pruebas de hipótesis PÁGINA 353 SOLUCIONES 1. El peso de azúcar por confitura se distribuye según la normal N (465;30). Veamos el porcentaje

Más detalles

ESTADÍSTICA APLICADA. Tema 3: Contrastes de hipótesis

ESTADÍSTICA APLICADA. Tema 3: Contrastes de hipótesis ESTADÍSTICA APLICADA Grado en Nutrición Humana y Dietética Tema 3: Contrastes de hipótesis Qué es un contraste de hipótesis? Elementos de un contraste: hipótesis, tipos de error, nivel de significación,

Más detalles

INFERENCIA ESTADÍSTICA: CONTRASTES DE HIPÓTESIS

INFERENCIA ESTADÍSTICA: CONTRASTES DE HIPÓTESIS INFERENCIA ESTADÍSTICA: CONTRASTES DE HIPÓTESIS Autor: Clara Laguna 6.1 INTRODUCCIÓN En el tema anterior estudiamos cómo a partir de una muestra podemos obtener una estimación puntual o bien establecer

Más detalles

Contrastes de hipótesis paramétricos

Contrastes de hipótesis paramétricos Estadística II Universidad de Salamanca Curso 2011/2012 Outline Introducción 1 Introducción 2 Contraste de Neyman-Pearson Sea X f X (x, θ). Desonocemos θ y queremos saber que valor toma este parámetro,

Más detalles

Estadística II Examen final junio - 17/06/16 Curso 2015/16 Soluciones Duración del examen: 2 h. y 45 min.

Estadística II Examen final junio - 17/06/16 Curso 2015/16 Soluciones Duración del examen: 2 h. y 45 min. Estadística II Examen final junio - 17/06/16 Curso 201/16 Soluciones Duración del examen: 2 h. y 4 min. 1. (3, puntos) La publicidad de un fondo de inversión afirma que la rentabilidad media anual del

Más detalles

PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07

PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07 PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07 TEMAS A ESTUDIAR En esta guía nos dedicaremos a estudiar el tema de Estimación por intervalo y comenzaremos a estudiar las pruebas de hipótesis paramétricas.

Más detalles

UNIVERSIDAD DE ATACAMA

UNIVERSIDAD DE ATACAMA UNIVERSIDAD DE ATACAMA FACULTAD DE INGENIERÍA / DEPARTAMENTO DE MATEMÁTICA ESTADÍSTICA Y PROBABILIDADES PAUTA DE CORRECCIÓN PRUEBA N 3 Profesor: Hugo S. Salinas. Segundo Semestre 200. Se investiga el diámetro

Más detalles

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste Técnicas de Inferencia Estadística II Tema 3. Contrastes de bondad de ajuste M. Concepción Ausín Universidad Carlos III de Madrid Grado en Estadística y Empresa Curso 2010/11 Tema 3. Contrastes de bondad

Más detalles

Contrastes de Hipótesis paramétricos y no-paramétricos.

Contrastes de Hipótesis paramétricos y no-paramétricos. Capítulo 1 Contrastes de Hiptesis paramétricos y no-paramétricos. Estadística Inductiva o Inferencia Estadística: Conjunto de métodos que se fundamentan en la Teoría de la Probabilidad y que tienen por

Más detalles

Tema 5. Contraste de hipótesis (I)

Tema 5. Contraste de hipótesis (I) Tema 5. Contraste de hipótesis (I) CA UNED de Huelva, "Profesor Dr. José Carlos Vílchez Martín" Introducción Bienvenida Objetivos pedagógicos: Conocer el concepto de hipótesis estadística Conocer y estimar

Más detalles

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M. En este capítulo, vamos a abordar la estimación mediante Intervalos de Confianza, que es otro de los tres grandes

Más detalles

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS Práctica. Intervalos de confianza 1 Práctica ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS Objetivos: Ilustrar el grado de fiabilidad de un intervalo de confianza cuando se utiliza

Más detalles

ESTIMACION DEL TAMAÑO DE LA MUESTRA Y DE LA POTENCIA

ESTIMACION DEL TAMAÑO DE LA MUESTRA Y DE LA POTENCIA ESTIMACION DEL TAMAÑO DE LA MUESTRA Y DE LA POTENCIA HIPOTESIS Y PRINCIPIOS Sabemos a quién y qué vamos a estudiar. Ahora hay que decidir cuántos individuos contendrá la muestra. Hipótesis nula (H o )

Más detalles

Capítulo 13 Contrastes sobre medias Los procedimientos Medias y Prueba T

Capítulo 13 Contrastes sobre medias Los procedimientos Medias y Prueba T Capítulo 13 Contrastes sobre medias Los procedimientos Medias y Prueba T La opción Comparar medias del menú Analizar contiene varios de los procedimientos estadísticos diseñados para efectuar contrastes

Más detalles

Capítulo 13. Contrastes sobre medias: Los procedimientos Medias y Prueba T. Medias

Capítulo 13. Contrastes sobre medias: Los procedimientos Medias y Prueba T. Medias Capítulo 13 Contrastes sobre medias: Los procedimientos Medias y Prueba T La opción Comparar medias del menú Analizar contiene varios de los procedimientos estadísticos diseñados para efectuar contrastes

Más detalles

Tema 7. Contrastes no paramétricos en una población

Tema 7. Contrastes no paramétricos en una población Tema 7. Contrastes no paramétricos en una población Resumen del tema 7.1. Introducción a la Estadística Inferencial. Estimación de parámetros Como ya sabemos, la Estadística estudia los métodos científicos

Más detalles

BLOQUE 3 TEMA 11 ESTIMACIÓN DE PARÁMETROS. ERRORES DE ESTIMACIÓN

BLOQUE 3 TEMA 11 ESTIMACIÓN DE PARÁMETROS. ERRORES DE ESTIMACIÓN BLOQUE 3 TEMA 11 ESTIMACIÓN DE PARÁMETROS. ERRORES DE ESTIMACIÓN Aproximación intutitiva a la inferencia estadística La Estadística es la ciencia que se ocupa de la ordenación y análisis de datos procedentes

Más detalles

UNIVERSIDAD DE MANAGUA Al más alto nivel

UNIVERSIDAD DE MANAGUA Al más alto nivel UNIVERSIDAD DE MANAGUA Al más alto nivel Estadística Inferencial Encuentro #9 Tema: Estimación puntual y por Intervalo de confianza Prof.: MSc. Julio Rito Vargas A. Grupos: CCEE y ADMVA /2016 Objetivos:

Más detalles

Germán Jesús Rubio Luna Catedrático de Matemáticas del IES Francisco Ayala

Germán Jesús Rubio Luna Catedrático de Matemáticas del IES Francisco Ayala Decisión estadística. Contraste de hipótesis Nota.- Cuando tratábamos la estimación de parámetros, intentábamos obtener un valor o un intervalo de valores que constituyesen la mejor estimación del parámetro

Más detalles

Tema 4: Estimación por intervalo (Intervalos de Confianza)

Tema 4: Estimación por intervalo (Intervalos de Confianza) Tema 4: Estimación por intervalo (Intervalos de Confianza (a partir del material de A. Jach (http://www.est.uc3m.es/ajach/ y A. Alonso (http://www.est.uc3m.es/amalonso/ 1 Planteamiento del problema: IC

Más detalles

INFERENCIA ESTADISTICA

INFERENCIA ESTADISTICA 1 INFERENCIA ESTADISTICA Es una rama de la Estadística que se ocupa de los procedimientos que nos permiten analizar y extraer conclusiones de una población a partir de los datos de una muestra aleatoria,

Más detalles

Estadística. Generalmente se considera que las variables son obtenidas independientemente de la misma población. De esta forma: con

Estadística. Generalmente se considera que las variables son obtenidas independientemente de la misma población. De esta forma: con Hasta ahora hemos supuesto que conocemos o podemos calcular la función/densidad de probabilidad (distribución) de las variables aleatorias. En general, esto no es así. Más bien se tiene una muestra experimental

Más detalles

Tema 13: Contrastes No Paramétricos

Tema 13: Contrastes No Paramétricos Tema 13: Contrastes No Paramétricos Presentación y Objetivos. La validez de los métodos paramétricos depende de la validez de las suposiciones que se hacen sobre la naturaleza de los datos recogidos. La

Más detalles

Tema 7 Intervalos de confianza Hugo S. Salinas

Tema 7 Intervalos de confianza Hugo S. Salinas Intervalos de confianza Hugo S. Salinas 1 Introducción Hemos definido la inferencia estadística como un proceso que usa información proveniente de la muestra para generalizar y tomar decisiones acerca

Más detalles

Muestreo e intervalos de confianza

Muestreo e intervalos de confianza Muestreo e intervalos de confianza Intervalo de confianza para la media (varianza desconocida) Intervalo de confinza para la varianza Grados en Biología y Biología sanitaria M. Marvá. Departamento de Física

Más detalles

Ejemplos Resueltos Tema 4

Ejemplos Resueltos Tema 4 Ejemplos Resueltos Tema 4 2012 1. Contraste de Hipótesis para la Media µ (con σ conocida) Dada una muestra de tamaño n y conocida la desviación típica de la población σ, se desea contrastar la hipótesis

Más detalles

Cap. 7 : Pruebas de hipótesis

Cap. 7 : Pruebas de hipótesis Cap. 7 : Pruebas de hipótesis Alexandre Blondin Massé Departamento de Informática y Matematica Université du Québec à Chicoutimi 20 de junio del 2015 Modelado de sistemas aleatorios Ingeniería de sistemas,

Más detalles

Módulo de Estadística

Módulo de Estadística Módulo de Estadística Tema 8: Introducción a los contrastes de hipótesis Tema 6: Contrastes de hipótesis 1 Objetivos del tema Introducir el concepto de contraste de hipótesis Diferenciar entre hipótesis

Más detalles

1. Muestreo e Inferencia Estadística

1. Muestreo e Inferencia Estadística Tema 6: Introducción a la Inferencia Estadística Objetivos Introducir los conceptos elementales en esta parte de la asignatura. Tratar con muestras aleatorias y su distribución muestral en ejemplos de

Más detalles

Resumen teórico de los principales conceptos estadísticos

Resumen teórico de los principales conceptos estadísticos Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Muestreo aleatorio simple Resumen teórico Resumen teórico de los principales conceptos estadísticos Muestreo aleatorio

Más detalles

Tema 1: Distribuciones en el muestreo

Tema 1: Distribuciones en el muestreo Tema 1: Distribuciones en el muestreo 1 (transparencias de A. Jach http://www.est.uc3m.es/ajach/) Muestras aleatorias Estadísticos Concepto de distribución muestral Media muestral Distribución muestral

Más detalles

CONTRASTE SOBRE UN COEFICIENTE DE LA REGRESIÓN

CONTRASTE SOBRE UN COEFICIENTE DE LA REGRESIÓN Modelo: Y =! 1 +! 2 X + u Hipótesis nula: Hipótesis alternativa H 1 :!!! 2 2 Ejemplo de modelo: p =! 1 +! 2 w + u Hipótesis nula: Hipótesis alternativa: H :!! 1 2 1. Como ilustración, consideremos un modelo

Más detalles

1) Características del diseño en un estudio de cohortes.

1) Características del diseño en un estudio de cohortes. Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55-10536) Estudios de cohortes CONCEPTOS CLAVE 1) Características del diseño en un estudio de cohortes. ) Elección del tamaño

Más detalles

TEMA 2 Diseño de experimentos: modelos con varios factores

TEMA 2 Diseño de experimentos: modelos con varios factores TEMA 2 Diseño de experimentos: modelos con varios factores José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Esquema del tema Modelo bifactorial

Más detalles

PRÁCTICA 6: CONTASTE DE HIPÓTESIS

PRÁCTICA 6: CONTASTE DE HIPÓTESIS PRÁCTICA 6: CONTASTE DE HIPÓTESIS Los contenidos están organizados para que pueda avanzar a la vez que hacer los ejercicios propuestos en la práctica 5 del cuadernillo de prácticas. Asegúrate de entender

Más detalles

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD Contrastes de hipótesis paramétricos para una y varias muestras: contrastes sobre la media, varianza y una proporción. Contrastes sobre la diferencia

Más detalles

Notas de clase Estadística R. Urbán R.

Notas de clase Estadística R. Urbán R. Inferencia estadística Sabemos que una población puede ser caracterizada por los valores de algunos parámetros poblacionales, por ello es lógico que en muchos problemas estadísticos se centre la atención

Más detalles

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández El método incluye diferentes elementos Justificación Planteamiento del problema

Más detalles

DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II

DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II PRÁCTICA 5 En una determinada investigación se estudió el rendimiento en matemáticas en función del estilo de aprendizaje de una serie de estudiantes de educación

Más detalles

Cuál es el campo de estudio de la prueba de hipótesis?

Cuál es el campo de estudio de la prueba de hipótesis? ESTIMACIÓN Establecer generalizaciones acerca de una población a partir de una muestra es el campo de estudio de la inferencia estadística. La inferencia estadística se divide en estimación y prueba de

Más detalles

ANOVA. Análisis de la Varianza. Univariante Efectos fijos Muestras independientes

ANOVA. Análisis de la Varianza. Univariante Efectos fijos Muestras independientes ANOVA Análisis de la Varianza Univariante Efectos fijos Muestras independientes De la t a la F En el test de la t de Student para muestras independientes, aprendimos como usar la distribución t para contrastar

Más detalles

Estimación. Introducción. Sea X la variable aleatoria poblacional con distribución de probabilidad f θ donde. es el parámetro poblacional desconocido

Estimación. Introducción. Sea X la variable aleatoria poblacional con distribución de probabilidad f θ donde. es el parámetro poblacional desconocido Tema : Introducción a la Teoría de la Estimación Introducción Sea X la variable aleatoria poblacional con distribución de probabilidad f θ (x), donde θ Θ es el parámetro poblacional desconocido Objetivo:

Más detalles

ESTADISTICA Estimación puntual

ESTADISTICA Estimación puntual Resumen estadístico Describir y sintetizar Tablas de frecuencias y Gráficos ESTADISTICA Estimación puntual Analizar e inferir Intervalos de confianza Contrastes de hipótesis Qué es una hipótesis? Una creencia

Más detalles

Métodos Estadísticos de la Ingeniería Tema 11: Contrastes de Hipótesis Grupo B

Métodos Estadísticos de la Ingeniería Tema 11: Contrastes de Hipótesis Grupo B Métodos Estadísticos de la Ingeniería Tema 11: Contrastes de Hipótesis Grupo B Área de Estadística e Investigación Operativa Licesio J. Rodríguez-Aragón Abril 2010 Contenidos...............................................................

Más detalles

LIMITES O INTERVALOS DE CONFIANZA LUIS FRANCISCO HERNANDEZ CANDELARIA ATENCIA ROMERO

LIMITES O INTERVALOS DE CONFIANZA LUIS FRANCISCO HERNANDEZ CANDELARIA ATENCIA ROMERO LIMITES O INTERVALOS DE CONFIANZA LUIS FRANCISCO HERNANDEZ CANDELARIA ATENCIA ROMERO TRABAJO DE ESTADISTICA PROBABILISTICA PRESENTADO A LA PROFESORA MARIA ESTELA SEVERICHE SINCELEJO CORPORACIÓN UNIVERSITARIA

Más detalles

CONTRASTES DE HIPÓTESES

CONTRASTES DE HIPÓTESES CONTRASTES DE IPÓTESES 1. Contraste de hipótesis 2. Contrastes de tipo paramétrico 2.1 Contraste T para una muestra 2.2 Contraste T para dos muestras independientes 2.3 Análisis de la varianza 3. Contrastes

Más detalles

Tema 10: Introducción a los problemas de Asociación y Correlación

Tema 10: Introducción a los problemas de Asociación y Correlación Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación

Más detalles

CONTRASTES NO PARAMÉTRICOS: ALEATORIEDAD Y LOCALIZACIÓN

CONTRASTES NO PARAMÉTRICOS: ALEATORIEDAD Y LOCALIZACIÓN CONTRASTES NO PARAMÉTRICOS: ALEATORIEDAD Y LOCALIZACIÓN Antonio Morillas A. Morillas: C. no paramétricos (II) 1 1. Contrastes de aleatoriedad. Contraste de rachas. 2. Contrastes de localización 2.1 Contraste

Más detalles

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24 Comenzado el lunes, 25 de marzo de 2013, 17:24 Estado Finalizado Finalizado en sábado, 30 de marzo de 2013, 17:10 Tiempo empleado 4 días 23 horas Puntos 50,00/50,00 Calificación 10,00 de un máximo de 10,00

Más detalles

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................

Más detalles

Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)

Tema 3: Estimación estadística de modelos probabilistas. (segunda parte) Tema 3: Estimación estadística de modelos probabilistas. (segunda parte) Estructura de este tema: 1 Técnicas de muestreo y estimación puntual. 2. 3 Contrastes de hipótesis. Planteamiento del problema Sea

Más detalles

Tema 5: Contraste de hipótesis

Tema 5: Contraste de hipótesis Tema 5: Contraste de hipótesis 1 (a partir del material de A. Jach (http://www.est.uc3m.es/ajach/) y A. Alonso (http://www.est.uc3m.es/amalonso/)) Conceptos fundamentales: hipótesis nula y alternativa,

Más detalles

Tema 5.5: Contrastes de hipótesis

Tema 5.5: Contrastes de hipótesis Tema 5.5: Contrastes de hipótesis 1. Qué es un contraste de hipótesis? 2. Elementos de un contraste: hipótesis nula y alternativa, tipos de error, nivel de significación, región crítica 3. Contrastes para

Más detalles

Conceptos del contraste de hipótesis

Conceptos del contraste de hipótesis Análisis de datos y gestión veterinaria Contraste de hipótesis Departamento de Producción Animal Facultad de Veterinaria Universidad de Córdoba Córdoba, 14 de Diciembre de 211 Conceptos del contraste de

Más detalles

EL CÁLCULO DE LA MUESTRA SE BASA EN EL DISEÑO DE ESTUDIO, MEDIANTE CARACTERÍSTICAS QUE SE CONOCEN EN LA POBLACIÓN

EL CÁLCULO DE LA MUESTRA SE BASA EN EL DISEÑO DE ESTUDIO, MEDIANTE CARACTERÍSTICAS QUE SE CONOCEN EN LA POBLACIÓN VALIDEZ INTERNA EL CÁLCULO DE LA MUESTRA SE BASA EN EL DISEÑO DE ESTUDIO, MEDIANTE CARACTERÍSTICAS QUE SE CONOCEN EN LA POBLACIÓN Existen fórmulas que nos permiten calcular la muestra en base a características

Más detalles

Tema 8: Regresión y Correlación

Tema 8: Regresión y Correlación Tema 8: Regresión y Correlación Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 8: Regresión y Correlación Curso 2008-2009 1 / 12 Índice

Más detalles

Contraste de hipótesis con STATGRAPHICS

Contraste de hipótesis con STATGRAPHICS Contraste de hipótesis con STATGRAPHICS Ficheros empleados: Transistor.sf3, Estaturas.sf3 1. Introducción: Una forma habitual de hacer inferencia acerca de uno o más parámetros de una población consiste

Más detalles

Tema 5. Muestreo y distribuciones muestrales

Tema 5. Muestreo y distribuciones muestrales 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras aleatorias simples. Distribución de la media muestral: Esperanza y varianza. Distribución exacta en el caso normal. Distribución

Más detalles

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste 1 Contraste de hipótesis Tema 3 1. Pasos del contraste de hipótesis 1.1 Hipótesis estadísticas: nula y alternativa 1.2 Supuestos 1.3 Estadístico de contraste 1.4 Regla de decisión: zona de aceptación y

Más detalles

Tema 3: Estimación estadística de modelos probabilistas. (primera parte)

Tema 3: Estimación estadística de modelos probabilistas. (primera parte) Tema 3: Estimación estadística de modelos probabilistas. (primera parte) Estructura de este tema: 1. 2 Estimación por intervalos de confianza. 3 Contrastes de hipótesis. Planteamiento del problema Inconveniente:

Más detalles

LECCIÓN PÚBLICA. Tema 5 Algunas Pruebas de Hipótesis. Profa. María Fátima Dos Santos

LECCIÓN PÚBLICA. Tema 5 Algunas Pruebas de Hipótesis. Profa. María Fátima Dos Santos LECCIÓN PÚBLICA Tema 5 Algunas Pruebas Profa. María Fátima Dos Santos 1 TEMARIO Fundamentos de estadística inferencial Método hipotético deductivo (Juego de hipótesis) Elementos en el contraste de hipótesis

Más detalles

Ms. C. Marco Vinicio Rodríguez

Ms. C. Marco Vinicio Rodríguez Ms. C. Marco Vinicio Rodríguez mvrodriguezl@yahoo.com http://mvrurural.wordpress.com/ Uno de los objetivos de la estadística es saber acerca del comportamiento de parámetros poblacionales tales como:

Más detalles

CONTRASTES DE HIPÓTESIS

CONTRASTES DE HIPÓTESIS Estadística.FBA I. Curso 2011-2012 CONTRASTES DE HIPÓTESIS M.Carmen Carollo Contrastes de hipótesis 1 Estadística.FBA I. Curso 2011-2012 CONTRASTES DE HIPÓTESIS A partir de una o varias muestras nos proponemos

Más detalles

ESTIMACION INFERENCIA ESTADISTICA

ESTIMACION INFERENCIA ESTADISTICA P M INFERENCIA ESTADISTICA Desde nuestro punto de vista, el objetivo es expresar, en términos probabilísticos, la incertidumbre de una información relativa a la población obtenida mediante la información

Más detalles

DEFINICIONES BÁSICAS

DEFINICIONES BÁSICAS 1 CLASES DE ESTADÍSTICA II CLASE 14) INTRODUCCIÓN A LAS PRUEBAS DE HIPÓTESIS. A menudo el analista debe tomar decisiones acerca de la investigación que se está desarrollando. En ese proceso de toma de

Más detalles

INFERENCIA PARÁMETRICA: RELACIÓN ENTRE DOS VARIABLES CUALITATIVAS

INFERENCIA PARÁMETRICA: RELACIÓN ENTRE DOS VARIABLES CUALITATIVAS . Metodología en Salud Pública INFERENCIA PARÁMETRICA: RELACIÓN ENTRE DOS VARIABLES CUALITATIVAS Autor: Clara Laguna 7.1 INTRODUCCIÓN Los datos categóricos o variables cualitativas son muy frecuentes en

Más detalles

Tema 7: Introducción a la Teoría sobre Estimación

Tema 7: Introducción a la Teoría sobre Estimación Tema 7: Introducción a la Teoría sobre Estimación Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 7: Introducción a la Teoría sobre Estimación

Más detalles

1. Ejercicios. 2 a parte

1. Ejercicios. 2 a parte 1. Ejercicios. 2 a parte Ejercicio 1 Calcule 1. P (χ 2 9 3 33) 2. P (χ 2 15 7 26). 3. P (15 51 χ 2 8 22). 4. P (χ 2 70 82). Ejercicio 2 Si X χ 2 26, obtenga un intervalo [a, b] que contenga un 95 % de

Más detalles