"CONTRASTES DE HIPÓTESIS" 4.4 Parte básica

Save this PDF as:
 WORD  PNG  TXT  JPG

Tamaño: px
Comenzar la demostración a partir de la página:

Download ""CONTRASTES DE HIPÓTESIS" 4.4 Parte básica"

Transcripción

1 76 "CONTRASTES DE HIPÓTESIS" 4.4 Parte básica

2 Introducción a los contrastes de hipótesis La Inferencia Estadística consta de dos partes: Estimación y Contrastes de Hipótesis. La primera se ha estudiado en la unidad anterior y estaba destinada a tratar de determinar el valor de un parámetro poblacional, a partir de lo observado en la muestra. La técnica de Contraste de Hipótesis es preciso para establecer procedimientos para aceptar o rechazar hipótesis estadísticas emitidas acerca de un parámetro, u otra característica de la población. La única forma de saber con certeza absoluta que una hipótesis estadística es verdadera, es examinar toda la población. Pero esto, en la mayoría de los casos resulta, imposible (por falta de medios económicos, imposibilidades técnicas, etc.). Por lo tanto, la decisión debe adoptarse a partir de los resultados de una muestra de la población (supuesta representativa), que nos inducirá a tomar la decisión sobre la verdad o falsedad de la hipótesis. Pero es difícil ésta decisión, porque aunque sepamos exactamente el valor del parámetro de la población, en las muestras es muy difícil que se verifique ese valor exacto, por lo que debemos decidir unos límites de valores del parámetro en la muestra, que nos puedan llevar a la decisión de aceptar el valor del parámetro poblacional. Por ejemplo, si una población es normal N(150, 30), en todas las muestras de tamaño 36, aproximadamente en un % de ellas, la media muestral superará las 160 unidades, y en otro % aproximadamente será inferior a las 140 unidades. El problema, es pues, decidir a partir de qué valores de la media muestral podemos aceptar que la media poblacional es de 150 unidades, y todo ello siempre con un margen de error.

3 Conceptos básicos Hipótesis nula e Hipótesis alternativa A la hipótesis que se desea contrastar la denominaremos Hipótesis nula, y la denotaremos por Ho. Esta hipótesis nula es la que se somete a comprobación, y es la que se acepta o rechaza, como la conclusión final de un contraste. Puede surgir de diversos modos (Por discusiones teóricas, ó como modelo teórico, ó por la experiencia, ó por intuición, etc.). H1. Esta hipótesis nula lleva consigo una hipótesis alternativa, denotada por Ha o La hipótesis alternativa será la que se acepta si se rechaza Ho y viceversa En el ejemplo del párrafo anterior, si tratamos de determinar la media poblacional (supuesta desconocida), la hipótesis nula podría ser: Ho: Media poblacional = 150. En éste caso, la hipótesis alternativa tendría la siguiente expresión: Ha: Media poblacional Estadígrafo de contraste El contraste de hipótesis, es pues, un mecanismo mediante el cual se rechaza la hipótesis nula cuando existan diferencias significativas entre los valores muestrales y los valores teóricos, y se acepte en caso contrario. Estas variables se medirán mediante una variable denominada estadígrafo de contraste, o estadístico de contraste, que sigue una distribución determinada conocida, y que para cada muestra tomará un valor particular.

4 79 En el ejemplo anterior, el estadístico de contraste puede ser la media muestral, pero según hemos visto en unidades anteriores, conocemos que la variable Z = x! µ " n con n > 30 sigue una distribución normal N(0,1), por lo que puede utilizarse ésta variable como un estadístico de contraste, ya que se conoce su distribución Región crítica y región de aceptación Denominaremos región crítica, al conjunto de valores del estadístico de contraste que nos lleva a rechazar la hipótesis nula. La región crítica es el conjunto de valores del estadístico de contraste que nos induce a rechazar la hipótesis nula En el ejemplo anterior, si tomamos la media muestral como estadístico de contraste, la región crítica serían los valores de la media muestral superiores a 159.8, o inferiores a Pero si tomamos el estadístico Z, la región crítica serían los valores de Z cuyo valor absoluto sea mayor que Llamaremos región de aceptación, al conjunto de los valores del estadístico que nos llevan a aceptar la hipótesis nula. La región de aceptación es el conjunto de los valores del estadístico que nos induce a aceptar la hipótesis nula Error tipo I y Error tipo II Obviamente la conclusión tras un contraste de hipótesis puede ser cierta o no, ya que no sabemos con certeza cuál es la situación verdadera. Esto nos puede llevar a las situaciones reflejadas en el siguiente cuadro:

5 80 Decisión Aceptar Ho Rechazar Ho Hipótesis cierta Ho H1 Correcta Error tipo II Error tipo I Correcta O bien reflejadas en la siguiente forma:. Si la hipótesis nula es cierta y se acepta, la decisión es correcta.. Si la hipótesis nula es cierta y se rechaza ésta, se comete un error; a este error le denominaremos error de tipo I.. Si la hipótesis alternativa es cierta y se acepta la hipótesis nula, se comete un error; a éste error le denominaremos error de tipo II.. Si la hipótesis alternativa es falsa y se rechaza la hipótesis nula, la decisión es correcta Nivel de significación y potencia del contraste Nivel de significación del contraste es la probabilidad de cometer un error del tipo I, es decir, de rechazar la hipótesis nula siendo cierta, y se acostumbra a denotar por α α = P(cometer error tipo I) = P(rechazar Ho siendo cierta) La interpretación estadística del error tipo I es la siguiente: Si el experimento se repitiera un gran número de veces, sobre una población con media de 150 unidades, en el 100(1 - a)% de los casos, ese experimento llevaría a la conclusión verdadera de que µ = 150, y en el 100 a% de las veces conduciría a la decisión falsa de que µ 150.

6 81 La probabilidad de cometer error del tipo II se denota por β β = P(cometer error tipo II) = P(aceptar Ho siendo falsa) Su complementario hasta uno es lo que se llama potencia del contraste La potencia del contraste, es la probabilidad de rechazar la hipótesis nula siendo ésta falsa., es decir, aceptar la hipótesis alternativa siendo cierta. La interpretación estadística del error tipo II es la siguiente: Si el experimento se repitiera un gran número de veces, sobre una población con media de 150 unidades, en el 100β% de los casos, ese experimento llevaría a la conclusión falsa de que µ = 150, y en el 100 (1 - β)% de las veces conduciría a la decisión verdadera de que µ 150. Estas probabilidades se pueden conocer: Si en el ejemplo de una población normal N(µ, 30) tomamos una muestra de 36 elementos, y contrastamos Ho (µ=150) contra la hipótesis alternativa Ha (µ=165), y consideramos como región de aceptación el intervalo (140, 160), entonces la probabilidad de cometer error tipo I, es la probabilidad de que la media muestral pertenezca a la región crítica; es decir, sea mayor que 160, o menor que 140 unidades, y la hipótesis nula sea cierta. Así α = P(cometer error tipo I) = P( x 160/N(150,30))+P( x 140/N(150,30))= =P(Z ) + P(Z -) = = lo que nos da cierta información sobre la posibilidad de acertar en nuestra decisión, aunque no sepamos el verdadero valor del parámetro poblacional. Análogamente se puede calcular la probabilidad de cometer error tipo II, es decir, de que la media muestral pertenezca al intervalo (140, 160) y sea cierta la hipótesis alternativa: β = P(cometer error tipo II) = P(140 x 160/N(165,30))= P(-5 Z -1) = P(Z -1) - P(Z -5) = =

7 Tipo de contraste Según que la región crítica contenga una o dos regiones, diremos que el contraste es unilateral, o bilateral. hipótesis. Estos son los conceptos iniciales que deben tenerse en cuenta en un contraste de Pasos en un contraste de hipótesis hipótesis: Veamos ahora los pasos que son convenientes seguir para realizar el contraste de 1º Determinar, claramente, la hipótesis nula Ho y la hipótesis alternativa Ha. º Elegir el nivel de significación. 3º Seleccionar un estadístico cuya distribución muestral sea conocida en el caso de que la hipótesis nula sea cierta. 4º Determinar la región crítica. 5º Calcular el valor del estadístico de contraste para la muestra elegida. 6º Sacar las conclusiones estadísticas del contraste (aceptar o rechazar Ho). 7º Sacar las conclusiones no estadísticas (biológicas, médicas, económicas, etc.) a que nos llevan los resultados estadísticos.

8 Contraste para la media de una población normal Contraste para la media de una población normal, con varianza poblacional conocida Supongamos que queremos contrastar la hipótesis de que la media µ de una población normal, toma un valor específico µo, cuando la varianza σ de la población es conocida. En éste caso, la hipótesis nula será, en general: Ho (µ = µo ) Mientras que la hipótesis alternativa puede tener diversas expresiones: Ha (µ = µ1 ), o bien, Ha (µ < µo ), Ha (µ > µo ), o bien Ha (µ µo ). Estadígrafo de contraste: El contraste se efectuará tomando muestras aleatorias de tamaño n. Conocemos que la distribución de la media muestral sigue una distribución normal N(µ, σ/ n). Entonces, si x es la media de una muestra de tamaño n, entonces la variable Z = x! µ o " n seguirá, cuando la hipótesis nula sea cierta una distribución normal estándar N(0,1). Se puede utilizar así pues ésta variable como estadístico de contraste en éste caso. Nivel de significación: El nivel de significación será α, que, generalmente tomará los valores 0.1, 0.05 ó Región crítica: Si la hipótesis nula fuese cierta y µ = µo, cabe esperar que la media muestral x se distribuya en torno al valor µo, es decir, x - µo tendrá un valor elevado para que existan evidencias de que la hipótesis nula sea falsa, es decir, la variable Z tomará un valor absoluto grande; así pues, la región crítica estará formada por los valores de Z elevados, tanto positivos como negativos. Para especificar cuando se consideran

9 84 elevados, teniendo en cuenta la distribución de Z, serán aquellos que sean mayores, en valor absoluto, que z α/, en el contraste bilateral, o que z α en el contraste unilateral. Si la hipótesis nula fuese Ho (µ µo ), entonces dejarían de pertenecer a la región crítica los valores positivos grandes, y el contraste es, en éste caso, unilateral. (Ver figuras 4. y 4.3).!/ 1-! nivel de significación!/ Región crítica -z!/ 0 z!/ Región de Aceptación Región crítica Figura 4.10: Regiones crítica y de aceptación en un contraste bilateral cuando la distribución es normal estándar. 1-! nivel de significación! 0 z! Región de Aceptación Región crítica Figura 4.11: Regiones crítica y de aceptación en un contraste unilateral cuando la distribución es normal estándar.

10 Contraste para la media de una población normal, con varianza poblacional desconocida MUESTRAS GRANDES Estadígrafo de contraste: En el mismo caso que en el párrafo anterior, y con las mismas hipótesis, si el tamaño de la muestra es suficientemente grande (n > 30), aunque sea desconocida la varianza poblacional, se consiguen buenos resultados utilizando como estimador de la varianza poblacional la cuasi-varianza muestral y, por lo tanto, se puede tomar como estadístico de contraste el mismo que se tomó cuando la varianza poblacional era conocida; es decir Z = x! µ o s n es una variable que sigue una distribución normal estándar N(0,1), por lo que el razonamiento es idéntico al caso anterior. MUESTRAS PEQUEÑAS Estadígrafo de contraste: Si el tamaño de la muestra es pequeño (n < 30), sabemos de unidades anteriores que la variable t = x! µ o s n!1 difiere sensiblemente de una distribución normal, aproximándose bastante mejor por una distribución t de Student, con n-1 grados de libertad, por lo que ésta variable t puede utilizarse con un estadístico de contraste. Región crítica: La región crítica, en éste caso, estará determinada por los valores de la variable t que sean excesivamente grandes en valor absoluto, si el contraste es bilateral, y para especificar el nivel de cuando pueden considerarse grandes, teniendo en cuenta la

11 86 distribución de la variable t, que sigue una distribución t con n-1 grados de libertad, serán aquellos valores mayores que t α/,n-1 en el contraste bilateral, o que t α,n-1 en el contraste unilateral. Las regiones críticas serán pues, análogamente al caso de la varianza poblacional conocida, los siguientes (ver figuras 4.4 y 4.5): nivel de confianza!/ 1"!!/ nivel de significación -t!/ 0 t!/ Región crítica Región de Aceptación Región crítica Figura 4.1: Regiones crítica y de aceptación en el contraste bilateral cuando la variable se distribuye según una t de Student. Figura 4.13: Regiones crítica y de aceptación en el contraste unilateral cuando la variable se distribuye según una t de Student.

12 Contraste de hipótesis para la igualdad de medias de dos poblaciones normales En este apartado consideraremos dos poblaciones con distribuciones normales con medias µ 1 y µ y varianzas! 1 y! respectivamente, de las cuales extraemos muestras aleatorias independientes de tamaños n 1 y n respectivamente. El objetivo de éste apartado será determinar si las dos poblaciones pueden considerarse con la misma media poblacional, es decir, la hipótesis nula será Ho (µ 1 = µ ), mientras que la hipótesis alternativa puede tener diversas expresiones: Ha (µ 1 < µ ), o bien, Ha (µ 1 > µ ), o bien Ha (µ 1 µ ). Estas hipótesis son equivalentes a las siguientes: la hipótesis nula será Ho (µ 1 - µ = 0), mientras que la hipótesis alternativa tendrá éstas expresiones: Ha (µ 1 - µ < 0), o bien, Ha (µ 1 - µ > 0), o bien Ha (µ 1 - µ 0) Contraste de hipótesis para la igualdad de medias de dos poblaciones normales con varianzas poblacionales conocidas. Estadígrafo de contraste: Conocemos del tema relacionado con las distribuciones normales, que la diferencia de dos distribuciones normales se distribuye también normalmente con media la diferencia de las medias, y varianza la suma de las varianzas, por lo que la variable # " x 1! x será una variable que se distribuye normalmente N µ 1! µ, 1 + " & % (, por $ n 1 n ' lo que en el caso particular de conocer las varianzas poblacionales, podemos utilizar como estadístico de contraste la variable Z = x 1! x " 1 + " n 1 n

13 88 que, en el caso de que la hipótesis nula sea cierta (µ 1 = µ ), se distribuye como una distribución normal estándar N(0,1), y, por lo tanto, puede utilizarse como estadístico de contraste, dado que conocemos su distribución. Región crítica: La región crítica estará formada por los valores de Z elevados, tanto positivos como negativos. Para especificar cuando se consideran elevados, teniendo en cuenta la distribución de Z, serán aquellos que sean mayores, en valor absoluto, que Z α/, en el contraste bilateral, o que z α en el contraste unilateral Contraste de hipótesis para la igualdad de medias de dos poblaciones normales con varianzas poblacionales desconocidas pero iguales MUESTRAS GRANDES Estadígrafo de contraste: Supongamos ahora que las varianzas son desconocidas pero iguales (σ 1 = σ = σ). Si las muestras tienen tamaño grande, aunque no se conozca la varianza poblacional, se trabaja como si se conociese utilizando en lugar de la varianza poblacional, su estimador la cuasivarianza muestral, por lo que la distribución de la diferencia de " 1 medias muestrales es ahora N µ 1! µ, s ˆ + 1 % $ ', # n 1 n & siendoˆ s = estándar (n 1!1)ˆ s 1 + (n!1)ˆ s n 1 + n!, por lo que la variable tipificada es una normal ( )! ( µ 1! µ ) Z = x 1! x S ˆ n 1 n Entonces, si ha hipótesis nula es cierta, (µ 1 =µ ), la variable Z = ˆ S ( ) x 1! x n 1 n

14 89 se distribuye como una distribución normal estándar, por lo que se puede utilizar como un estadístico de contraste. Región crítica: La región crítica se determina igual que en el párrafo anterior, es decir, para los valores de Z mayores, en valor absoluto, que z α/ (contraste bilateral), o que z α (contraste unilateral). MUESTRAS PEQUEÑAS Estadígrafo de contraste Pero, si las muestras son pequeñas (n 1 + n < 30), entonces la variable siguiente t = (x 1! x )!(µ 1! µ ) S ˆ n 1 n con ˆ S = grados de libertad. (n 1!1)ˆ S 1 + (n!1)ˆ S n 1 + n!, sigue una distribución t de Student con n 1 +n - Si la hipótesis nula es cierta, el estadígrafo de contraste que utilizaremos es t = (x 1! x ) S ˆ n 1 n porque se distribuye como una t de Student con n 1 +n -. Región crítica: La región crítica viene determinada por los valores de esta variable t, que son mayores en valor absoluto que t α/ en el contraste bilateral, o bien los valores de t, que son mayores en valor absoluto que t α en el contraste unilateral.

15 Contraste para distribuciones binomiales Estudiaremos sólo contrastes en los que sea posible aproximaciones de la binomial mediante la normal, por lo que estudiaremos sólo los casos de muestras grandes, de tamaño > Contraste para el parámetro p de una distribución Binomial Partimos de una población que se ajuste al modelo binomial B(n, p), siendo p la! probabilidad de "éxito"; denotaremos por p a la proporción muestral de casos favorables y por po el valor hipotético con el que queremos contrastar el valor del parámetro p. Hipótesis de partida En éste caso, la hipótesis nula será: Ho : p = po y la hipótesis alternativa puede ser: Ha : p po en el contraste bilateral, o bien Ha : p > po, en el contraste unilateral (también Ha : p < po). Estadígrafo de contraste: Como conocemos que la distribución binomial B(n, p) se aproxima mediante una variable normal N(np, npq ), entonces, se verifica que la variable p ˆ! p Z = o p ˆ (1! p ˆ ) n se distribuye como una distribución normal estándar N(0,1).

16 91 Región crítica: La región crítica, ahora, será la determinada por los valores de la variable Z que son mayores en valor absoluto que z α/, en el contraste bilateral, o bien, mayores que z α, en el contraste unilateral Contraste para la igualdad de los parámetros de dos distribuciones binomiales Partimos, en éste caso, de dos distribuciones binomiales B(n 1, p 1 ) y B(n, p ) respectivamente. En las muestras los parámetros muestrales serán ˆ p 1 y ˆ p respectivamente. Hipótesis de partida: La hipótesis nula será: Ho : p 1 = p mientras que la hipótesis alternativa puede ser : Ha : p 1 p Estadígrafo de contraste: Ahora, teniendo en cuenta las propiedades de las distribuciones normales, por las que se aproximan las binomiales, se verifica que la variable Z =! p 1!! p! p 1 (1!! p 1 ) + n 1! p (1! p! ) n se distribuye, cuando la hipótesis nula es cierta, como una distribución normal estándar N(0,1) Región crítica:

17 9 La región crítica será análoga a todas aquéllas en el que el estadístico de contraste sigue una distribución normal.

18 93 "CONTRASTES DE HIPÓTESIS" 4.5 Ampliación

19 Introducción y motivación Antes de comenzar con el desarrollo del tema se supone que el lector conoce los conceptos fundamentales de muestreo, los principales estimadores de los parámetros de distribuciones normales y sus correspondientes distribuciones muestrales, y los conceptos básicos asociados a los contrastes de hipótesis como son el riesgo tipo I, tipo II, potencia del contraste, etc... Aunque muchos de los conceptos han sido ya explicados en la parte básica, se repiten aquí encuadrados en el problema general de la investigación aplicada añadiendo una posible guía para la explicación de los mismos en contextos aplicados a las ciencias experimentales. Comenzaremos ilustrando las ideas generales sobre el contraste más simple, el de la media de una población Normal, para ir extendiendo progresivamente las ideas a dos poblaciones, a la comparación de proporciones y a las poblaciones no normales. Analizaremos la problemática de realizar un número elevado de contrastes sobre el mismo conjunto de datos, y extenderemos las ideas fundamentales al diseño de experimentos con varios grupos experimentales Contraste para la media de una población Normal Planteamiento general Consideremos un caso muy simple mediante un ejemplo concreto. Supongamos que pertenecemos al consejo regulador de la denominación de origen de los vinos de Ribera de Duero. Sabemos que los vinos jóvenes de años anteriores tienen un grado alcohólico medio de 1.5 grados, tal y como aparece en la etiqueta. Para el año actual, el consejo regulador, de acuerdo con todos sus miembros, ha decidido cambiar algunos de los pasos del proceso de fabricación. El primer problema que se plantea es: Se ha modificado el grado alcohólico al modificar el proceso de fabricación?.

20 95 La definición del problema a estudiar nos permite determinar la población que queremos estudiar, los vinos jóvenes de ribera de Duero en el año actual; la variable que queremos medir, el grado alcohólico de los mismos, y la hipótesis de trabajo inicial Se ha modificado el grado alcohólico?. El paso siguiente consiste en suponer un modelo de comportamiento teórico para la población (a priori). Suponemos que la variable que estamos midiendo en la población a estudiar sigue una distribución Normal. La suposición de normalidad la haremos de acuerdo con el conocimiento previo que tengamos sobre la población objeto de estudio tratando de que las características de la distribución reflejen en la mayor medida posible las de la población, se trata simplemente de buscar un modelo probabilístico que aproxime la variable a estudiar. En el caso que nos ocupa, parece razonable suponer, a priori, que el grado alcohólico se concentra de forma simétrica alrededor de un valor medio. Si consideráramos, por ejemplo, los salarios de una empresa la hipótesis de normalidad no es plausible puesto que cabe esperar que la distribución de los mismos sea marcadamente asimétrica debido a los altos salarios de un grupo reducido de ejecutivos. Formularemos ahora la hipótesis de trabajo en términos de los parámetros del modelo (media y/o desviación típica en el caso de la Normal). La hipótesis principal la denominamos hipótesis nula (H 0 ). H 0 = µ = µ 0 =1.5 La hipótesis nula suele ser la de igualdad del parámetro a un único valor concreto µo procedente de la hipótesis de trabajo. Junto con la hipótesis nula planteamos la que denominamos hipótesis alternativa (H a o H 1 ) que será aceptada cuando se rechace la nula y viceversa. Por el momento tomaremos la más sencilla, la hipótesis e que la media es diferente de 1 que resultará en un contraste bilateral. H a = µ! µ 0 = 1.5 Trataremos de diseñar un procedimiento para decidir entre ambas hipótesis a partir de la información contenida en una muestra de tamaño n, por ejemplo 14 observaciones.

21 96 Supongamos que la muestra ha sido seleccionada al azar de la población y que se han obtenido los resultados siguientes. RIBERA DE DUERO 1,8 1,8 1,5 11,9 1,5 1,1 1, 1,6 13,0 1,4 1,6 1, 1,8 13,0 Tabla 4.1: Grado alcohólico de 14 vinos de la denominación de Ribera de Duero. La primera cuestión que hemos de tener en cuenta es que la decisión por una hipótesis concreta ha de tomarse con un cierto riesgo de equivocarse al no disponer de la información de todos los individuos de la población. Trabajaremos con la media muestral como estimador de la media poblacional desconocida. En el ejemplo la media muestral es de 1,59, que como ya sabemos no coincide con la media poblacional. Trataremos de decidir entre las dos hipótesis a partir del valor de la media muestral pero, si la media muestral no coincide con la media poblacional, será la diferencia entre el valor observado y el teórico lo suficientemente grande como para rechazar la hipótesis nula? o la diferencia observada es lo suficientemente pequeña como para ser debida simplemente al azar o al desconocimiento de la población?. Daremos respuesta a ambas preguntas utilizando los conceptos sobre distribuciones aprendidos en temas anteriores Varianza (desviación típica conocida) Supondremos, por el momento, que la varianza de la población es! = 0.5 conocida. Sabemos que la media muestral para distintas muestras sigue una distribución! Normal N(µ, ), luego, cuando la hipótesis nula es cierta n x! N(µ 0, " n ) En la práctica, este resultado tiene implicaciones importantes. Veámoslo con un dibujo (figura 4.7).

22 97 x! N(µ 0, "n ) µ 0 x Figura 4.14: Distribución de la media muestral. El dibujo muestra cómo, aunque los valores de la media muestral no coinciden con la media poblacional, se concentran en torno a ella y por tanto es muy probable que sean cercanos aunque, con el modelo supuesto puede tomar cualquier valor. Obsérvese también que cuanto mayor es el tamaño muestral más se concentran los valores de la media muestral en torno a la media poblacional. Intuitivamente, aceptaremos la hipótesis nula cuando la media muestral sea próxima a µ 0 y la rechazaremos (aceptando la alternativa) cuando la media muestral sea muy diferente de µ 0, es decir, utilizamos la media muestral como estadístico, o estadígrafo, de contraste. Nos queda por determinar cual es el criterio para decidir si la media muestral está próxima o no al valor teórico propuesto utilizando el concepto de riesgo tipo I definido previamente. Fijamos el riesgo tipo Y en α (por ejemplo en 0.05 o el 5%) Nos plantearemos el contraste como un juicio en el que la media muestral es inocente (procede de una población con media µ 0 ) y no la declararemos culpable (no procede de una población con media µ 0 ) hasta que no se demuestre claramente lo contrario. Sobre la distribución de la media seleccionamos dos puntos µ 0! a y µ 0 + a, simétricos alrededor de µ 0 de forma que si la hipótesis nula cierta en el (1-α)100% (por ejemplo el 95%) de las muestras la media muestral esté entre esos dos valores (figura 4.8). P(µ 0! a " x " µ 0 + a) = 1! #

23 98 Figura 4.15: Procedimiento de contraste a partir de la media muestral Aceptaremos la hipótesis nula si la media muestral está dentro del intervalo seleccionado y la rechazaremos en caso contrario. Es claro que si la media está fuera del intervalo seleccionado hay una clara evidencia de que la hipótesis no es cierta ya que toma los valores correspondientes solo en el 5% de los casos en los que la hipótesis nula es cierta. Por supuesto, estamos asumiendo un riesgo del 5% de equivocarnos y rechazar indebidamente. Como ya es conocido, al conjunto de valores que nos llevan a aceptar la hipótesis nula lo denominamos Región de Aceptación, y al conjunto de valores que nos llevan a rechazarla Región Crítica. En este caso la región crítica se ha dividido en las dos colas de la distribución por lo que se dice que el contraste es bilateral o de dos colas. En la práctica no se trabaja directamente con la media muestral y su distribución asociada sino con la distribución Normal estándar. Teniendo en cuenta las propiedades de la Normal podemos escribir P(µ 0! a " x " µ 0 + a) = P(!z # / " x! µ 0 $ n " z #/ ) =1! # de forma que el procedimiento descrito se convierte ahora en el que se muestra en la figura 4.9. El estadígrafo de contraste es ahora x! µ 0 " n y mide la discrepancia entre el valor observado de la media l valor teórico de la misma, en la escala de la desviación

24 99 típica. No es lo mismo una diferencia de una unidad en una escala de centímetros que en una escala de kilómetros. Figura 4.16: Procedimiento de contraste a partir de la media muestral estandarizada. La interpretación intuitiva del nuevo procedimiento sigue siendo clara, rechazaremos la hipótesis nula solamente cuando la discrepancia entre la media observada y la teórica ( x! µ 0 ) sea grande, en relación a la variabilidad intrínseca! medida por. La magnitud de la diferencia necesaria para rechazar se determina a n través del riesgo de tipo 1 mediante la distribución Normal estándar. A los valores de z α/ se les suele denominar valores críticos ya que determinan la frontera entre la región crítica y la región de aceptación. El cuadro 4. muestra el procedimiento completo con los pasos que se siguen habitualmente en la construcción de cualquier contraste.

25 300 Hipótesis H 0 :µ = µ 0 H a :µ! µ 0 Nivel de significación: α Estadígrafo de contraste: Z = x! µ 0 " n Distribución del estadígrafo cuando la hipótesis nula es cierta: N(0,1) Región de aceptación: { Z / Z! z "/ } { } Región critica: Z / Z > z!/ Cuadro 4.: Contraste para la media de una población Normal con varianza conocida. Una vez que hemos determinado la forma general del contraste pasamos a aplicarlo a los datos del problema inicial que nos ocupa (ver cuadro 4.3). Hipótesis: Nivel de significación: 5% y 1%. Estadígrafo de contraste: Z = x! µ 0 " n = H 0 :µ = 1.5 H a :µ! ! = 0.17 Valores críticos : para el 5% z 0.05 = 1,96 para el 1% z =,57 Decisión estadística: El valor del estadígrafo de contraste pertenece a la región de aceptación, por tanto aceptamos la hipótesis nula. Conclusión no estadística: La modificación en el proceso de fabricación no ha modificado significativamente el grado alcohólico. Cuadro 4.3: Aplicación del contraste para la media de una población Normal con varianza conocida al problema de la modificación en el grado alcohólico del vino de Ribera de Duero Una vez que hemos tomado la decisión final, no sabemos si es correcta o no, simplemente esperamos que sea del 95% de las muestras en las que aceptamos la hipótesis correctamente. Si aceptamos la hipótesis nula no quiere decir que sea cierta y el grado medio sea exactamente de 1.5 grados (probablemente no lo es), sería más correcto interpretar que, con la información de la que disponemos no hemos encontrado evidencia suficiente de que la media sea distinta de 1.5. Evidentemente, los valores muestrales son compatibles con muchos otros posibles valores teóricos. Si aumentamos el tamaño de muestra indefinidamente, la variabilidad de la media

26 301 sería cada vez menor y conseguiríamos que la pequeña diferencia observada sea lo suficientemente grande como para considerarla significativa. Es por esto por lo que en Estadística decimos que es tan malo tener un tamaño de muestra demasiado alto como tenerlo demasiado bajo ya que en el primer caso cualquier pequeña diferencia es considerada como significativa mientras que en el segundo no se declara significación incluso en el caso en el que la diferencia sea elevada La potencia de un contraste En todo el proceso descrito hasta el momento solamente se ha utilizado el riesgo de tipo I en el desarrollo del contraste. Sabemos que esta asociado con el riesgo de tipo II de forma que cuando uno aumenta, el otro disminuye. Tampoco hemos hecho ninguna afirmación acerca de un concepto importante como es el de potencia del contraste (probabilidad de rechazar la hipótesis nula cuando es falsa). No es posible calcular la potencia del contraste porque para ello necesitaríamos un único valor en la hipótesis alternativa (revísese el ejemplo de los cirróticos utilizado como aplicación de la distribución Normal), aunque si podemos realizar el cálculo para distintos valores en la alternativa (función de potencia) y analizar lo que ocurre. Veámoslo con un ejemplo. Cual sería la potencia del contraste obtenido para detectar que la media no es 1.5 si en realidad la media fuera 13 (y suponiendo un nivel de significación del 5%). En términos de la media muestral el procedimiento de contraste consiste en aceptar la hipótesis nula si la media muestral está entre 1.38 y La probabilidad de cometer un error de tipo (aceptar indebidamente) si la media real fuera de 13 se podría calcular como P(1.38! X! 1.76) en una Normal de media 13 y desviación típica 0.5. Esta probabilidad es de forma que la potencia es = La situación esquematizada aparece en la figura 4.10.

27 30 Figura 4.17: Cálculo de la potencia del contraste para una alternativa predeterminada. En la figura 4.11 se muestra la función de potencia para distintos valores posibles de la hipótesis alternativa. Figura 4.18: Función de potencia para distintos valores de la alternativa. El gráfico muestra como la potencia es mayor cuando los valores de la alternativa se alejan del valor para la hipótesis nula. En la práctica este hecho tiene una implicación obvia: es más fácil detectar diferencias o efectos experimentales de gran magnitud. Aunque no es posible un control directo de la potencia, a la vista de la figura 4.10

28 303 es claro que la potencia puede modificarse modificando el nivel de significación o el tamaño muestral ya que la forma de las curvas depende de éste. Cuanto mayor sea el tamaño muestral más concentrada es la curva Normal y, por tanto, mayor es la potencia para el mismo nivel de significación. En la práctica suele hacerse un estudio de potencia para los contrastes no significativos, calculando cual sería el tamaño muestral necesario para que la diferencia observada en los datos sea significativa. Si este tamaño es muy grande es difícil declarar la significación por lo que consideraremos que estamos haciendo lo correcto, si el tamaño muestral necesario es pequeño, sería conveniente revisar el experimento. El cálculo es muy simple cuando se trabaja con distribuciones normales. La x! µ 0 hipótesis nula se rechaza cuando > z " #/ de forma que, para que la diferencia n sea significativa el valor de n será n > z!/" x # µ 0 para el ejemplo del grado alcohólico, n> 1141,97, es decir, para que la diferencia observada fuera significativa tendríamos que haber recogido más de 114 observaciones lo que da una idea de que la diferencia observada es muy pequeña y, por tanto es muy probable que la hipótesis nula sea cierta El p-valor del contraste Una forma habitual de medir la significación en los contrastes de hipótesis es el denominado p-valor del contraste. Su utilización en la investigación aplicada es debida a que es la forma de presentación de los resultados de un contraste usada por la mayor parte de los programas de ordenador. Se puede definir el p-valor de un contraste como la probabilidad de obtener un valor muestral más extremo que el obtenido en nuestro caso particular (cuando H0 es cierta). Si el p-valor es muy pequeño rechazaremos la hipótesis nula ya que el valor experimental es muy extremo, mientras que si el p-valor es grande aceptaremos la hipótesis nula ya que el valor es compatible con la misma.

29 304 De forma general, el p-valor para el contraste actual se puede calcular como # P Z > x! µ & 0 % " ( en una distribución Normal estándar. $ n ' Para el ejemplo anterior el p-valor es 1-P(-0.17 < Z < 0.17) = P(Z > 0.17) = 0.885, es decir el p-valor puede considerarse grande. En la práctica se suele adoptar el criterio de aceptar la hipótesis cuando el p-valor es mayor que el nivel de significación fijado en el procedimiento de contraste. Figura 4.19: El p-valor de un contraste bilateral Los contrastes unilaterales En algunas situaciones concretas no estamos interesados en todos los posibles valores de la hipótesis alternativa propuesta en un contraste bilateral. Supongamos, por ejemplo, que en el caso práctico anterior sospechamos a priori que la modificación en el procedimiento de fabricación produce un incremento en el contenido alcohólico. En este caso sería conveniente modificar la hipótesis alternativa para que sea de la forma H a :µ > µ 0. El procedimiento de contraste es muy similar al anterior y se muestra en el cuadro 4.4.

30 305 Hipótesis H 0 :µ = µ 0 H a :µ > µ 0 Nivel de significación: α Estadígrafo de contraste: Z = x! µ 0 " n Distribución del estadígrafo cuando la hipótesis nula es cierta: N(0,1) Región de aceptación: { Z / Z! z "/ } { } Región critica: Z / Z > z!/ Cuadro 4.4: Contraste unilateral superior para la media de una población Normal con varianza conocida. El contraste así obtenido se denomina contraste unilateral superior ya que solo estamos interesados en las desviaciones positivas. La diferencia fundamental con el contraste bilateral es que se produce un incremento en la potencia para detectar diferencias positivas de la hipótesis nula y un decremento drástico para detectar las negativas. El p-valor sigue teniendo la misma interpretación aunque ahora se calcula como # P Z > x! µ & % 0 " (. $ n ' Figura 4.0: El p-valor de un contraste unilateral superior. De la misma manera que se ha construido el contraste unilateral superior es posible construir el contraste unilateral inferior (ver cuadro 4.5) si estamos interesados

31 306 exclusivamente en detectar diferencias negativas con respecto a la hipótesis nula. La construcción del contraste es completamente análoga con la correspondiente modificación de la hipótesis alternativa. El contraste unilateral inferior incrementa la potencia para detectar diferencias negativas aunque no tiene potencia para detectar las positivas. Hipótesis H 0 :µ = µ 0 H a :µ < µ 0 Nivel de significación: α Estadígrafo de contraste: Z = x! µ 0 " n Distribución del estadígrafo cuando la hipótesis nula es cierta: N(0,1) Región de aceptación: { Z / Z! z "/ } { } Región critica: Z / Z < z!/ # p-valor: P Z > x! µ & % 0 " ( $ n ' Cuadro 4.5: Contraste unilateral inferior para la media de una población Normal con varianza conocida. Figura 4.1: El p-valor de un contraste unilateral inferior. La decisión por el tipo de contraste debe hacerse a priori, antes de tomar los datos. Supongamos, por ejemplo, que sospechamos, antes de realizar el experimento, que la modificación en el proceso de fabricación, aumenta el grado alcohólico. El procedimiento de contraste para los datos de la tabla 1 se muestra en el cuadro 4.6.

32 307 Hipótesis: H 0 :µ = 1.5 Nivel de significación: 5% y 1%. Estadígrafo de contraste: Z = x! µ 0 " n = H a :µ > µ ! = 0.17 Valores críticos : para el 5% z 0.05 = 1,65 para el 1% z =,33 p-valor: Decisión estadística: El valor del estadígrafo de contraste pertenece a la región de aceptación, por tanto aceptamos la hipótesis nula. Conclusión no estadística: La modificación en el proceso de fabricación no ha aumentado significativamente el grado alcohólico. Cuadro 4.6: Aplicación del contraste para la media de una población Normal con varianza conocida al problema de la modificación en el grado alcohólico del vino de Ribera de Duero La función de potencia para distintos valores de la alternativa aparece en la figura Obsérvese como el contraste no tiene ninguna potencia para detectar valores a la izquierda de la hipótesis nula. Figura 4.: Función de potencia para un contraste unilateral superior.

33 Varianza desconocida En la mayor parte de las aplicaciones prácticas la varianza de la distribución es también desconocida y ha de ser estimada a partir de los datos. El problema es que ya no es posible seguir utilizando la distribución Normal para el procedimiento de contraste ya que es necesario eliminar el parámetro σ del estadígrafo de contraste. De acuerdo con la teoría, además de la distribución muestral de la media sabemos (n!1)ˆ S que " sigue una distribución ji-cuadrado con n-1 grados de libertad. Si suponemos que media y varianza son independientes *, es posible combinar las correspondientes distribuciones muestrales para obtener una distribución t de Student y eliminar el parámetro σ. Utilizando la definición de distribución t de Student con n-1 grados de libertad como el cociente entre una Normal estándar y la raíz cuadrada de una ji-cuadrado con n- 1 grados de libertad dividida por sus grados de libertad, y ambas independientes, obtenemos que la variable aleatoria t = x! µ 0 " n (n!1) S ˆ " (n!1) = x! µ 0 S ˆ n sigue una distribución t de Student con n-1 grados de libertad. El procedimiento de contraste en este caso es análogo al anterior pero sustituyendo la distribución Normal por la distribución t. El cuadro 4.7 muestra el procedimiento de contraste completo. * La demostración completa no se realiza aquí.

34 309 Hipótesis H 0 :µ = µ 0 H a :µ! µ 0 Nivel de significación: α Estadígrafo de contraste: t = x! µ 0 S ˆ n Distribución del estadígrafo cuando la hipótesis nula es cierta: t n-1 Región de aceptación: { t / t! t n"1,# } { } * Región critica: t / t > t n!1," Cuadro 4.7: Contraste para la media de una población Normal con varianza desconocida. En la práctica, la sustitución de la distribución Normal por la distribución t de Student implica un aumento de la dispersión por lo que es más difícil detectar diferencias. La situación se muestra el la figura 4.16 en la que se comparan la distribución Normal estándar (en línea discontinua) y la distribución t (en línea continua). t = x " µ 0 ˆ s n # t n"1 1"!!/!/ -t! 0 t! Figura 4.3: Diferencia entra la distribución Normal y la distribución t de Student. Es posible construir contrastes unilaterales de la misma manera que en el caso de varianza conocida. El cuadro 4.8 muestra el contraste unilateral superior, el contraste unilateral inferior se deja como ejercicio al lector. * t n-1,α es el valor crítico de la t de Student tal que P(-t n-1,α t n-1 t n-1,α ) = 1-α. Se ha denotado con el subíndice α porque es el que se utiliza para buscar el valor correspondiente en la tabla.

35 310 Hipótesis H 0 :µ = µ 0 H a :µ > µ 0 Nivel de significación: α Estadígrafo de contraste: t = x! µ 0 S ˆ n Distribución del estadígrafo cuando la hipótesis nula es cierta: t n-1 Región de aceptación: { t / t! t n"1,# } * { } Región critica: t / t > t n!1," Cuadro 4.8: Contraste para la media de una población Normal con varianza desconocida. Para el ejemplo del grado alcohólico de los vinos de la denominación de origen de Ribera de Duero los resultados del contraste bilateral se muestran en el cuadro 4.9 Hipótesis: H 0 :µ = 1.5 H a :µ! 1.5 Nivel de significación: 5% y 1%. Estadígrafo de contraste: Z = x! µ !1.5 S ˆ = = n 14 Valores críticos : para el 5% t 0.05 = 1,96 para el 1% t 0.01 =,57 p-valor : 0,7571 Decisión estadística: El valor del estadígrafo de contraste pertenece a la región de aceptación, por tanto aceptamos la hipótesis nula. Conclusión no estadística: La modificación en el proceso de fabricación no ha modificado significativamente el grado alcohólico. Cuadro 4.9: Aplicación del contraste para la media de una población Normal con varianza conocida al problema de la modificación en el grado alcohólico del vino de Ribera de Duero Todos los conceptos explicados para el contraste de la media de una población Normal con varianza conocida siguen siendo válidos aquí. * t n-1,α es el valor crítico de la t de Student tal que P( t n-1 > t n-1,α ) = α. Se ha denotado con el subíndice α porque es el que se utiliza para buscar el valor correspondiente en la tabla.

36 Contrastes para muestras grandes Cuando las muestras de las que se dispone son muestras grandes (aproximadamente mayores de 30 observaciones) es posible utilizar directamente la distribución Normal ya que es muy similar a la t de Student. Además el teorema central del límite permite relajar la hipótesis de normalidad ya que la normalidad de la distribución muestral de medias está garantizada, bajo ciertas condiciones de regularidad, aunque la población original no sea Normal. Hay que tener en cuenta que se trata sólo de una aproximación y, cuanto mayor es el tamaño de la muestra mejor es la aproximación Normal obtenida. El procedimiento de contraste para muestras grandes se muestra en el cuadro Mostramos solamente el contraste bilateral ya que los unilaterales se construyen exactamente de la misma manera que en los casos anteriores. H 0 :µ = µ 0 Hipótesis: H a :µ! µ 0 Nivel de significación: α Estadígrafo de contraste: Z = x! µ 0 S ˆ n Distribución del estadígrafo cuando la hipótesis nula es cierta: N(0, 1) Región de aceptación: { Z / Z! z "/ } { } Región critica: Z / Z > z!/ Cuadro 4.10: Contraste para la media de una población Normal con varianza desconocida cuando la muestra es grande.

37 Contraste para la diferencia de medias de dos poblaciones normales con datos independientes Planteamiento general En la investigación aplicada la situación más habitual es aquella en la que se quieren comparar dos poblaciones a las que se les ha aplicado, por ejemplo, dos tratamientos diferentes. Pongámonos en el mismo supuesto que en el ejemplo que sirvió para ilustrar el contraste para una población, y supongamos que lo que deseamos es conocer si los vinos de nuestra denominación de origen tienen el mismo contenido alcohólico que los de otra denominación de origen, por ejemplo la de Toro. Se trata de saber si existe una clara diferenciación en los mismos ya que, debido a la proximidad geográfica de ambas regiones, es posible que haya fraudes y se intercambien vinos de ambas dependiendo del mercado de los mismos. La hipótesis de trabajo inicial es entonces Existen diferencias en el grado alcohólico de ambas denominaciones?. Procediendo de la misma manera que en el caso de una población, suponemos una distribución de probabilidad para la población que es la distribución Normal. En la primera población (Ribera de Duero) el grado alcohólico sigue una distribución Normal N(µ 1, σ 1 ); en la segunda población (Toro) el grado alcohólico sigue un Modelo Normal N(µ, σ ). Formulamos a continuación las hipótesis de trabajo en términos de los parámetros de los modelos. Las hipótesis nula y alternativa son ahora H 0 :µ 1 = µ (µ 1! µ = 0) H a :µ 1 " µ (µ 1! µ " 0) para el contraste bilateral. Vemos como el contraste de que las medias son iguales es equivalente al contraste de que la diferencia de medias vale 0. Supongamos que los datos obtenidos son los siguientes para muestras aleatorias

38 313 de tamaño n 1 = 14 y n = 6. Ribera de Duero 1,8 1,8 1,5 11,9 1,5 1,1 1, 1,6 13,0 1,4 1,6 1, 1,8 13,0 Toro 13,0 14,0 13, 13,4 13, 13,9 Tabla 4.: Grado alcohólico de 0 vinos de las denominaciones de origen de Ribera y Toro. Se supone que las muestras se han obtenido de forma independiente en ambas denominaciones. La estadística descriptiva básica para ambos grupos aparece en la tabla 4.3. Tabla 4.3: Descriptiva básica del grado alcohólico. Una primera aproximación a las diferencias entre los dos grupos sería la construcción de gráficos comparativos que muestren la estructura de los mismos, por ejemplo, un Box-Plot con los grupos separados. (Ver figura 4.17). Una simple inspección visual del gráfico nos muestra que hay una clara diferencia entre los grados de ambas denominaciones, a pesar de que la diferencia muestral es muy evidente necesitamos un procedimiento más formal para establecer si las diferencias observadas pueden ser consideradas estadísticamente significativas. Construiremos el procedimiento de contraste en varios supuestos comenzando desde el más sencillo hasta los más complejos.

39 314 Figura 4.4: Box plot para la comparación del grado alcohólico de las denominaciones de Ribera y Toro Varianzas conocidas Supongamos, para simplificar que las desviaciones típicas son conocidas, por ejemplo σ 1 = 0.5 y σ = 0.6 para las denominaciones de Ribera de Duero y Toro respectivamente. Desarrollaremos el procedimiento general para después aplicarlo a los datos de los que disponemos. Conocemos la distribución de la media muestral en ambas poblaciones. x 1! N(µ 1, " 1 n 1 ) x! N(µ, " n ) y ambas distribuciones son independientes. El estimador de la diferencia de medias poblacionales será la diferencia de medias muestrales y, como la diferencia de normales independientes es también una distribución Normal, tenemos que x 1! x " N(µ 1! µ, # 1 + # ) n 1 n

40 315 Estandarizando se obtiene que Z = (x 1! x )!(µ 1! µ ) " 1 n 1 + " n # N(0,1) Cuando la hipótesis nula es cierta µ 1! µ = 0 y se tiene que Z = (x 1! x ) " 1 n 1 + " n # N(0,1) luego Z será el estadígrafo de contraste que utilizaremos. El procedimiento de contraste completo se muestra el cuadro Solo se incluye el contraste bilateral ya que la construcción de los correspondientes unilaterales es la misma que en los casos previos y se deja como ejercicio al lector. Hipótesis: H 0 :µ 1 = µ (µ 1! µ = 0) H a :µ 1 " µ (µ 1! µ " 0) Nivel de significación: α Estadígrafo de contraste: Z = (x 1! x ) " 1 + " n 1 n Distribución del estadígrafo cuando la hipótesis nula es cierta: N(0, 1) Región de aceptación: { Z / Z! z "/ } { } Región critica: Z / Z > z!/ Cuadro 4.11: Contraste para la diferencia de medias de dos poblaciones normales con varianza conocida. Si aplicamos el contraste a los datos del ejemplo, obtenemos los resultados del cuadro 4.1.

41 316 Hipótesis: H 0 :µ 1 = µ (µ 1! µ = 0) H a :µ 1 " µ (µ 1! µ " 0) Nivel de significación: α= 0.05 (5%) ó 0.01 (1%) (1.59!13.450) Estadígrafo de contraste: Z = =! Valores críticos : para el 5% z 0.05 = 1,96 para el 1% z =,57 Decisión estadística: El valor del estadígrafo de contraste pertenece a la región crítica, por tanto rechazamos la hipótesis nula. Conclusión no estadística: La modificación en el proceso de fabricación ha aumentado significativamente el grado alcohólico. Cuadro 4.1: Contraste para la diferencia de medias de dos poblaciones normales con varianza desconocida Varianzas desconocidas pero iguales Supongamos ahora que las varianzas son desconocidas pero iguales (σ 1 = σ = σ). La distribución de la diferencia de medias muestrales es ahora Z = (x 1! x )!(µ 1! µ ) " n 1 n # N(0,1) Tenemos que eliminar el parámetro σ, para lo cual utilizaremos las distribuciones muestrales asociadas a las cuasi-varianzas muestrales (n 1!1)ˆ S 1 " # $ n1!1 y (n!1)ˆ S " # $ n!1 anteriores La suma de dos ji-cuadrado es también una ji-cuadrado, sumando las dos (n 1!1)ˆ S 1 " + (n!1)ˆ S " = (n 1!1)ˆ S 1 +(n!1)ˆ S " # $ n1 +n!

42 317 Suponiendo que ambas distribuciones son independientes *, podemos combinarlas para obtener una distribución t de Student. La variable aleatoria (x 1! x )! (µ 1! µ ) t = " n 1 n (n 1!1)ˆ S 1 + (n!1)ˆ S " n 1 + n! = (x 1! x )! (µ 1! µ ) S ˆ n 1 n con ˆ S = libertad. (n 1!1) S ˆ 1 +(n!1)ˆ S n 1 + n! sigue una t de Student con n 1 + n - grados de Si la hipótesis nula es cierta, el estadígrafo de contraste que utilizaremos es t = (x 1! x ) S ˆ n 1 n = t n1 +n! Es posible considerar un estadígrafo de contraste alternativo si se utilizan las varianzas muestrales en lugar de las cuasi-varianzas. Para ello basta tener en cuenta que las distribuciones muestrales asociadas a las varianzas son n 1 S 1! " # n1 $1 y n S! " # n $1 El nuevo estadígrafo de contraste es de la forma t = (x 1! x ) S 1 n n = t n1 +n! con S = n 1 S ˆ 1 + n S ˆ. Los dos estadísticos toman exactamente el mismo valor por lo n 1 + n! que pueden utilizarse indistintamente. Usaremos el calculado a partir de las cuasivarianzas porque son estimadores insesgados de la varianza poblacional. * La demostración puede encontrarse en cualquier libro de Estadística Matemática. No se ha incluido aquí porqwue supera los propósitos de este trabajo.

Biometría Clase 8 Pruebas de hipótesis para una muestra. Adriana Pérez 1

Biometría Clase 8 Pruebas de hipótesis para una muestra. Adriana Pérez 1 Biometría Clase 8 Pruebas de hipótesis para una muestra Adriana Pérez 1 Qué es una prueba de hipótesis? Es un proceso para determinar la validez de una aseveración hecha sobre la población basándose en

Más detalles

Test ( o Prueba ) de Hipótesis

Test ( o Prueba ) de Hipótesis Test de Hipótesis 1 Test ( o Prueba ) de Hipótesis Ejemplo: Una muestra de 36 datos tiene una media igual a 4.64 Qué puede deducirse acerca de la población de donde fue tomada? Se necesita contestar a

Más detalles

7.- PRUEBA DE HIPOTESIS

7.- PRUEBA DE HIPOTESIS 7.- PRUEBA DE HIPOTEI 7.1. INTRODUCCIÓN La estadística inferencial es el proceso de usar la información de una muestra para describir el estado de una población. in embargo es frecuente que usemos la información

Más detalles

Tests de hipótesis estadísticas

Tests de hipótesis estadísticas Tests de hipótesis estadísticas Test de hipótesis sobre la media de una población. Introducción con un ejemplo. Los tests de hipótesis estadísticas se emplean para muchos problemas, en particular para

Más detalles

Unidad 9. Estimación

Unidad 9. Estimación Unidad 9 Estimación Estimación En los capítulos anteriores se han estudiado las nociones fundamentales de distribución de probabilidad y distribución muestral. Estamos ya en condiciones de tratar los métodos

Más detalles

Tema 3. Variables aleatorias. Inferencia estadística

Tema 3. Variables aleatorias. Inferencia estadística Estadística y metodología de la investigación Curso 2012-2013 Pedro Faraldo, Beatriz Pateiro Tema 3. Variables aleatorias. Inferencia estadística 1. Introducción 1 2. Variables aleatorias 1 2.1. Variable

Más detalles

ESTADÍSTICA. Tema 3 Contrastes de hipótesis

ESTADÍSTICA. Tema 3 Contrastes de hipótesis ESTADÍSTICA Grado en CC. de la Alimentación Tema 3 Contrastes de hipótesis Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 1 Estructura de este tema Qué es un contraste

Más detalles

SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA PROF. Esther González Sánchez Departamento de Informática y Sistemas Facultad de Informática Universidad de Las Palmas de Gran Canaria

Más detalles

INFERENCIA ESTADÍSTICA

INFERENCIA ESTADÍSTICA INFERENCIA ESTADÍSTICA Pensemos en los tres siguientes ejemplos: Hacemos una encuesta entre los clientes de una tienda para preguntarles su opinión sobre cambios generales que pretendemos hacer en diversas

Más detalles

Inferencia Estadística

Inferencia Estadística Universidad Nacional de San Cristóbal de Huamanga Facultad de Ingeniería de Minas, Geología y Civil Departamento Académico de Matemática y Física Área de Estadística Inferencia Estadística Alejandro Guillermo

Más detalles

Métodos no paramétricos para la comparación de dos muestras

Métodos no paramétricos para la comparación de dos muestras Investigación Métodos no paramétricos para la comparación de dos muestras Métodos no paramétricos para la comparación de dos muestras Pértega Díaz, S. Unidad de Epidemiología Clínica y Bioestadística.

Más detalles

Una introducción a la ESTADÍSTICA INFERENCIAL

Una introducción a la ESTADÍSTICA INFERENCIAL Una introducción a la ESTADÍSTICA INFERENCIAL José Chacón Esta obra está bajo una licencia Reconocimiento No comercial Compartir bajo la misma licencia.5 de Creative Commons. Para ver una copia de esta

Más detalles

PRUEBAS DE HIPÓTESIS

PRUEBAS DE HIPÓTESIS PRUEBAS DE HIPÓTESIS Muchos problemas de ingeniería, ciencia, y administración, requieren que se tome una decisión entre aceptar o rechazar una proposición sobre algún parámetro. Esta proposición recibe

Más detalles

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS ANÁLISIS DE DATOS Hoy día vamos a hablar de algunas medidas de resumen de datos: cómo resumir cuando tenemos una serie de datos numéricos, generalmente en variables intervalares. Cuando nosotros tenemos

Más detalles

ESTIMACIÓN. puntual y por intervalo

ESTIMACIÓN. puntual y por intervalo ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio

Más detalles

LA DISTRIBUCIÓN NORMAL, LA CALCULADORA Y LAS NUEVAS TECNOLOGÍAS Abel Martín ( * ) Rosana Álvarez García ( )

LA DISTRIBUCIÓN NORMAL, LA CALCULADORA Y LAS NUEVAS TECNOLOGÍAS Abel Martín ( * ) Rosana Álvarez García ( ) LA DISTRIBUCIÓN NORMAL, LA CALCULADORA Y LAS NUEVAS TECNOLOGÍAS Abel Martín ( * ) Rosana Álvarez García ( ) La distribución Normal tiene numerosas aplicaciones en el campo de la Probabilidad y la Estadística,

Más detalles

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1 Fundamentos de Investigación de Operaciones Investigación de Operaciones de agosto de 200. Estandarización Cuando se plantea un modelo de LP pueden existir igualdades y desigualdades. De la misma forma

Más detalles

Clase 8: Distribuciones Muestrales

Clase 8: Distribuciones Muestrales Clase 8: Distribuciones Muestrales Distribución Muestral La inferencia estadística trata básicamente con generalizaciones y predicciones. Por ejemplo, podemos afirmar, con base a opiniones de varias personas

Más detalles

Ciudad de Guatemala, 2013

Ciudad de Guatemala, 2013 Ciudad de Guatemala, 2013 1 Clase 5 Muestreo y tamaño de muestra D i e g o A y c i n e n a diegoaa@ufm.edu Universidad Francisco Marroquín 2 Clases (Profesores) H o r a r i o Actividades en Grupo (Todos)

Más detalles

1. Introducción a la estadística 2. Estadística descriptiva: resumen numérico y gráfico de datos 3. Estadística inferencial: estimación de parámetros

1. Introducción a la estadística 2. Estadística descriptiva: resumen numérico y gráfico de datos 3. Estadística inferencial: estimación de parámetros TEMA 0: INTRODUCCIÓN Y REPASO 1. Introducción a la estadística 2. Estadística descriptiva: resumen numérico y gráfico de datos 3. Estadística inferencial: estimación de parámetros desconocidos 4. Comparación

Más detalles

Estadística Descriptiva

Estadística Descriptiva Estadística Descriptiva Observamos datos provenientes de una o varias muestras de la población bajo estudio. El objetivo es obtener conclusiones sobre toda la población a partir de la muestra observada.

Más detalles

Estadística aplicada y modelización. 15 de junio de 2005

Estadística aplicada y modelización. 15 de junio de 2005 Estadística aplicada y modelización. 15 de junio de 2005 SOLUCIÓN MODELO A 1. En una población de fumadores se quiere examinar la relación entre el número de cigarrillos que consumen diariamente y el número

Más detalles

Comparación de medias

Comparación de medias 12 Comparación de medias Irene Moral Peláez 12.1. Introducción Cuando se desea comprobar si los valores de una característica que es posible cuantificar (como podría ser la edad o la cifra de tensión arterial,

Más detalles

TEMA UNIDAD III:INFERENCIA ESTADÍSTICA 11.1. INTRODUCCIÓN

TEMA UNIDAD III:INFERENCIA ESTADÍSTICA 11.1. INTRODUCCIÓN PRUEBA DE HIPÓTESIS TEMA..INTRODUCCIÓN..ELEMENTOS DE LAS PRUEBAS DE HIPÓTESIS.3.PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL.3.. Caso: muestra grande.3.. Caso: muestra pequeña.4.prueba DE HIPÓTESIS PARA

Más detalles

INFERENCIA ESTADISTICA: CONTRASTE DE HIPÓTESIS

INFERENCIA ESTADISTICA: CONTRASTE DE HIPÓTESIS UNIVERSIDAD CENTROCCIDENTAL LISANDRO ALVARADO DECANATO DE MEDICINA DEPARTAMENTO DE MEDICINA PREVENTIVA Y SOCIAL SECCIÓN DE EPIDEMIOLOGÍA-BIOESTADÍSTICA INFERENCIA ESTADISTICA: CONTRASTE DE HIPÓTESIS Objetivo:

Más detalles

Tema 5. Variables aleatorias discretas

Tema 5. Variables aleatorias discretas Tema 5. Variables aleatorias discretas Resumen del tema 5.1. Definición de variable aleatoria discreta 5.1.1. Variables aleatorias Una variable aleatoria es una función que asigna un número a cada suceso

Más detalles

Pruebas de Hipótesis de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Pruebas de Hipótesis de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides Pruebas de ipótesis de Una y Dos Muestras UCR ECCI CI-35 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides ipótesis Estadísticas Conceptos Generales En algunos casos el científico

Más detalles

Capítulo 9. Regresión lineal simple

Capítulo 9. Regresión lineal simple Capítulo 9. Regresión lineal simple 9.1 Introducción Uno de los aspectos más relevantes de la Estadística es el análisis de la relación o dependencia entre variables. Frecuentemente resulta de interés

Más detalles

PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica.

PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica. PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica. Profesores: Javier Faulín y Francisco Ballestín 1. Introducción. El objetivo de esta parte es obtener resultados sobre contrastes de hipótesis

Más detalles

Academia de Matemáticas. Apuntes para la Materia de Estadística II. Guía Básica para el Estudio de la Estadística Inferencial.

Academia de Matemáticas. Apuntes para la Materia de Estadística II. Guía Básica para el Estudio de la Estadística Inferencial. UNIVERSIDAD MICHOACANA DE SAN NICOLÁS DE HIDALGO Facultad de Contaduría y Ciencias Administrativas Academia de Matemáticas Apuntes para la Materia de Estadística II Guía Básica para el Estudio de la Estadística

Más detalles

LA MEDIDA Y SUS ERRORES

LA MEDIDA Y SUS ERRORES LA MEDIDA Y SUS ERRORES Magnitud, unidad y medida. Magnitud es todo aquello que se puede medir y que se puede representar por un número. Para obtener el número que representa a la magnitud debemos escoger

Más detalles

Tema 12: Contrastes Paramétricos

Tema 12: Contrastes Paramétricos Tema 1 Tema 1: Contrastes Paramétricos Presentación y Objetivos. Se comienza este tema introduciendo la terminología y conceptos característicos de los contrastes de hipótesis, típicamente a través de

Más detalles

Asignatura: Econometría. Conceptos MUY Básicos de Estadística

Asignatura: Econometría. Conceptos MUY Básicos de Estadística Asignatura: Econometría Conceptos MUY Básicos de Estadística Ejemplo: encuesta alumnos matriculados en la UMH Estudio: Estamos interesados en conocer el nivel de renta y otras características de los estudiantes

Más detalles

Comparaciones múltiples

Comparaciones múltiples Capítulo 3 Comparaciones múltiples 3.. ntroducción En este capítulo explicaremos algunas técnicas para analizar con mayor detalle los datos de un experimento, con posterioridad a la realización del Análisis

Más detalles

Capítulo 7: Distribuciones muestrales

Capítulo 7: Distribuciones muestrales Capítulo 7: Distribuciones muestrales Recordemos: Parámetro es una medida de resumen numérica que se calcularía usando todas las unidades de la población. Es un número fijo. Generalmente no lo conocemos.

Más detalles

Tema 1. Inferencia estadística para una población

Tema 1. Inferencia estadística para una población Tema 1. Inferencia estadística para una población Contenidos Inferencia estadística Estimadores puntuales Estimación de la media y la varianza de una población Estimación de la media de la población mediante

Más detalles

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1 Fundamentos de Investigación de Operaciones Investigación de Operaciones 1 1 de agosto de 2003 1. Introducción Cualquier modelo de una situación es una simplificación de la situación real. Por lo tanto,

Más detalles

T.1 CONVERGENCIA Y TEOREMAS LÍMITE

T.1 CONVERGENCIA Y TEOREMAS LÍMITE T.1 CONVERGENCIA Y TEOREMAS LÍMITE 1. CONVERGENCIA DE SUCESIONES DE VARIABLES ALEATORIA CONVERGENCIA CASI-SEGURA CONVERGENCIA EN PROBABILIDAD CONVERGENCIA EN MEDIA CUADRÁTICA CONVERGENCIA EN LEY ( O DISTRIBUCIÓN)

Más detalles

INFERENCIA ESTADÍSTICA: CONTRASTE DE HIPÓTESIS

INFERENCIA ESTADÍSTICA: CONTRASTE DE HIPÓTESIS INFERENCIA ESTADÍSTICA: CONTRASTE DE HIPÓTESIS Página 311 REFLEXIONA Y RESUELVE Máuina empauetadora El fabricante de una máuina empauetadora afirma ue, si se regula para ue empauete palés con 100 kg, los

Más detalles

Análisis estadístico. Tema 1 de Biología NS Diploma BI Curso 2013-2015

Análisis estadístico. Tema 1 de Biología NS Diploma BI Curso 2013-2015 Análisis estadístico Tema 1 de Biología NS Diploma BI Curso 2013-2015 Antes de comenzar Sobre qué crees que trata esta unidad? - Escríbelo es un post-it amarillo. Pregunta guía Cómo podemos saber si dos

Más detalles

Imagen de Rosaura Ochoa con licencia Creative Commons

Imagen de Rosaura Ochoa con licencia Creative Commons Imagen de Rosaura Ochoa con licencia Creative Commons Durante el primer tema hemos aprendido a elaborar una encuesta. Una vez elaborada la encuesta necesitamos escoger a los individuos a los que se la

Más detalles

CONTRASTES DE HIPÓTESIS DE 1 POBLACIÓN

CONTRASTES DE HIPÓTESIS DE 1 POBLACIÓN CONTRASTES DE IPÓTESIS DE POBLACIÓN Autores: Alicia Vila (avilag@uoc.edu), Máximo Sedano (msedanoh@uoc.edu), Ángel A. Juan (ajuanp@uoc.edu), Anna López (alopezrat@uoc.edu). ESQUEMA DE CONTENIDOS Definición

Más detalles

1-Comportamiento de una función alrededor de un punto:

1-Comportamiento de una función alrededor de un punto: Matemática II 7 Modulo Límites continuidad En esta sección desarrollaremos el concepto de límite, una de las nociones fundamentales del cálculo. A partir de este concepto se desarrollan también los conceptos

Más detalles

Curso de Estadística no-paramétrica

Curso de Estadística no-paramétrica Curso de Estadística no-paramétrica Sesión 1: Introducción Inferencia no Paramétrica David Conesa Grup d Estadística espacial i Temporal Departament d Estadística en Epidemiologia i Medi Ambient i Investigació

Más detalles

UNED. [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes.

UNED. [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes. 2009 UNED [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes. 1 ÍNDICE 3.1 Introducción 3.2 Objetivos 3.3 Muestras independientes o relacionadas 3.4 Contraste de hipótesis sobre

Más detalles

Métodos generales de generación de variables aleatorias

Métodos generales de generación de variables aleatorias Tema Métodos generales de generación de variables aleatorias.1. Generación de variables discretas A lo largo de esta sección, consideraremos una variable aleatoria X cuya función puntual es probabilidad

Más detalles

CUESTIONES DE AUTOEVALUACIÓN (TEMA 1)

CUESTIONES DE AUTOEVALUACIÓN (TEMA 1) CUESTIONES DE AUTOEVALUACIÓN (TEMA 1) Cuestiones de Verdadero/Falso 1. Un estadístico es una característica de una población. 2. Un parámetro es una característica de una población. 3. Las variables discretas

Más detalles

8.2.2. Intervalo para la media (caso general)

8.2.2. Intervalo para la media (caso general) 182 Bioestadística: Métodos y Aplicaciones 100 de ellos se obtiene una media muestral de 3 kg, y una desviación típica de 0,5 kg, calcular un intervalo de confianza para la media poblacional que presente

Más detalles

Inferencia Estadística

Inferencia Estadística MaMaEuSch Management Mathematics for European Schools http://www.mathematik.unikl.de/ mamaeusch Inferencia Estadística Paula Lagares Barreiro * Justo Puerto Albandoz * MaMaEuSch ** Management Mathematics

Más detalles

Anexo 4. Herramientas Estadísticas

Anexo 4. Herramientas Estadísticas Anexo 4 Herramientas Estadísticas La estadística descriptiva es utilizada como una herramienta para describir y analizar las características de un conjunto de datos, así como las relaciones que existen

Más detalles

Universidad Católica del Maule. Fundamentos de Computación Especificación de tipos de datos ESPECIFICACIÓN ALGEBRAICA DE TIPOS DE DATOS

Universidad Católica del Maule. Fundamentos de Computación Especificación de tipos de datos ESPECIFICACIÓN ALGEBRAICA DE TIPOS DE DATOS Especificación algebraica ESPECIFICACIÓN ALGEBRAICA DE TIPOS DE DATOS Un tipo abstracto de datos se determina por las operaciones asociadas, incluyendo constantes que se consideran como operaciones sin

Más detalles

1 Introducción a contrastes de hipótesis

1 Introducción a contrastes de hipótesis Inferencia Estadística II Teoría, handout 1 1 Introducción a contrastes de hipótesis En este curso vamos a aprender a usar los datos para cuestionar la validez de ciertas afirmaciones teóricas. Los fenómenos

Más detalles

Problemas de Probabilidad resueltos.

Problemas de Probabilidad resueltos. Problemas de Probabilidad resueltos. Problema 1 El profesor Pérez olvida poner su despertador 3 de cada 10 dias. Además, ha comprobado que uno de cada 10 dias en los que pone el despertador acaba no levandandose

Más detalles

Límites y Continuidad de funciones

Límites y Continuidad de funciones CAPITULO Límites y Continuidad de funciones Licda. Elsie Hernández Saborío Instituto Tecnológico de Costa Rica Escuela de Matemática Revista digital Matemática, educación e internet (www.cidse.itcr.ac.cr)

Más detalles

1.1. Introducción y conceptos básicos

1.1. Introducción y conceptos básicos Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................

Más detalles

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales Cuando se analizan datos, el interés del analista suele centrarse en dos grandes objetivos:

Más detalles

Métodos estadísticos y numéricos Contraste de hipótesis pag. 1 PROBLEMAS RESUELTOS DE CONTRASTE DE HIPÓTESIS

Métodos estadísticos y numéricos Contraste de hipótesis pag. 1 PROBLEMAS RESUELTOS DE CONTRASTE DE HIPÓTESIS Métodos estadísticos y numéricos Contraste de hipótesis pag. 1 PROBLEMA REUELTO DE CONTRATE DE HIPÓTEI 1 Un investigador quiere contrastar si el peso medio de ciertas hortalizas está en los 1,9 Kg. que

Más detalles

Capítulo 4 MEDIDA DE MAGNITUDES. Autor: Santiago Ramírez de la Piscina Millán

Capítulo 4 MEDIDA DE MAGNITUDES. Autor: Santiago Ramírez de la Piscina Millán Capítulo 4 MEDIDA DE MAGNITUDES Autor: Santiago Ramírez de la Piscina Millán 4 MEDIDA DE MAGNITUDES 4.1 Introducción El hecho de hacer experimentos implica la determinación cuantitativa de las magnitudes

Más detalles

Botella-Rocamora, P.; Alacreu-García, M.; Martínez-Beneito, M.A.;

Botella-Rocamora, P.; Alacreu-García, M.; Martínez-Beneito, M.A.; Inferencia estadística (intervalos de confianza y p-valor). Comparación de dos poblaciones (test t de comparación de medias, comparación de dos proporciones, comparación de dos varianzas). Botella-Rocamora,

Más detalles

VECTORES. Módulo, dirección y sentido de un vector fijo En un vector fijo se llama módulo del mismo a la longitud del segmento que lo define.

VECTORES. Módulo, dirección y sentido de un vector fijo En un vector fijo se llama módulo del mismo a la longitud del segmento que lo define. VECTORES El estudio de los vectores es uno de tantos conocimientos de las matemáticas que provienen de la física. En esta ciencia se distingue entre magnitudes escalares y magnitudes vectoriales. Se llaman

Más detalles

Pero qué hacemos cuando no se cumple la normalidad o tenemos muy pocos datos?

Pero qué hacemos cuando no se cumple la normalidad o tenemos muy pocos datos? Capítulo. Métodos no paramétricos Los métodos presentados en los capítulos anteriores, se basaban en el conocimiento de las distribuciones muestrales de las diferencias de porcentajes o promedios, cuando

Más detalles

MANUAL SIMPLIFICADO DE ESTADÍSTICA APLICADA VIA SPSS

MANUAL SIMPLIFICADO DE ESTADÍSTICA APLICADA VIA SPSS 1 MANUAL SIMPLIFICADO DE ESTADÍSTICA APLICADA VIA SPSS Medidas de tendencia central Menú Analizar: Los comandos del menú Analizar (Estadística) ejecutan los procesamientos estadísticos. Sus comandos están

Más detalles

Clase 2: Estadística

Clase 2: Estadística Clase 2: Estadística Los datos Todo conjunto de datos tiene al menos dos características principales: CENTRO Y DISPERSIÓN Los gráficos de barra, histogramas, de puntos, entre otros, nos dan cierta idea

Más detalles

Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos

Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos Capítulo 10 Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos Al analizar datos, lo primero que conviene hacer con una variable es, generalmente, formarse una idea lo más exacta posible

Más detalles

Tema 3. Comparaciones de dos poblaciones

Tema 3. Comparaciones de dos poblaciones Tema 3. Comparaciones de dos poblaciones Contenidos Hipótesis para la diferencia entre las medias de dos poblaciones: muestras pareadas Hipótesis para la diferencia entre las medias de dos poblaciones:

Más detalles

4. HERRAMIENTAS ESTADÍSTICAS

4. HERRAMIENTAS ESTADÍSTICAS 4. HERRAMIENTAS ESTADÍSTICAS 4.1 Definiciones La mayor parte de las decisiones se toman en función de la calidad, como en la mayoría de las demás áreas del moderno esfuerzo humano (por ejemplo, en la evaluación

Más detalles

Población, Unidad de Análisis, Criterios de Inclusión y Exclusión.

Población, Unidad de Análisis, Criterios de Inclusión y Exclusión. Población Población, Unidad de Análisis, Criterios de Inclusión y Exclusión. Muestra: Identificación y Reclutamiento. Nomenclatura En esta aproximación conceptual consideraremos a Población como sinónimo

Más detalles

Clase 2: Estadística

Clase 2: Estadística Clase 2: Estadística Los datos Todo conjunto de datos tiene al menos dos características principales: CENTRO Y DISPERSIÓN Los gráficos de barra, histogramas, de puntos, entre otros, nos dan cierta idea

Más detalles

Contrastes de Hipótesis

Contrastes de Hipótesis Capítulo 8 Contrastes de Hipótesis 8.1. Introducción. Conceptos básicos Una hipótesis estadística es una afirmación acerca de una característica poblacional formulada en base a los parámetros de su distribución.

Más detalles

EJERCICIOS RESUMEN. Aplicación: INFERENCIA ESTADÍSTICA. Nota técnica preparada por: Mayte Zaragoza Benítez Fecha: 13 de mayo de 2013

EJERCICIOS RESUMEN. Aplicación: INFERENCIA ESTADÍSTICA. Nota técnica preparada por: Mayte Zaragoza Benítez Fecha: 13 de mayo de 2013 Aplicación: INFERENCIA ESTADÍSTICA EJERCICIOS RESUMEN Nota técnica preparada por: Mayte Zaragoza Benítez Fecha: 13 de mayo de 2013 Página1 DESCRIP Ejercicio 1 Los siguientes son los números de cambios

Más detalles

Inferencia Estadística

Inferencia Estadística Felipe José Bravo Márquez 11 de noviembre de 2013 Para realizar conclusiones sobre una población, generalmente no es factible reunir todos los datos de ésta. Debemos realizar conclusiones razonables respecto

Más detalles

T. 8 Estadísticos de asociación entre variables

T. 8 Estadísticos de asociación entre variables T. 8 Estadísticos de asociación entre variables. Concepto de asociación entre variables. Midiendo la asociación entre variables.. El caso de dos variables categóricas.. El caso de una variable categórica

Más detalles

Selectividad Septiembre 2013 OPCIÓN B

Selectividad Septiembre 2013 OPCIÓN B Pruebas de Acceso a las Universidades de Castilla y León ATEÁTICAS APLICADAS A LAS CIENCIAS SOCIALES EJERCICIO Nº páginas Tablas OPTATIVIDAD: EL ALUNO DEBERÁ ESCOGER UNA DE LAS DOS OPCIONES Y DESARROLLAR

Más detalles

ANEXO I. MATERIAS DE BACHILLERATO

ANEXO I. MATERIAS DE BACHILLERATO El artículo 29 en su apartado 6 del R.D. 1892/2008, dice: El establecimiento de las líneas generales de la metodología, el desarrollo y los contenidos de los ejercicios que integran tanto la fase general

Más detalles

El álgebra booleana (Algebra de los circuitos lógicos tiene muchas leyes o teoremas muy útiles tales como :

El álgebra booleana (Algebra de los circuitos lógicos tiene muchas leyes o teoremas muy útiles tales como : SIMPLIFICACION DE CIRCUITOS LOGICOS : Una vez que se obtiene la expresión booleana para un circuito lógico, podemos reducirla a una forma más simple que contenga menos términos, la nueva expresión puede

Más detalles

MATEMÁTICAS aplicadas a las Ciencias Sociales II

MATEMÁTICAS aplicadas a las Ciencias Sociales II MATEMÁTICAS aplicadas a las Ciencias Sociales II UNIDAD 1: SISTEMAS DE ECUACIONES. MÉODO DE GAUSS Sistemas de ecuaciones lineales Sistemas equivalentes. Transformaciones que mantienen la equivalencia.

Más detalles

RELATIVIDAD EN LA FÍSICA

RELATIVIDAD EN LA FÍSICA Capítulo 8 RELATIVIDAD EN LA FÍSICA CLÁSICA 1 8.1 Transformaciones de Galileo y Mecánica Sea S un sistema de referencia en el que se verifican las leyes de la Mecánica Clásica. Estos sistemas se denominan

Más detalles

UNIDAD DIDÁCTICA 7 ANÁLISIS DE ÍTEMS Y BAREMACIÓN DE UN TEST

UNIDAD DIDÁCTICA 7 ANÁLISIS DE ÍTEMS Y BAREMACIÓN DE UN TEST UNIDAD DIDÁCTICA 7 ANÁLISIS DE ÍTEMS Y BAREMACIÓN DE UN TEST 7.1. ANÁLISIS DE LOS ÍTEMS Al comenzar la asignatura ya planteábamos que uno de los principales problemas a los que nos enfrentábamos a la hora

Más detalles

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA 5.1 Introducción En este capítulo nos ocuparemos de la estimación de caracteristicas de la población a partir de datos. Las caracteristicas poblacionales

Más detalles

Curso: Métodos de Monte Carlo Unidad 2, Sesión 6: Integración por Monte Carlo

Curso: Métodos de Monte Carlo Unidad 2, Sesión 6: Integración por Monte Carlo Curso: Métodos de Monte Carlo Unidad 2, Sesión 6: Integración por Monte Carlo Departamento de Investigación Operativa Instituto de Computación, Facultad de Ingeniería Universidad de la República, Montevideo,

Más detalles

Resolución de problemas. Temas: VOR e ILS

Resolución de problemas. Temas: VOR e ILS Resolución de problemas. Temas: VOR e ILS Autor: Mario E. Casado García 3er Curso ITT ST Índice 1. Problema tema 5: VOR......3 2. Problema tema 7: ILS.....7 3. Referencias..12 2 1. Problema tema 5: VOR

Más detalles

3. ANÁLISIS ESTADÍSTICOS DE LAS PRECIPITACIONES EN EL MAR CASPIO

3. ANÁLISIS ESTADÍSTICOS DE LAS PRECIPITACIONES EN EL MAR CASPIO Análisis estadístico 31 3. ANÁLII ETADÍTICO DE LA PRECIPITACIONE EN EL MAR CAPIO 3.1. ANÁLII Y MÉTODO ETADÍTICO UTILIZADO 3.1.1. Introducción Una vez analizado el balance de masas que afecta al mar Caspio

Más detalles

Nombre...Apellidos... Grado en:...grupo:...

Nombre...Apellidos... Grado en:...grupo:... ESTADÍSTICA E INTRODUCCIÓN A LA ECONOMETRÍA - Soluciones Estadística- Curso 01/1. 9 de Julio de 01 Nombre...Apellidos... Grado en:...grupo:... 1. Considera la variable aleatoria (v.a.) X cuyos posibles

Más detalles

Tema 1: Test de Distribuciones de Probabilidad

Tema 1: Test de Distribuciones de Probabilidad Tema 1: Test de Distribuciones de Probabilidad 1.- Una compañía de seguros tiene 1000 asegurados en el ramo de accidentes. Si la el modelo mejor para el número de siniestros en un año es: a) Normal (5;,3).

Más detalles

Experimentos con un solo factor: El análisis de varianza. Jhon Jairo Padilla Aguilar, PhD.

Experimentos con un solo factor: El análisis de varianza. Jhon Jairo Padilla Aguilar, PhD. Experimentos con un solo factor: El análisis de varianza Jhon Jairo Padilla Aguilar, PhD. Experimentación en sistemas aleatorios: Factores Controlables Entradas proceso Salidas Factores No controlables

Más detalles

Las reglas se parecen un poco a las vistas relacionales. Especifican relaciones virtuales que no están

Las reglas se parecen un poco a las vistas relacionales. Especifican relaciones virtuales que no están BASES DE DATOS DEDUCTIVAS Introducción: El interés de los Sistemas de Gestión de Bases de Datos Deductivas tiende a incrementarse conforme se amplía su campo de aplicación (Gestión, Sistemas Expertos).

Más detalles

Selectividad Septiembre 2009 SEPTIEMBRE 2009. Opción A

Selectividad Septiembre 2009 SEPTIEMBRE 2009. Opción A SEPTIEMBRE 2009 Opción A 1.- Como cada año, el inicio del curso académico, una tienda de material escolar prepara una oferta de 600 cuadernos, 500 carpetas y 400 bolígrafos para los alumnos de un IES,

Más detalles

Métodos y Diseños utilizados en Psicología

Métodos y Diseños utilizados en Psicología Métodos y Diseños utilizados en Psicología El presente documento pretende realizar una introducción al método científico utilizado en Psicología para recoger información acerca de situaciones o aspectos

Más detalles

PRUEBAS NO PARAMÉTRICAS

PRUEBAS NO PARAMÉTRICAS PRUEBAS NO PARAMÉTRICAS 1. PRUEBAS DE NORMALIDAD Para evaluar la normalidad de un conjunto de datos tenemos el Test de Kolmogorov- Smirnov y el test de Shapiro-Wilks La opción NNPLOT del SPSS permite la

Más detalles

Tema 2. Espacios Vectoriales. 2.1. Introducción

Tema 2. Espacios Vectoriales. 2.1. Introducción Tema 2 Espacios Vectoriales 2.1. Introducción Estamos habituados en diferentes cursos a trabajar con el concepto de vector. Concretamente sabemos que un vector es un segmento orientado caracterizado por

Más detalles

CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL Y GRAPH

CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL Y GRAPH CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL Y GRAPH 1) ANÁLISIS DE CORRELACIÓN Dado dos variables, la correlación permite hacer estimaciones del valor de una de ellas conociendo el valor de la otra variable.

Más detalles

TEMA 5. MUESTREO PARA LA ACEPTACIÓN.

TEMA 5. MUESTREO PARA LA ACEPTACIÓN. TEMA 5. MUESTREO PARA LA ACEPTACIÓN. Introducción. Planes de muestreo por atributos simple, doble, múltiple y rectificativos Dodge-Romig, Norma militar 1000STD-105D. Pautas a seguir para el cambio de rigor

Más detalles

CAPÍTULO 1: ESTADÍSTICA Y MÉTODO CIENTÍFICO

CAPÍTULO 1: ESTADÍSTICA Y MÉTODO CIENTÍFICO Página 1 de 11 CAPÍTULO 1: ESTADÍSTICA Y MÉTODO CIENTÍFICO Podemos definir Estadística como la ciencia de los datos. La palabra ciencia viene del latín scientia que significa conocimiento. El método científico

Más detalles

Tema 10. Estimación Puntual.

Tema 10. Estimación Puntual. Tema 10. Estimación Puntual. Presentación y Objetivos. 1. Comprender el concepto de estimador y su distribución. 2. Conocer y saber aplicar el método de los momentos y el de máxima verosimilitud para obtener

Más detalles

ESTUDIO DE LOS EJEMPLOS RESUELTOS 7.1, 7.2 Y 7.8 DEL LIBRO DE FUNDAMENTOS FÍSICOS DE LA INFORMÁTICA.

ESTUDIO DE LOS EJEMPLOS RESUELTOS 7.1, 7.2 Y 7.8 DEL LIBRO DE FUNDAMENTOS FÍSICOS DE LA INFORMÁTICA. ESTUIO E LOS EJEMPLOS RESUELTOS.1,.2 Y.8 EL LIRO E FUNMENTOS FÍSIOS E L INFORMÁTI. Resolver un circuito implica conocer las intensidades que circula por cada una de sus ramas lo que permite conocer la

Más detalles

Usamos que f( p) = q y que, por tanto, g( q) = g(f( p)) = h( p) para simplificar esta expresión:

Usamos que f( p) = q y que, por tanto, g( q) = g(f( p)) = h( p) para simplificar esta expresión: Univ. de Alcalá de Henares Ingeniería de Telecomunicación Cálculo. Segundo parcial. Curso 2004-2005 Propiedades de las funciones diferenciables. 1. Regla de la cadena Después de la generalización que hemos

Más detalles

EJERCICIOS RESUELTOS TEMA 3

EJERCICIOS RESUELTOS TEMA 3 EJERCICIOS RESUELTOS TEMA 3 Observación: En todos los ejercicios se ha puesto A, como notación de contrario de A. Ejercicio nº 1.- En una urna hay 15 bolas numeradas de 2 al 16. Extraemos una bola al azar

Más detalles

Tema 07. LÍMITES Y CONTINUIDAD DE FUNCIONES

Tema 07. LÍMITES Y CONTINUIDAD DE FUNCIONES Tema 07 LÍMITES Y CONTINUIDAD DE FUNCIONES Límite de una función en un punto Vamos a estudiar el comportamiento de las funciones f ( ) g ( ) ENT[ ] h ( ) i ( ) en el punto Para ello, damos a valores próimos

Más detalles

Diagnosis y Crítica del modelo -Ajuste de distribuciones con Statgraphics-

Diagnosis y Crítica del modelo -Ajuste de distribuciones con Statgraphics- Diagnosis y Crítica del modelo -Ajuste de distribuciones con Statgraphics- 1. Introducción Ficheros de datos: TiempoaccesoWeb.sf3 ; AlumnosIndustriales.sf3 El objetivo de esta práctica es asignar un modelo

Más detalles

GUÍA DE EJERCICIOS UNIDAD II

GUÍA DE EJERCICIOS UNIDAD II UNIDAD II: INTEGRAL DEFINIDA UNIVERSIDAD DE CARABOBO FACULTAD DE INGENIERÍA ESTUDIOS BÁSICOS DEPARTAMENTO DE MATEMÁTICA ANÁLISIS MATEMÁTICO II Corregido por: Prof. AOUAD Jamil Prof. LAURENTÍN María Prof.

Más detalles