Inferencia Estadística

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Inferencia Estadística"

Transcripción

1 MaMaEuSch Management Mathematics for European Schools mamaeusch Inferencia Estadística Paula Lagares Barreiro * Justo Puerto Albandoz * MaMaEuSch ** Management Mathematics for European Schools CP DE - COMENIUS - C1 * Universidad de Sevilla ** Este proyecto ha sido llevado a cabo con ayuda parical de la Comunidad Europea en el marco del programa Sócrates. El contenido del proyecto no reflejy necesariamente la posición de la Comunidad Europea, ni implica ninguna responsabilidad por su parte.

2 Índice general 1. Inferencia Estadística 1.1. Introducción a la Inferencia Estadística Distribución en el muestreo de un estadístico o estimador Estimación puntual. Distribución en el muestreo de los principales estimadores Estimación por intervalos Errores de estimación y tamaño de la muestra Contrastes de hipótesis Relación entre los intervalos de confianza y los contrastes de hipótesis Test de la bondad de ajuste Contrastes de dependencia o independencia de caracteres Test de homogeneidad de varias muestras Inferencia bayesiana Un ejemplo de aplicación de la inferencia Para una población Para dos poblaciones

3 Capítulo 1 Inferencia Estadística Dedicaremos este capítulo a ver de qué manera podemos inferir conclusiones sobre una población a través de los datos obtenidos mediante un muestreo. Haremos un recorrido por los diferentes conceptos que se necesitan conocer, así como las técnicas a nuestro alcance Introducción a la Inferencia Estadística Partimos de una muestra de 60 alumnos de una población de 544 alumnos en un Centro de Enseñanza Secundaria (CES). Una vez que tenemos los datos muestrales nos podemos hacer preguntas sobre el total de la población. Por ejemplo, crees que podemos decir que la media de la altura de los alumnos del CES es mayor de 1 70? Crees que 7 euros es un valor apropiado para representar la media de la paga de los alumnos de todo el centro? Podemos decir que los datos de altura de los alumnos a los que les hemos preguntado son normales? La Inferencia Estadística responderá a estas cuestiones. La Inferencia Estadística se compone de muchos métodos, que responden a preguntas muy variadas, según el objeto del estudio. Cuál es una buena estimación de la altura media de los alumnos del centro? Preguntas como ésta se resuelven mediante métodos paramétricos, en los que supondremos conocida la distribución de la población y estudiaremos sus parámetros. Cómo se distribuyen los datos de paga de los alumnos del centro? La respuesta a este tipo de preguntas, que se refieren a la distribución de la población, se resuelven mediante métodos no paramétricos. También existen diferentes métodos según la información de la que dispongamos y que utilicemos: Supongamos que la media de la altura de los alumnos del centro es un valor fijo que pretendemos conocer a través de la información que nos da la muestra. En este caso hablamos de inferencia clásica. También podemos suponer que la media de las alturas de los alumnos del centro es una variable aleatoria y que podemos conocer información a priori sobre esta variable. En este caso hablaríamos de inferencia bayesiana En caso de que decidamos utilizar la inferencia clásica podemos extraer nuestras conclusiones de diferentes maneras. Podemos buscar un valor para la altura media de los alumnos del centro (que calcularemos a través de un estimador o estadístico) que consideraremos como valor del parámetro. En este caso haríamos estimación puntual. Podemos buscar también un intervalo aleatorio dentro del cual podríamos encontrar con una determinada seguridad el verdadero valor del parámetro, por ejemplo, el verdadero valor de la media de la paga de los alumnos del centro. En este caso estaríamos hablando de estimación por intervalos. Imagina que tenemos un posible valor para la media de la altura de los alumnos del centro y queremos probar si este valor es aceptable con una cierta confianza. En este caso haríamos un contraste de hipótesis.

4 Inferencia según objetivo estudio, según tipo información, { métodos paramétricos métodos no paramétricos inferencia clásica inferencia bayesiana Estimación Contraste de hipótesis { puntual por intervalos 1.. Distribución en el muestreo de un estadístico o estimador Tenemos, como ya hemos dicho, una muestra de tamaño 60 de nuestra población de alumnos de un CES. Estamos estudiando la paga y la altura de dichos alumnos. Si queremos conocer la media de la paga de los alumnos del centro, podemos utilizar los datos de los 60 alumnos que tenemos para hallar un aproximación a lo que buscamos. Qué podríamos usar para predecir el valor de la paga media de la población? Lo lógico es pensar que si hallamos la media de los valores muestrales, nos acercaremos al valor poblacional. La media muestral es para nosotros un estimador. Ahora bien, imaginemos que otro compañero tuyo tiene una muestra de tamaño 60 de la población, que obviamente, debe ser diferente a la que hemos obtenido nosotros. En ese caso, si calcula la media muestral obtendrá el mismo valor que hemos obtenido nosotros? La respuesta es que generalmente no obtendrá el mismo valor. Nos interesa conocer entonces cómo varía la media muestral al cambiar los datos muestrales. Nuestro estimador se va a comportar como una variable aleatoria. Vamos a denominar estadístico a toda función de los valores muestrales. Dicha función asignará a cada posible muestra un valor numérico, por lo que en realidad, se tiene una variable aleatoria que tendrá una distribución de probabilidad. A la distribución de probabilidad de esta variable aleatoria se le llama distribución en el muestreo del estadístico que dependerá, evidentemente, de los parámetros desconocidos de la población y que son objeto de estudio. Se denomina estimador de un parámetro poblacional desconocido a todo estadístico que nos da un valor que, para la mayoría de las muestras, está próximo a un parámetro poblacional desconocido. Ejemplo 1..1 Imagina que tenemos en una bolsa tres papeletas. Vamos a hacer un sorteo en el que habrá dos posibles ganadores, es decir, una persona sacará una papeleta, y luego la volvemos a introducir y otra persona sacará otra papeleta. Una empresa se compromete a darnos para el viaje de fin de curso la media de lo que obtengamos entre las dos papeletas. Las papeletas tienen un valor de 0 euros, 500 euros y 1000 euros. Cómo se comportaría la media de estas muestras de tamaño sobre nuestra población de tres papeletas? Qué es lo más probable? Las posibilidades que tenemos son las siguientes: (0, 0), (0, 500), (0, 1000), (500, 0), (500, 500), (500, 1000), (1000, 0), (1000, 500), (1000, 1000). Calculamos la media de todas ellas y vemos con qué probabilidad aparece cada valor X =media Probabilidad 1/9 /9 3/9 /9 1/9 La media de la población (0, 500, 1000) es 500 y la varianza es mientras que para la variable aleatoria media muestral la media es 500 y la varianza es Como vemos tiene la misma media pero la varianza de la media es algo menor. Si representamos la distribución de la media muestral, vemos que: se acerca a una distribución normal. El Teorema Central del Límite viene a corroborar el hecho que acabamos de observar en el ejemplo anterior. Dada una variable aleatoria con media µ y varianza σ, la distribución de las medias de las muestras, a medida que n (tamaño muestral) aumenta hacia infinito tiende asintóticamente a una distribución N(µ, σ/ n). En el ejemplo anterior se han hallado todas las muestras posibles, pero imagina lo que supondrían los cálculos en caso de que quisiéramos hallar todas las muestras posibles de 60 alumnos para los 544 del centro. Sería interminable realizar todos esos cálculos. Por ello, se suele utilizar el método de Montecarlo, que consiste en simular, mediante las tablas de números aleatorios o el ordenador, la obtención de un gran número de muestras y a ellas se les calcula el valor del estadístico, con lo que se obtiene una distribución de probabilidad aproximada (tanto más cuanto mayor sea el número de muestras que se generen). 3

5 1.3. Estimación puntual. Distribución en el muestreo de los principales estimadores Llegó el momento de estimar los valores de los parámetros de la población. Queremos conocer la media y la varianza de la altura de los alumnos del centro y de su paga. Podemos tomar como estimación el valor de la media muestral y de la varianza muestral para nuestra muestra de 60 alumnos de los 544. En este caso, estaremos haciendo una estimación puntual, ya que estimamos el valor del parámetro desconocido a través de un único valor del estimador. Ahora bien coincide la media de la distribución de nuestro estimador con el valor de nuestro parámetro poblacional? Por ejemplo, la media de la varianza muestral no coincide con la varianza poblacional, así que no será un buen estimador de la varianza. Se acerca el valor de la estimación cada vez más al parámetro si aumentamos el tamaño de la muestra? Estas y otras propiedades son deseables en un estimador. A la hora de estimar el valor del parámetro poblacional se exige al estadístico una serie de propiedades con el fin de obtener una estimación aceptable: Centrado o insesgado: la media de la distribución muestral del estadístico muestral coincide con el parámetro poblacional desconocido. Consistente: al aumentar el tamaño de la muestra, el valor medio de la distribución muestral del estadístico muestral tiende al parámetro estimado. Eficiente: que sea el de menor varianza de todos los centrados. Suficiente: facilita toda la información acerca del parámetro que poseen los datos de la muestra. Dada una muestra aleatoria de una población, x 1, x,..., x k los estimadores puntuales más utilizados son: De la media poblacional, la media muestral k i=1 x = x i. n De la proporción poblacional, la proporción muestral: p = De la varianza poblacional, la cuasivarianza muestral: S c = valores observados de A. tamaño muestral n k n 1 S i=1 = (x i x), n 1 como ya hemos dicho, no utilizaremos la varianza muestral porque es un estimador no centrado de la varianza poblacional. Se demuestra que dada una variable aleatoria X de una población con media µ y desviación típica σ, se tiene que: 4

6 En muestreo con reemplazamiento o población infinita x tiene como media a µ y desviación típica a σ n. En muestreo sin reemplazamiento o población finita x tiene como media a µ y desviación típica a σ n N n N 1. Como se observa, la única diferencia entre el caso en que la población es infinita y el muestreo es con reemplazamiento, con el caso en que el muestreo sea sin reemplazamiento y la población finita, es que la desviación típica queda multiplicada N n por el factor de corrección N 1, donde N es el tamaño de la población y n el tamaño de la muestra. Además, se demuestra que si X es una variable aleatoria que sigue una distribución normal de media µ y desviación típica σ conocida, se tiene que: σ x sigue una distribución N(µ, ). n Como se ve en la expresión de la media muestral, mientras mayor sea el valor de n, tamaño de la muestra, menor será la desviación típica y menor será el error que se cometerá al considerar como estimador de la media de la población a la media muestral. Habrá que ver la conveniencia de aumentar el tamaño de la muestra, ajustándose a las necesidades económicas que se dispongan. Se demuestra que si X es una variable aleatoria que sigue una distribución normal de media µ y desviación típica σ desconocida, se tiene que: x µ S c n sigue una distribución t-student con (n 1) grados de libertad. En caso de que el tamaño muestral sea mayor de 30, la distribución t-student se aproxima por una distribución N(0, 1). Se demuestra que si X sigue una distribución normal de media µ y desviación típica σ, se tiene que: (n 1)S c σ = ns σ sigue una distribución χ (n 1) chi-cuadrado con n 1 grados de libertad Estimación por intervalos Hemos visto que podemos estimar puntualmente la media de la altura de los alumnos de un centro mediante la media muestral de los 60 que hemos escogido. Ahora bien, no sabemos si ese valor es válido sin más o si cometemos un determinado error. Decimos que el valor de la media poblacional estará próximo a la media muestral, pero qué quiere decir próximo? Puedo obtener dos valores entre los que esté la media poblacional casi seguro? Si quiero tener un 90 o un 95 % de seguridad de que la media esté en una determinada región puedo construir la región? En esta sección veremos lo que significa la estimación por intervalos, que consiste en proporcionar un intervalo en el que encontraremos el parámetro poblacional que estemos estudiando con una determinada confianza. Salvo que se diga lo contrario, a partir de ahora supondremos que trabajamos con poblaciones normales. Vamos además a especificar la notación que se utilizará en esta sección: µ = media poblacional, σ = desviación típica poblacional, N = tamaño de la población, n = tamaño de la muestra correspondiente, x = media muestral, p es la proporción muestral (q = 1 p), n S i=1 = (x i x) n varianza muestral, Sc i=1 = (x i x) cuasivarianza muestral. n n 1 Además: z α es el valor de una variable N(0, 1) que deja a su derecha un área (probabilidad) de valor α. t α (n 1) es el valor de una variable t Student con (n 1) grados de libertad que deja a su derecha un área (probabilidad) de valor α. 5

7 χ α(n 1) es el valor de una variable chi-cuadrado con (n 1) grados de libertad que deja a su derecha un área (probabilidad) de valor α. F α (m, n) es el valor de una variable F de Snedecor con (m, n) grados de libertad que deja a su derecha un área (probabilidad) de valor α. Los valores de z α más comúnmente utilizados son Valores de α z α Tratamos entonces a partir de ahora de encontrar un intervalo (a, b) de manera que el parámetro poblacional desconocido se encuentre en dicho intervalo con una determinada precisión o nivel de confianza. Para hallar dicho intervalo se utilizan los datos de una muestra, evidentemente estos datos cambiarán de una muestra a otra, por lo que el valor del intervalo también cambiará. El término grado de confianza (por ejemplo el 90 %) se refiere a que si consideramos un número elevado de muestras, y para cada una de ellas construimos el intervalo de confianza para un parámetro h desconocido de la población, tendremos que el parámetro poblacional h desconocido se encuentra al menos en el 95 % de los intervalos construidos. Este hecho es muy importante, de manera que cuando se construya un intervalo de confianza para una muestra determinada, no caigamos en la tentación de decir que el parámetro poblacional se encuentra dentro de dicho intervalo con probabilidad 0.95 puesto que ésta es una interpretación errónea. El intervalo es aleatorio antes de calcular el valor del estadístico para cada muestra; una vez calculado su valor para una muestra concreta, deja de ser aleatorio y puede que contenga el parámetro poblacional o no. Para hallar el intervalo de confianza de un parámetro poblacional θ, se partirá de un estimador θ (generalmente insesgado), y a partir de él se construirá el intervalo con una determinada amplitud λb, de manera que el intervalo será ( θ λb, θ + λb), con la condición de que la probabilidad de que el parámetro desconocido θ se encuentre en dicho intervalo sea 1 α, es decir P [ θ λb θ θ + λb] = 1 α. El término λb es el margen de error o precisión de la estimación del parámetro poblacional desconocido; recibe el nombre de error típico de estimación o error estándar. Vamos a detallar los intervalos de confianza para un nivel de confianza 1 α, según distintas situaciones y parámetros poblacionales para los que deseemos calcular dichos intervalos. Para el caso de una única población y muestreo aleatorio con reemplazamiento: Población Parámetro ( Intervalo ) σ σ N(µ, σ), σ conocida µ x z α, x + z α n ( n N(µ, σ), σ desconocida µ x t α (n 1) S c, x + t α (n 1) S ) c n ( n n N(µ, σ), µ conocida σ i=1 (x i µ) ) n i=1 χ, (x i µ) α (n) χ 1 (n) ( α ) N(µ, σ), µ desconocida σ (n 1)Sc χ α (n 1), (n 1)Sc χ 1 (n 1) ( α ) p q p q B(n, p), n > 30 p p z α n, p + z α n En caso de que el muestreono sea con reemplazamiento o la población no sea infinita, en general se debe multiplicar N n el error estándar por el factor N 1. Como vemos, la estructura de los intervalos de confianza es ( θ λb, θ + λb) donde θ es un estimador del parámetro poblacional del que se desea calcular el intervalo, λ es un valor (punto crítico) de una distribución conocida y b depende del tamaño de la muestra n. ( Por ejemplo, en una distribución normal con desviación típica conocida, un intervalo de confianza para la media es: σ σ x z α, x + z α ), donde λ sería igual a z α, un punto crítico de una N(0, 1) que deja a su derecha un área de n n valor α/, b sería σ n y el estimador de la media poblacional θ, que es x. 6

8 En el caso de dos poblaciones independientes (y muestreo aleatorio con reemplazamiento), tenemos: Población parámetro Intervalo σx + σ y n x n y N(µ, σ), σ conocidas µ x µ y (x y) ± z α N(µ, σ), σ desc. iguales µ x µ y (x y) ± t α (n x + n y ) B(n, p), n > 30 p x p y (p x p y ) ± z α ( S cx 1 N(µ, σ), µ desconocidas σ x σ y Scy F α (n x 1, n y 1), S (n x 1)Scx + (n y 1)Scy n x + n y p x q x + p yq y n x n y 1 cx Scy F 1 α (n x 1, n y 1) 1 n x + 1 n y Para muestras suficientemente grandes se pueden considerar válidos los intervalos construidos aplicando las fórmulas anteriores. En caso de que sin que se verifiquen las condiciones anteriores sigamos queriendo obtener un intervalo de confianza para la media poblacional de una población cualquiera, siempre podemos aplicar el teorema de Tchebycheff: Sea X una variable aleatoria de media µ y desviación típica σ. Se verifica que cualquiera que sea el valor de k > 0: P ( X µ kσ) 1 k. En caso de que x sea la media muestral, se tendría un intervalo para la media de la población, con desviación típica conocida: (x k n σ, x + k n σ ). Los pasos que seguiremos entonces para construir un intervalo de confianza serán los siguientes: 1. Establecer la población y la ley de distribución de dicha población.. Fijar dos de los siguientes datos: el nivel de confianza, el tamaño muestral deseado o el error de estimación. 3. Considerar el estimador adecuado para el parámetro poblacional del que se desea calcular el intervalo de confianza. Calcular el valor de dicho estimador. 4. Considerar el punto crítico de la distribución del estimador y aplicar la fórmula correspondiente a dicho intervalo de confianza Errores de estimación y tamaño de la muestra ) Hemos estado suponiendo hasta aquí que el tamaño de la muestra era conocido. Sin embargo, hemos de determinar el tamaño de la muestra teniendo en cuenta que cuanto mayor sea el tamaño de la muestra, menor será el error que cometeremos al inferir el valor de un determinado parámetro, puesto que estaremos más cerca de examinar a toda la población. Pero habitualmente los costes económicos, el tiempo del que disponemos y otros factores, no nos permiten aumentar el tamaño muestral tanto como desearíamos. Por otro lado, un tamaño muestral muy pequeño puede no permitirnos obtener el nivel de confianza deseado. Podemos considerar que cuando se realiza una estimación del valor de un parámetro poblacional mediante un intervalo de confianza, cometemos un error típico de estimación igual en valor absoluto a λb, que en general depende de n. Dicho error incorpora la desviación del estimador y el valor del punto crítico determinado por la distribución del estimador. Luego podemos: 1. Fijar el nivel de confianza y el error que deseamos tener, calculando el tamaño de muestra necesario.. Calcular el error que cometeremos con un tamaño de muestra dado y un nivel de confianza. 3. Dado el tamaño de muestra y el error que deseamos tener, calcular el nivel de confianza que tendremos. 7

9 1.5. Contrastes de hipótesis Todos tenemos ideas prefijadas sobre lo que creemos que puede ocurrir dentro de una población. Por ejemplo, a alguien se le puede ocurrir pensar que la media de la paga de los alumnos de su centro es superior a 5 euros. O que en general, la media de altura es inferior a Pero podemos hacernos también preguntas concretas crees que podemos considerar que un 10 % de los alumnos son zurdos? Crees, en cambio, que es más correcto decir que menos de un 10 % lo son? Este tipo de preguntas pueden ser respondidas a través de un contraste de hipótesis paramétrico. Realmente, para comprobar si las preguntas anteriores son ciertas o falsas, tendríamos que observar todos y cada uno de los individuos de la población. Pero como es habitual, eso en principio no estará dentro de nuestras posibilidades, así que intentaremos responder a esas preguntas a través de las observaciones que tengamos de nuestra muestra. Un contraste de hipótesis permite aceptar o rechazar si determinadas afirmaciones son ciertas o falsas en función de los datos observados en una muestra. Obviamente esto conlleva asumir que la conclusión a la que lleguemos podría no ser verdadera, luego debemos intentar asegurar un cierto grado de precisión en el caso de que aceptemos la hipótesis que se proponga. Este grado de precisión es lo que se denomina nivel de confianza. Existen fundamentalmente dos tipos de contrastes de hipótesis: Los que establecen hipótesis sobre los parámetros de la distribución de probabilidad de la población. Por ejemplo, que la media de una población normal sea 7. Los llamaremos contrastes paramétricos. Los que establecen otro tipo de hipótesis. Por ejemplo, que una determinada población sigue una distribución normal o que no existe dependencia entre las variables altura y paga de los alumnos de un centro. Los llamaremos contrastes no paramétricos. Cuando hayamos realizado un test de hipótesis y se acepta la afirmación inicial, no quiere decir que hayamos probado en sentido matemático la afirmación, ya que no hemos examinado todos los elementos de la población e incluso esta afirmación podría ser rechazada por los datos de otra muestra. Lo que tenemos que entender de alguna manera es que con los datos que tenemos no podemos rechazar la hipótesis que hemos propuesto. Vamos a ver a partir de ahora contrastes tanto paramétricos (sobre la media, la varianza y la proporción) como no paramétricos (homogeneidad o heterogeneidad de la población e independencia en tablas de contingencia). Necesitamos previamente algunos conceptos: Hipótesis nula: se simboliza por H 0 e indica la afirmación sobre los parámetros poblacionales que se van a contrastar. Por ejemplo, H 0 : µ 0 = 5 en una población normal, es decir, querríamos contrastar si la media de una población normal es 5. Hipótesis alternativa: recoge el suceso complementario a H 0. Se denota por H 1. En el ejemplo anterior sería H 1 : µ 5, es decir, que la media sea diferente de 5. Estadístico de prueba: es una función de los datos muestrales que nos permitirá decidir si aceptamos o rechazamos H 0. Su distribución de probabilidad debe ser conocida bajo H 0. Región de aceptación: conjunto de valores (intervalo) para el estadístico muestral que hacen que aceptemos H 0 con probabilidad 1 α, supuesta cierta la hipótesis nula. Región de rechazo o crítica: conjunto de valores (intervalo) complementario al anterior, con probabilidad α. Nivel de confianza: representa la probabilidad que deseamos tener de aceptar H 0 cuando es cierta. Se representa por 1 α. Nos da la probabilidad de la región de aceptación bajo la hipótesis nula. Nivel de significación: representa la probabilidad de rechazar H 0 cuando es cierta y es la complementaria del nivel de confianza, es decir α. Nos da la probabilidad de la región crítica bajo la hipótesis nula. Dentro de los contrastes de hipótesis paramétricos podemos diferenciar entre: Contrastes bilaterales: la hipótesis nula se presenta de manera que los valores de los parámetros poblacionales desconocidos quedan unívocamente determinados. Por ejemplo, que la media es igual a 5, o la varianza a 3. 8

10 Contrastes unilaterales: la hipótesis nula se presenta de tal manera que los valores del parámetro desconocido de la población se encuentran dentro de un intervalo semiabierto. Para conocer la distribución del estadístico muestral, se supondrá que el parámetro poblacional toma el valor de uno de los extremos del intervalo. Por ejemplo H 0 : µ 0 3, es decir, la media es mayor o igual que 3, frente a la hipótesis alternativa de H 1 : µ 0 < 3. A la hora de determinar la distribución del estadístico se supondrá que el valor del parámetro bajo la hipótesis nula es µ = 3. Cuando llevamos a cabo el contraste de hipótesis nos basamos en los valores de un estadístico cuya función de probabilidad debe ser conocida bajo la hipótesis nula. Luego, los datos de la muestra nos pueden llevar a dos tipos de errores: Error de tipo I: error que se produce cuando rechazamos la hipótesis nula H 0 siendo cierta. La probabilidad de dicha decisión es igual al nivel de significación α, es decir a la probabilidad de rechazar la hipótesis nula cuando es cierta. Error de tipo II: error que se produce cuando aceptamos la hipótesis nula siendo falsa, que sería lo mismo que rechazar H 1 siendo verdadera. La probabilidad de rechazar la hipótesis alternativa cuando es cierta se representa por la letra β Potencia de un contraste: representa la probabilidad de rechazar H 0 cuando H 1 es verdadera. Podemos resumir las decisiones que se toman y los errores que se cometen en la siguiente tabla Decisión/Realidad H 0 verdadera H 1 verdadera Aceptar H 0 Decisión correcta (1 α) Decisión incorrecta. Error tipo II (β) Rechazar H 0 Decisión incorrecta. Error tipo I (α) Decisión correcta. Potencia (1 β) Las probabilidades de errores de tipo I y II son funciones complementarias entre sí, en el sentido de que aumentando una disminuye la otra y viceversa, por lo que se tratará de minimizar el error que se considere más grave a costa de aumentar el otro. Una solución consiste en buscar el tamaño de muestra que hace compatibles los niveles de error de tipo I (α) y de tipo II (β), es decir, fijado unos, hallar el tamaño de muestra de manera que el otro se encuentre dentro de los límites deseados. A la hora de elegir un estadístico para realizar un contraste, se elegirá aquél que tenga potencia máxima entre todos los que tienen un determinado nivel de confianza. Los pasos que es necesario seguir para realizar un contraste de hipótesis son: 1. Establecer la distribución de la población, la hipótesis nula H 0 y la hipótesis alternativa H 1.. Fijar el nivel de confianza, 1 α, y el tamaño de la muestra, n. 3. Seleccionar una muestra y calcular el valor del estadístico correspondiente, cuya distribución será conocida bajo H Determinar la región de aceptación y de rechazo o crítica. 5. Aceptamos H 0 si el valor del estadístico se encuentra dentro de la región de aceptación. En otro caso, se rechaza H Conclusiones de tipo estadístico. En la siguiente tabla se reflejan los distintos estadísticos que se utilizarán, así como las regiones críticas según el tipo de contraste que se realice. Para el caso de una única población: 9

11 Población H 0 H 1 Estadístico Región crítica µ = µ 0 µ µ 0 T z α N(µ, σ), σ conocida µ µ 0 µ < µ 0 T = x µ 0 σ T < z 1 α n µ µ 0 µ > µ 0 T > z α µ = µ 0 µ µ 0 T t α (n 1) N(µ, σ), σ desconocida µ µ 0 µ < µ 0 T = x µ 0 n S c T < t 1 α (n 1) µ µ 0 µ > µ 0 T > t α (n 1) σ = σ 0 σ σ 0 T χ α (n) n i=1 N(µ, σ), µ conocida σ σ 0 σ < σ 0 T = (x i µ) T < χ 1 α(n) σ σ 0 σ > σ 0 T > χ α(n) σ = σ 0 σ σ 0 T χ α (n 1) N(µ, σ), µ desconocida σ σ 0 σ < σ 0 T = (n 1)S c σ 0 σ 0 T < χ 1 α(n 1) σ σ 0 σ > σ 0 T > χ α(n 1) p = p 0 p p 0 T z α B(n, p) p p 0 p < p 0 T = p p 0 T < z 1 α p 0(1 p 0) n p p 0 p > p 0 T > z α Para el caso de dos poblaciones, tenemos: Poblaciones H 0 H 1 Estadístico Región crítica µ x µ y = a µ x µ y a T z α N(µ, σ) µ x µ y a µ x µ y < a T = x y a σ x n x + σ y n y T < z 1 α σ conocidas µ x µ y a µ x µ y > a T > z α µ x µ y = a µ x µ y a T t α (n x + n y ) x y a N(µ, σ) µ x µ y a µ x µ y < a T = r T < t 1 α (n x + n y ) (nx 1)S cx +(ny 1)S cy nx+ny q 1 nx + 1 ny σ desc iguales µ x µ y a µ x µ y > a T > t α (n x + n y ) σx = σy σx σy T > nx n y F α x, n y ) ó T < n x n y F 1 α x, n y ) nx N(µ, σ) σx σy σx < σy i=1 T = i µ x ) ny i=1 (y T < nx i µ y ) n y F 1 α (n x, n y ) µ conocidas σx σy σx > σy T > nx n y F α (n x, n y ) σx = σy σx σy T > F α (n x 1, n y 1) ó T < F 1 α (n x 1, n y 1) N(µ, σ) σ x σ y σ x < σ y T = S cx S cy T < F 1 α (n x 1, n y 1) µ desc σ x σ y σ x > σ y T > F α (n x 1, n y 1) Recordemos que en caso de buscar valores de t α (n 1) con valores de n mayores que 30, dicha distribución se aproxima por la N(0, 1), por lo que se buscarán los valores de z α Relación entre los intervalos de confianza y los contrastes de hipótesis Cuando se realiza un contraste de hipótesis bilateral y se rechaza la hipótesis nula, no sabemos qué valor del parámetro estamos considerando, únicamente sabemos qué valor no es, con un determinado nivel de confianza. A veces en vez de realizar un contraste de hipótesis podemos construir el intervalo de confianza para dicho parámetro y con ello podemos rechazar todas aquellas hipótesis nulas de la forma H 0 : parámetro = k 0 siempre que el valor no se 10

12 encuentre dentro del intervalo de confianza construido. En el caso de hipótesis unilaterales: H 0 : parámetro k 0 frente a H 1 : parámetro > k 0 a un nivel de significación α, se construye un intervalo de confianza para el parámetro poblacional desconocido a un nivel de confianza 1 α. Si el valor k 0 es mayor que el extremo superior de dicho intervalo, debemos rechazar la hipótesis H 0. En general, se rechazará cualquier hipótesis nula de la forma H 0 : parámetro=un valor mayor que el extremo superior del intervalo de confianza. H 0 : parámetro k 0 frente a H 1 : parámetro < k 0 a un nivel de significación α, se construye un intervalo de confianza para el parámetro poblacional desconocido a un nivel de confianza 1 α. Si el valor k 0 es menor que el extremo inferior de dicho intervalo, debemos rechazar la hipótesis H 0. En general, se rechazará cualquier hipótesis nula de la forma H 0 : parámetro=un valor menor que el extremo inferior del intervalo de confianza. Pasamos ahora a ver los contrastes de hipótesis no paramétricos. Los contrastes que veremos están basados en aplicaciones de la distribución χ. Veremos contrastes sobre el ajuste de la distribución teórica a una distribución empírica, así como la aplicación a tablas de contingencia Test de la bondad de ajuste Consideremos una población y el carácter X que presenta las siguientes modalidades x 1, x,..., x k excluyentes entre sí, con sus correspondientes probabilidades p 1, p,..., p k. Tenemos una muestra de tamaño n en la que observamos el carácter X y nos planteamos hasta qué punto esta muestra se puede considerar como perteneciente a una población de distribución teórica ya conocida. Independientemente de la distribución teórica que consideremos siempre existirán diferencias entre los valores teóricos esperados y los valores observados. El problema está en saber en qué medida dichos valores son debidos al azar o a que los datos no se ajustan a la distribución teórica considerada. Si denotamos por: O i = número de elementos de la muestra con el carácter x i. p i = probabilidad teórica de que la variable aleatoria tome el valor x i, verificándose que k i=1 p i = 1. Si tenemos una muestra de tamaño n, el número de elementos que cabe esperar que tomen el valor x i es e i = np i, verificándose que k i=1 np i = n. Podemos formar la siguiente tabla: Variable X x 1 x... x k Frecuencias observadas O 1 O... O k Frecuencias esperadas e 1 e... e k Consideraremos como hipótesis nula y alternativa a H 0 : la distribución empírica se ajusta a la distribución teórica considerada. H 1 : se rechaza el ajuste. Evidentemente, si aceptamos la hipótesis nula (aceptamos el ajuste), las diferencias entre los valores observados y los valores esperados son debidas al azar y podemos decir que no existen evidencias para rechazar dicha hipótesis; en otro caso, diremos que existen diferencias significativas para el nivel de significación marcado entre ambas distribuciones, no pudiendo atribuirse las diferencias entre las distribuciones empíricas y observadas al azar. El estadístico que se utilizará para dicho contraste será: T = k i=1 (O i e i ) e i = k i=1 O i e i n. Pearson demostró que la distribución de dicho estadístico es una χ con k 1 grados de libertad en el caso de no existir discrepancias entre los valores observados y los esperados. Se acepta H 0 si T < χ α(k 1) REGIÓN DE ACEPTACIÓN. Se rechaza H 0 si T χ α(k 1) REGIÓN DE RECHAZO. A la hora de aplicarlo correctamente, tenemos que realizar las siguientes consideraciones: 11

13 1. Las frecuencias esperadas de las distintas modalidades deben ser superiores a cinco; en caso de no ocurrir se deben agrupar clases contiguas en una sola clase hasta lograr que la nueva frecuencia sea mayor que cinco. Esto supone cambiar la distribución teórica con la consiguiente pérdida de información.. Si para obtener las frecuencias esperadas se necesitan estimar p parámetros, entonces los grados de libertad de la χ son k p si son independientes y k p 1 si son independientes las modalidades. 3. Se puede aplicar tanto a distribuciones continuas como a las discretas Contrastes de dependencia o independencia de caracteres Deseamos saber si dos caracteres X e Y de una población son dependientes o independientes. Suponemos que las modalidades que presentan cada una de las variables X e Y son X : x 1, x,..., x k, Y : y 1, y,..., y m. y se ha tomado una muestra de tamaño n, midiéndose dichas características X e Y en cada uno de los elementos de la muestra. Si denotamos por: O ij = número de elementos que presentan características x i e y j. e ij = número de elementos esperados que presentan los valores x i e y j si las variables son independientes. Podríamos formar la siguiente tabla de contingencia en la que aparecen las frecuencias empíricas y teóricas X/Y y 1... y j... y m Frecuencias absolutas X x 1 O 11 e O 1j e 1j... O 1m e 1m O x x i O i1 e i1... O ij e ij... O im e im O xi x k O k1 e k1... O kj e kj... O km e km O xk Frecuencias absolutas Y O y1... O yj... O ym n Para el cálculo de las frecuencias teóricas podemos utilizar la siguiente fórmula si las variables son independientes: e ij = p ij n = O xi n O yj (total de la fila i) (total de la columna j) n =, n n i = 1,,..., k j = 1,,..., m. Consideraremos como hipótesis nula e hipótesis alternativa a: H 0 : X e Y son independientes. H 1 : X e Y no son independientes. Si aceptamos la hipótesis nula, podemos considerar que no tenemos evidencias que nos hagan suponer una dependencia entre las dos variables a un nivel de confianza de 1-α. Consideramos como estadístico del contraste: T = k m i=1 j=1 (O ij e ij ) e ij = k m i=1 j=1 O ij e ij n. La distribución de dicho estadístico es una χ con (k 1)(m 1) grados de libertad en caso de que las variables sean independientes a un nivel de confianza 1 α Se acepta H 0 si T < χ α(k 1)(m 1) REGIÓN DE ACEPTACIÓN. Se rechaza H 0 si T χ α(k 1)(m 1) REGIÓN DE RECHAZO. 1

14 Test de homogeneidad de varias muestras Se trata de determinar si varias muestras que estudian el mismo carácter A han sido tomadas o no de la misma población, respecto de dicha característica A. Supongamos que tenemos k muestras de tamaños n 1, n,..., n k siendo y 1, y,..., y k los elementos de cada muestra que presentan una determinada característica A y el resto no la presentan. Si suponemos que todas las muestras provienen de la misma población, la proporción de elementos que presentan la característica A sería: p = y 1 + y + + y k n 1 + n + + n k. Si suponemos que las muestras provienen de la misma población, los valores esperados para la característica A en cada muestra serían n 1 p, n p, n 3 p,..., n k p. Podríamos formar la siguiente tabla de contingencia en la que aparecen los valores observados y los valores esperados: Presentan el carácter A No presentan el carácter A Tamaño Muestras Se esperan con el carácter A Se esperan sin el carácter A de las muestras Primera y 1 n 1 y 1 n 1 muestra n 1 p n 1 (1 p) i-ésima y i n i y i n i muestra n i p n i (1 p) k ésima y k n k y k n k muestra n k p n k (1 p) Consideramos como hipótesis nula e hipótesis alternativa a: H 0 : todas las muestras provienen de la misma población. H 1 : se rechaza que provengan de la misma población. Si aceptamos la hipótesis nula, podemos considerar que las muestras provienen de la misma población y las diferencias entre los valores observados y los valores esperados son debidas al azar. El estadístico que se utilizará será: T = 1 p(1 p) k i=1 (y i n i p) n i. La distribución de dicho estadístico es una χ con k 1 grados de libertad en el caso de no existir discrepancias entre los valores observados y los esperados a un nivel de confianza 1 α. Se acepta H 0 si T < χ α(k 1) REGIÓN DE ACEPTACIÓN. Se rechaza H 0 si T χ α(k 1) REGIÓN DE RECHAZO. En el caso de que los elementos de las muestras se clasifiquen en más de dos categorías, el análisis se realiza como en el caso de un test de independencia o dependencia entre variables, donde la tabla que se obtendría sería similar a la anterior, por filas aparecen las muestras y por columnas las distintas categorías. El estadístico sería el mismo que en el caso de independencia de variables y los valores esperados se calcularían de igual forma y la hipótesis nula será H 0 : todas las distribuciones se distribuyen homogéneamente. A la hora de analizar un población se ha de tener en cuenta si la población puede ser subdividida en subpoblaciones que sigan manteniendo la heterogeneidad de la población de partida, de lo contrario podemos llegar a resultados totalmente erróneos. Consideremos, por ejemplo, los siguientes datos que recogen el número de alumnos y alumnas en un municipio admitidos en los cursos de formación empresarial N o de solicitudes N o de admitidos Proporción admitidos Hombres Mujeres

15 Si suponemos que la población es homogénea llegaríamos a la conclusión de que existe una diferencia significativa entre hombres y mujeres, a favor de las mujeres, a la hora de ser admitidas en los cursos de formación. Ahora bien, si los datos se analizan por separado según el curso de formación empresarial A, B y C, se tiene: N o de solicitudes N o de admitidos Proporción admitidos ( %) Hombres Curso A Mujeres Hombres Curso B Mujeres Hombres Curso C Mujeres Como se observa, la discriminación es favorable al hombre en todos los cursos. Por tanto, las conclusiones serán distintas si se agrupan los datos. Este fenómeno se conoce como paradoja de Simpson Inferencia bayesiana Al principio del capítulo hemos visto que existe otro enfoque para la inferencia que considera que tenemos unas probabilidades a priori a partir de las cuales se calculan unas probabilidades a posteriori. Es lo que se conoce como inferencia bayesiana. Vamos a hacer un breve resumen sobre los fundamentos de estos métodos. El método de inferencia bayesiano se basa en el teorema de Bayes, en el cual, a partir de unas probabilidades a priori y verosimilitudes, se calculan unas probabilidades a posteriori; supone que el parámetro poblacional no es una constante desconocida, sino que es una variable aleatoria con distribución conocida. El procedimiento de estimación toma de partida los conocimientos a priori y verosimilitudes derivados de observaciones anteriores, de manera que al tomar una nueva muestra se estiman de nuevo los parámetros, actualizando los valores anteriores con los nuevos. El método clásico y el bayesiano no difieren demasiado si el tamaño de la muestra es suficientemente grande o la información de la que se dispone a priori es prácticamente nula, es más, llegan a idénticas conclusiones; en cambio, para tamaños de muestra pequeños pueden llegar a conclusiones totalmente dispares. En general, los métodos bayesianos son más complicados que los clásicos, aunque más satisfactorios en muchos casos. Se obtienen intervalos más pequeños, valores estimados de puntos más confiables y pruebas de hipótesis más apropiadas. Por ejemplo, dada una población N(µ 0, σ 0 ) si tomamos una muestra de tamaño n y hallamos la media muestral, los parámetros de la población se actualizan con los nuevos valores calculados por la siguiente expresión: 1 µ σ0 0 + n x σx 1 N(µ 1, σ 1 ) = N 1 + n σ0 σx, 1 + n σ0 σx En general, la media posterior es una combinación entre la media a priori y la media a posteriori de la muestra: µ 1 = Kµ 0 + (1 K)x. De igual forma podemos aplicar la inferencia bayesiana al cálculo de intervalos de confianza y los contrastes paramétricos incorporando la información obtenida de la muestra a la fórmula final. Por ejemplo, el intervalo de confianza para la media de una población normal con desviación típica conocida sería (µ 1 z α/ σ 1, µ 1 + z α/ σ 1 ) donde µ 1 y σ 1 son los valores calculados anteriormente.. 14

16 Capítulo Un ejemplo de aplicación de la inferencia.1. Para una población Hemos obtenido una muestra aleatoria de tamaño 5 de nuestra población, un centro con 558 alumnos. Tenemos que realizar un estudio que pretende tres objetivos: 1. Una de las cosas que pretendemos realizar es hacer camisetas del centro y venderlas para ganar dinero para el viaje de fin de curso. Aprovecharemos nuestros datos para hallar un intervalo de confianza para la media de la paga de los alumnos del centro, que nos oriente sobre cuánto podemos pedir por la camiseta a los compañeros del centro.. Los últimos estudios hablan de que los jóvenes dedican la mayoría de su tiempo a conectarse a internet y ver la televisión. podemos decir que los alumnos de nuestro centro dedican más de una hora diaria a conectarse a internet? 3. Queremos ver si para nuestra población es cierto el dato, que se suele manejar, de que aproximadamente hay un 10 % de zurdos. Tenemos pues los datos de 5 individuos sobre las variables ya mencionadas y son los siguientes: 15

17 Observación Paga Internet Zurdos Vamos a ir resolviendo lo que nos hemos propuesto. Comenzamos por el primer objetivo: 1. Intervalo de confianza para la media de la paga Comenzamos por buscar los límites entre los que se encontrará la media de la paga. Debemos fijar un nivel de confianza o un error. Vamos a fijar un nivel de confianza del 90 %. Cuál es la situación en la que nos encontramos? Suponemos que la población en la que nos encontramos es normal. Conocemos σ? La respuesta es que no. Entonces estamos en el caso de una población normal con σ desconocida. Recordamos que el intervalo de confianza para la media en esta situación era: ( x t α (n 1) S c, x + t α (n 1) S ) c, n n para el caso del muestreo con reemplazamiento. Como hemos hecho muestreo sin reemplazamiento, aplicaremos el N n factor de corrección N 1, de donde nos queda: ( x t α (n 1) S c N n n N 1, x + t α (n 1) S ) c N n. n N 1 Luego los datos que necesitamos son los siguientes: y el intervalo queda ( x = 8,56, S c = 8,895, t α (n 1) = t 0,05(4) = 1,711, 8,56 1,711 8, ) 558 5, 8,56 + 1,7118,895 = (5,785, 11,335) Entonces nos sale que unos límites apropiados serían entre 5.7 euros y 11.3 euros para las camisetas.. Tiempo que dedican los jóvenes a internet Nos preguntamos ahora si podemos decir que los alumnos de este centro pasan de media, más de una hora al día conectados a internet. Qué técnica podemos usar para obtener respuesta a nuestra pregunta? Utilizaremos un contraste 16

18 de hipótesis unilateral, en el que intentaremos probar si la media de nuestra variable es mayor o igual que una hora (60 minutos). Cuál es nuestra situación ahora? Volvemos a suponer que nos encontramos en una población normal, y de nuevo, σ es desconocida. Elegimos un nivel de confianza, digamos el 95 %. El contraste que queremos realizar tiene la siguientes hipótesis nula y alternativa H 0 : la media de tiempo diario en internet es igual o superior a 60 minutos. H 1 : la media de tiempo diario en internet es inferior a 60 minutos. Nuestro estadístico de contraste, dado que nos encontramos en el caso σ desconocida, es: y si tenemos que T = x µ 0 n S c, nuestro estadístico vale: x = 44, S c = 40,4, t α (n 1) = t 0,05 (4) = 1,711, La región crítica para este contraste es T = ,4 5 = 1,9888. T < t 1 α (4) = 1,711. Luego nuestro valor se encuentra en la región crítica, lo que quiere decir que debemos rechazar la hipótesis nula. No podemos decir que los alumnos del centro dediquen más de una hora al día a conectarse a internet. 3. Proporción de zurdos en la población Tratemos ahora de ver si podríamos decir que en nuestra población hay un 10 % de zurdos. De nuevo responderemos a esta pregunta a través de un contraste de hipótesis. Como en este caso manejamos una variable que sólo toma los valores 0 ó 1, no nos encontramos en el caso de una población normal, sino que estamos intentando realizar estimaciones sobre el parámetro p de una binomial. La hipótesis nula y alternativa para este caso serían: H 0 : La proporción de zurdos es igual a 0.1. H 1 : La proporción de zurdos no es igual a 0.1. Realizaremos el contraste con un nivel de confianza del 95 %. Recordamos que nuestro estadístico de contraste es: donde T = p p 0 p 0(1 p 0) n, Luego el valor de nuestro estadístico es: p = 0,, p 0 = 0,1, n = 5. T = 0, 0,1 0,1(1 0,1) 5 La región crítica para este contraste viene dada por la expresión = 1, 6. T z α = z 0,05 = 1,96, luego no podemos rechazar la hipótesis de que en nuestro centro haya un 10 % de zurdos. 17

19 .. Para dos poblaciones Dos alumnos del centro han obtenido una muestra cada uno de su correspondiente nivel, 1 o de Bachillerato y 4 o de ESO. Han medido, entre otras cosas, la altura, y a la vista de los resultados, el alumno de 4 o opina que en media, los chicos de 4 o son más altos, porque su media muestral es mayor. El de 1 o no está de acuerdo, cree que lo que ocurre es que hay más variabilidad en la población de 1 o y por eso la muestra de los chicos de primero ha dado una media menor. Podemos resolverles la duda? Ellos nos facilitan sus datos, que son Para 1 o de bachillerato tenemos: , mientras que los datos para 4 o de ESO son: , Lo que vamos a hacer para resolver la duda que se nos plantea son dos contrastes de hipótesis. En uno plantearemos si es cierta la hipótesis del chico de 4 o que dice que en media los de 1 o son más bajos, y luego plantearemos que pueda ocurrir que la varianza de la variable altura de los de 1 o de bachillerato es mayor que la de los de 4 o de ESO. Haremos todos los contrastes con un nivel de confianza del 95 %. Vamos a comenzar por el segundo contraste, veamos si podemos decir que hay una varianza mayor que otra. Nuestras hipótesis nula y alternativa son: H 0 : La varianza de la altura de los alumnos de 1 o de bachillerato (σ x) es mayor o igual que la de los alumnos de 4 o de ESO (σ y). H 1 : La varianza de la altura de los alumnos de 1 o de bachillerato (σ x) es menor que la de los alumnos de 4 o de ESO (σ y). Estamos en el caso de dos poblaciones normales con media desconocida, luego nuestro estadístico será Y como tenemos entonces tenemos la región crítica T = S cx Scy. S cx = 66,98, S cy = 58,7, T = 1,14, T < F 1 α (n x 1, n y 1) = 0,50909, luego no podemos rechazar que sea mayor o igual. Pero el chico de primero quiere saber si es mayor, no igual. Si vemos la región crítica para el contraste bilateral (σ x = σ y) T < F 1 α (n x 1, n y 1) = 0,44599 ó T > F α (n x 1, n y 1) =,574, llegamos a la conclusión de que tampoco podemos rechazar la hipótesis de que sean iguales, luego no podemos asegurar el hecho de que la varianza sea estrictamente mayor. Hagamos ahora el contraste para la media. Supondremos σ desconocida pero igual en ambos casos (el contraste anterior dice que no podríamos rechazar esa hipótesis). Las hipótesis nula y alternativa en este caso son: H 0 :La media de los de 1 o (µ x ) es menor o igual que la de los de 4 o (µ y ) µ x µ y 0. H 1 :La media de los de 1 o (µ x ) es mayor que la de los de 4 o (µ y ) µ x µ y > 0. Para nuestro caso, el estadístico de contraste es: T = y tenemos, que además de los datos de antes, es x y a (nx 1)S cx +(ny 1)S cy n x+n y, 1 n x + 1 n y x = 166,69, y = 167,8. 18

20 Si sustituimos La región crítica es T = 166,69 167,8 0 (6 1)66,98+(5 1)58, = 1, T > t α (n x + n y ) = 1,6766, luego no podemos rechazar la hipótesis. Pero, la realidad es que si nos fijamos en el contraste bilateral (µ x µ y = 0) y en su región crítica T t α (n x + n y ) =,0096, tampoco podríamos rechazar la hipótesis nula, luego tampoco podemos decir que sean más bajos los de 1 o de Bachillerato. Nuestra conclusión es que no llevan razón, en principio, ninguno de los dos. Las diferencias entre las medias y las varianzas de las dos poblaciones no son significativas. 19

ESTIMACIÓN. puntual y por intervalo

ESTIMACIÓN. puntual y por intervalo ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio

Más detalles

Capítulo 7: Distribuciones muestrales

Capítulo 7: Distribuciones muestrales Capítulo 7: Distribuciones muestrales Recordemos: Parámetro es una medida de resumen numérica que se calcularía usando todas las unidades de la población. Es un número fijo. Generalmente no lo conocemos.

Más detalles

Población y muestra. Técnicas de muestreos

Población y muestra. Técnicas de muestreos MaMaEuSch Management Mathematics for European Schools http://www.mathematik.unikl.de/ mamaeusch Población y muestra. Técnicas de muestreos Paula Lagares Barreiro * Justo Puerto Albandoz * MaMaEuSch **

Más detalles

"CONTRASTES DE HIPÓTESIS" 4.4 Parte básica

CONTRASTES DE HIPÓTESIS 4.4 Parte básica 76 "CONTRASTES DE HIPÓTESIS" 4.4 Parte básica 77 4.4.1 Introducción a los contrastes de hipótesis La Inferencia Estadística consta de dos partes: Estimación y Contrastes de Hipótesis. La primera se ha

Más detalles

INFERENCIA ESTADÍSTICA

INFERENCIA ESTADÍSTICA Capítulo 4 INFERENCIA ESTADÍSTICA 4.1. Introducción Inferir: Sacar una consecuencia de una cosa. Sacar consecuencia o deducir una cosa de otra. La estadística, ciencia o rama de las Matemáticas que se

Más detalles

APLICACIONES DE INFERENCIA

APLICACIONES DE INFERENCIA APLICACIONES DE INFERENCIA CONTENIDO DE LA PRESENTACIÓN Un ejemplo desarrollado dentro del marco del proyecto MaMaEuSch como aplicación de la Inferencia. Una serie de applets relacionados con la inferencia.

Más detalles

Problemas de Probabilidad resueltos.

Problemas de Probabilidad resueltos. Problemas de Probabilidad resueltos. Problema 1 El profesor Pérez olvida poner su despertador 3 de cada 10 dias. Además, ha comprobado que uno de cada 10 dias en los que pone el despertador acaba no levandandose

Más detalles

Tema 10. Estimación Puntual.

Tema 10. Estimación Puntual. Tema 10. Estimación Puntual. Presentación y Objetivos. 1. Comprender el concepto de estimador y su distribución. 2. Conocer y saber aplicar el método de los momentos y el de máxima verosimilitud para obtener

Más detalles

Matemáticas 2º BTO Aplicadas a las Ciencias Sociales

Matemáticas 2º BTO Aplicadas a las Ciencias Sociales Matemáticas 2º BTO Aplicadas a las Ciencias Sociales CONVOCATORIA EXTRAORDINARIA DE JUNIO 2014 MÍNIMOS: No son contenidos mínimos los señalados como de ampliación. I. PROBABILIDAD Y ESTADÍSTICA UNIDAD

Más detalles

Curso de Estadística no-paramétrica

Curso de Estadística no-paramétrica Curso de Estadística no-paramétrica Sesión 1: Introducción Inferencia no Paramétrica David Conesa Grup d Estadística espacial i Temporal Departament d Estadística en Epidemiologia i Medi Ambient i Investigació

Más detalles

T.3 ESTIMACIÓN PUNTUAL

T.3 ESTIMACIÓN PUNTUAL T.3 ESTIMACIÓN PUNTUAL 1. INTRODUCCIÓN: ESTIMACIÓN Y ESTIMADOR 2. PROPIEDADES DE LOS ESTIMADORES 3. MÉTODOS DE ESTIMACIÓN. EJEMPLO 1, EJEMPLO 2 1. Introducción: Estimación y Estimador En este tema se analizan

Más detalles

Tema 12: Contrastes Paramétricos

Tema 12: Contrastes Paramétricos Tema 1 Tema 1: Contrastes Paramétricos Presentación y Objetivos. Se comienza este tema introduciendo la terminología y conceptos característicos de los contrastes de hipótesis, típicamente a través de

Más detalles

Pruebas de. Hipótesis

Pruebas de. Hipótesis Pruebas de ipótesis Pruebas de ipótesis Otra manera de hacer inferencia es haciendo una afirmación acerca del valor que el parámetro de la población bajo estudio puede tomar. Esta afirmación puede estar

Más detalles

Statgraphics Centurión

Statgraphics Centurión Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 1 Statgraphics Centurión I.- Nociones básicas El paquete Statgraphics Centurión es un programa para el análisis estadístico que

Más detalles

Inferencia Estadística

Inferencia Estadística EYP14 Estadística para Construcción Civil 1 Inferencia Estadística El campo de la inferencia estadística está formado por los métodos utilizados para tomar decisiones o para obtener conclusiones sobre

Más detalles

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA 1 INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA Páginas 74-75 Lanzamiento de varios dados Comprobación de que: Desviación típica de n dados = (Desv. típica para un dado) / 1,71 n = 1,1 1,71 n = 3 0,98

Más detalles

Introducción al Cálculo de Probabilidades a través de casos reales

Introducción al Cálculo de Probabilidades a través de casos reales MaMaEuSch Management Mathematics for European Schools http://www.mathematik.unikl.de/ mamaeusch Introducción al Cálculo de Probabilidades a través de casos reales Paula Lagares Barreiro * Federico Perea

Más detalles

Comparación de proporciones

Comparación de proporciones 11 Comparación de proporciones Neus Canal Díaz 11.1. Introducción En la investigación biomédica se encuentran con frecuencia datos o variables de tipo cualitativo (nominal u ordinal), mediante las cuales

Más detalles

Botella-Rocamora, P.; Alacreu-García, M.; Martínez-Beneito, M.A.;

Botella-Rocamora, P.; Alacreu-García, M.; Martínez-Beneito, M.A.; Inferencia estadística (intervalos de confianza y p-valor). Comparación de dos poblaciones (test t de comparación de medias, comparación de dos proporciones, comparación de dos varianzas). Botella-Rocamora,

Más detalles

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA 1 INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA Página 75 REFLEXIONA Y RESUELVE Lanzamiento de varios dados Comprueba en la tabla anterior ue: DESV. TÍPICA PARA n DADOS n = 8 1,71 1,1 n = 3 8 1,71 3 0,98

Más detalles

Contrastes de Hipótesis

Contrastes de Hipótesis Capítulo 8 Contrastes de Hipótesis 8.1. Introducción. Conceptos básicos Una hipótesis estadística es una afirmación acerca de una característica poblacional formulada en base a los parámetros de su distribución.

Más detalles

Estudio comparativo de los currículos de probabilidad y estadística español y americano

Estudio comparativo de los currículos de probabilidad y estadística español y americano Estudio comparativo de los currículos de probabilidad y estadística español y americano Jaldo Ruiz, Pilar Universidad de Granada Resumen Adquiere las mismas capacidades en Probabilidad y Estadística un

Más detalles

UNED. [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes.

UNED. [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes. 2009 UNED [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes. 1 ÍNDICE 3.1 Introducción 3.2 Objetivos 3.3 Muestras independientes o relacionadas 3.4 Contraste de hipótesis sobre

Más detalles

PSICOLOGÍA EXPERIMENTAL

PSICOLOGÍA EXPERIMENTAL 09 PSICOLOGÍA EXPERIMENTAL Juan Antequera Iglesias Psicólogo Especialista en Psicología Clínica. FEA Psicología Clínica Hospital Virgen de la Misericordia de Toledo. Laura Hernangómez Criado Psicóloga

Más detalles

T. 5 Inferencia estadística acerca de la relación entre variables

T. 5 Inferencia estadística acerca de la relación entre variables T. 5 Inferencia estadística acerca de la relación entre variables 1. El caso de dos variables categóricas 2. El caso de una variable categórica y una variable cuantitativa 3. El caso de dos variables cuantitativas

Más detalles

Tema 3. Comparaciones de dos poblaciones

Tema 3. Comparaciones de dos poblaciones Tema 3. Comparaciones de dos poblaciones Contenidos Hipótesis para la diferencia entre las medias de dos poblaciones: muestras pareadas Hipótesis para la diferencia entre las medias de dos poblaciones:

Más detalles

Estadística aplicada y modelización. 10 de septiembre de 2005

Estadística aplicada y modelización. 10 de septiembre de 2005 Estadística aplicada y modelización. 10 de septiembre de 005 SOLUCIÓN MODELO A 1. Una persona se está preparando para obtener el carnet de conducir, repitiendo un test de 0 preguntas. En la siguiente tabla

Más detalles

8. Estimación puntual

8. Estimación puntual 8. Estimación puntual Estadística Ingeniería Informática Curso 2009-2010 Estadística (Aurora Torrente) 8. Estimación puntual Curso 2009-2010 1 / 30 Contenidos 1 Introducción 2 Construcción de estimadores

Más detalles

MATEMÁTICAS CCSS II Sobrantes 2010 (Modelo 1) SELECTIVIDAD ANDALUCÍA

MATEMÁTICAS CCSS II Sobrantes 2010 (Modelo 1) SELECTIVIDAD ANDALUCÍA IES Fco Ayala de Granada Sobrantes 00 (Modelo ) Soluciones Germán-Jesús Rubio Luna MATEMÁTICAS CCSS II Sobrantes 00 (Modelo ) SELECTIVIDAD ANDALUCÍA OPCIÓN A EJERCICIO Sea el recinto del plano definido

Más detalles

Curso. Análisis Estadístico de Datos Climáticos

Curso. Análisis Estadístico de Datos Climáticos Curso I-1 Análisis Estadístico de Datos Climáticos Distribuciones de Probabilidad Mario Bidegain (FC) Alvaro Diaz (FI) Universidad de la República Montevideo, Uruguay 2011 I-2 DISTRIBUCIONES DE PROBABILIDAD

Más detalles

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA 5.1 Introducción En este capítulo nos ocuparemos de la estimación de caracteristicas de la población a partir de datos. Las caracteristicas poblacionales

Más detalles

DIRECTRICES Y ORIENTACIONES GENERALES PARA LAS PRUEBAS DE ACCESO A LA UNIVERSIDAD

DIRECTRICES Y ORIENTACIONES GENERALES PARA LAS PRUEBAS DE ACCESO A LA UNIVERSIDAD Curso Asignatura 2009/2010 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II 1º Comentarios acerca del programa del segundo curso del Bachillerato, en relación con la Prueba de Acceso a la Universidad INTRODUCCIÓN

Más detalles

Las técnicas muestrales, los métodos prospectivos y el diseño de estadísticas en desarrollo local

Las técnicas muestrales, los métodos prospectivos y el diseño de estadísticas en desarrollo local 21 Las técnicas muestrales, los métodos prospectivos y el diseño de estadísticas en desarrollo local Victoria Jiménez González Introducción La Estadística es considerada actualmente una herramienta indispensable

Más detalles

Un juego de cartas: Las siete y media

Un juego de cartas: Las siete y media Un juego de cartas: Las siete y media Paula Lagares Federico Perea Justo Puerto * MaMaEuSch ** Management Mathematics for European Schools 94342 - CP - 1-2001 - DE - COMENIUS - C21 * Universidad de Sevilla

Más detalles

MATEMÁTICAS CCSS II Sobrantes 2010 (Modelo 1) SELECTIVIDAD ANDALUCÍA OPCIÓN A EJERCICIO 1

MATEMÁTICAS CCSS II Sobrantes 2010 (Modelo 1) SELECTIVIDAD ANDALUCÍA OPCIÓN A EJERCICIO 1 IES Fco Ayala de Granada Sobrantes 010 (Modelo ) Soluciones Germán-Jesús Rubio Luna MATEMÁTICAS CCSS II Sobrantes 010 (Modelo 1) SELECTIVIDAD ANDALUCÍA OPCIÓN A EJERCICIO 1 a 1 1 1 3 Sean las matrices

Más detalles

Tema III. Capítulo 2. Sistemas generadores. Sistemas libres. Bases.

Tema III. Capítulo 2. Sistemas generadores. Sistemas libres. Bases. Tema III Capítulo 2 Sistemas generadores Sistemas libres Bases Álgebra Lineal I Departamento de Métodos Matemáticos y de Representación UDC 2 Sistemas generadores Sistemas libres Bases 1 Combinación lineal

Más detalles

CLAVE: LII PROFESOR: MTRO. ALEJANDRO SALAZAR GUERRERO

CLAVE: LII PROFESOR: MTRO. ALEJANDRO SALAZAR GUERRERO Estadística Superior CLAVE: LII PROFESOR: MTRO. ALEJANDRO SALAZAR GUERRERO 1 1. REGRESIÓN LINEAL SIMPLE Y MÚLTIPLE 1.1. Regresión lineal simple 1.2. Estimación y predicción por intervalo en regresión lineal

Más detalles

DISTRIBUCIONES DISCRETAS CON EXCEL Y WINSTATS

DISTRIBUCIONES DISCRETAS CON EXCEL Y WINSTATS DISTRIBUCIONES DISCRETAS CON EXCEL Y WINSTATS A) INTRODUCCIÓN Una distribución de probabilidad es una representación de todos los resultados posibles de algún experimento y de la probabilidad relacionada

Más detalles

Tests de hipótesis estadísticas

Tests de hipótesis estadísticas Tests de hipótesis estadísticas Test de hipótesis sobre la media de una población. Introducción con un ejemplo. Los tests de hipótesis estadísticas se emplean para muchos problemas, en particular para

Más detalles

3. ANÁLISIS ESTADÍSTICOS DE LAS PRECIPITACIONES EN EL MAR CASPIO

3. ANÁLISIS ESTADÍSTICOS DE LAS PRECIPITACIONES EN EL MAR CASPIO Análisis estadístico 31 3. ANÁLII ETADÍTICO DE LA PRECIPITACIONE EN EL MAR CAPIO 3.1. ANÁLII Y MÉTODO ETADÍTICO UTILIZADO 3.1.1. Introducción Una vez analizado el balance de masas que afecta al mar Caspio

Más detalles

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL. REPASO COCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓ ORMAL. Éste es un breve repaso de conceptos básicos de estadística que se han visto en cursos anteriores y que son imprescindibles antes de acometer

Más detalles

Capítulo 14. Análisis de varianza de un factor: El procedimiento ANOVA de un factor

Capítulo 14. Análisis de varianza de un factor: El procedimiento ANOVA de un factor Capítulo 14 Análisis de varianza de un factor: El procedimiento ANOVA de un factor El análisis de varianza (ANOVA) de un factor sirve para comparar varios grupos en una variable cuantitativa. Se trata,

Más detalles

Estimación. Intervalos de Confianza para la Media y para las Proporciones

Estimación. Intervalos de Confianza para la Media y para las Proporciones Estimación. Intervalos de Confianza para la Media y para las Proporciones Algunas secciones han sido tomadas de: Apuntes de Estadística Inferencial Instituto Tecnológico de Chiuhuahua Estimación El objetivo

Más detalles

INFERENCIA ESTADÍSTICA

INFERENCIA ESTADÍSTICA INFERENCIA ESTADÍSTICA Pensemos en los tres siguientes ejemplos: Hacemos una encuesta entre los clientes de una tienda para preguntarles su opinión sobre cambios generales que pretendemos hacer en diversas

Más detalles

CONTROL Y MEJORA DE UN PROCESO. GRÁFICOS DE CONTROL. CONTROL ESTADÍSTICO DE PROCESOS. SPC

CONTROL Y MEJORA DE UN PROCESO. GRÁFICOS DE CONTROL. CONTROL ESTADÍSTICO DE PROCESOS. SPC CONTROL Y MEJORA DE UN PROCESO. GRÁFICOS DE CONTROL. CONTROL ESTADÍSTICO DE PROCESOS. SPC 1. INTRODUCCIÓN. Mientras el Dr. Walter Shewhart de los Laboratorios Bell estudiaba datos de procesos en la década

Más detalles

ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral

ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral Enero 2005 1.- INTRODUCCIÓN En múltiples ocasiones el analista o investigador se enfrenta al problema de determinar

Más detalles

DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS

DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS 1) Reseña histórica Abrahan De Moivre (1733) fue el primero en obtener la ecuación matemática de la curva normal. Kart Friedrich Gauss y Márquez De Laplece (principios

Más detalles

BLOQUE 2 MÉTODOS DE MONTE CARLO Y TÉCNICAS DE BOOTSTRAP. Preliminares. Técnicas de Monte Carlo

BLOQUE 2 MÉTODOS DE MONTE CARLO Y TÉCNICAS DE BOOTSTRAP. Preliminares. Técnicas de Monte Carlo BLOQUE 2 MÉTODOS DE MONTE CARLO Y TÉCNICAS DE BOOTSTRAP Preliminares Para seguir adecuadamente estos apuntes es preciso recordar los conceptos claves de inferencia estadística. Es conveniente al menos

Más detalles

Definición 2.1.1. Se llama suceso aleatorio a cualquier subconjunto del espacio muestral.

Definición 2.1.1. Se llama suceso aleatorio a cualquier subconjunto del espacio muestral. Capítulo 2 Probabilidades 2. Definición y propiedades Al realizar un experimento aleatorio nuestro interés es obtener información sobre las leyes que rigen el fenómeno sometido a estudio. El punto de partida

Más detalles

Tema 3: El modelo de regresión lineal múltiple

Tema 3: El modelo de regresión lineal múltiple Econometría 1 curso 2009-2010 Tema 3: El modelo de regresión lineal múltiple Genaro Sucarrat (Departamento de Economía, UC3M) http://www.eco.uc3m.es/sucarrat/ Recordamos: El modelo de regresión lineal

Más detalles

Para que les fuera más cercano y aumentar así su implicación, el tema a tratar fue propuesto por ellos mismos.

Para que les fuera más cercano y aumentar así su implicación, el tema a tratar fue propuesto por ellos mismos. Índice 1. Notas introductorias del profesor.... 2 2. Descripción del proyecto.... 3 2.1. Introducción.... 3 2.2. Objetivos que pretendemos lograr con este trabajo... 3 2.3. El proceso realizado... 4 3.

Más detalles

1.1. Introducción y conceptos básicos

1.1. Introducción y conceptos básicos Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................

Más detalles

Análisis del juego televisivo QUIÉN QUIERE SER MILLONARIO? R

Análisis del juego televisivo QUIÉN QUIERE SER MILLONARIO? R Análisis del juego televisivo QUIÉN QUIERE SER MILLONARIO? R Federico Perea Justo Puerto * MaMaEuSch ** Management Mathematics for European Schools 94342 - CP - 1-2001 - DE - COMENIUS - C21 * Universidad

Más detalles

Se pide: 1. Calcular las principales medidas de posición y dispersión para los datos anteriores.

Se pide: 1. Calcular las principales medidas de posición y dispersión para los datos anteriores. 2.2.- Ha sido medida la distancia de frenado (en metros) de una determinada marca de coches, según el tipo de suelo y velocidad a la que circula, los resultados en 64 pruebas aparecen en el listado siguiente:

Más detalles

Diseños en bloques aleatorizados

Diseños en bloques aleatorizados Capítulo 5 Diseños en bloques aleatorizados 5.1. ntroducción En las situaciones que hemos estudiado en el Capítulo 1 hemos supuesto que existe bastante homogéneidad entre las unidades experimentales, así,

Más detalles

x 10000 y 8000 x + y 15000 a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas.

x 10000 y 8000 x + y 15000 a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas. Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG) Matemáticas aplicadas a las Ciencias Sociales II - Septiembre 2012 - Propuesta A 1. Queremos realizar una inversión en dos tipos

Más detalles

TEMA 4: Introducción al Control Estadístico de Procesos

TEMA 4: Introducción al Control Estadístico de Procesos TEMA 4: Introducción al Control Estadístico de Procesos 1 Introducción 2 Base estadística del diagrama de control 3 Muestreo y agrupación de datos 4 Análisis de patrones en diagramas de control 1. Introducción

Más detalles

Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG) Matemáticas aplicadas a las Ciencias Sociales II - Junio 2012 - Propuesta B

Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG) Matemáticas aplicadas a las Ciencias Sociales II - Junio 2012 - Propuesta B Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG) Matemáticas aplicadas a las Ciencias Sociales II - Junio 2012 - Propuesta B 1. Una empresa tiene 3000 bolsas de ajo morado de Las

Más detalles

Nombre...Apellidos... Grado en:...grupo:...

Nombre...Apellidos... Grado en:...grupo:... ESTADÍSTICA E INTRODUCCIÓN A LA ECONOMETRÍA - Soluciones Estadística- Curso 01/1. 9 de Julio de 01 Nombre...Apellidos... Grado en:...grupo:... 1. Considera la variable aleatoria (v.a.) X cuyos posibles

Más detalles

Práctica 5. Contrastes paramétricos en una población

Práctica 5. Contrastes paramétricos en una población Práctica 5. Contrastes paramétricos en una población 1. Contrastes sobre la media El contraste de hipótesis sobre una media sirve para tomar decisiones acerca del verdadero valor poblacional de la media

Más detalles

Capítulo 15. Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante

Capítulo 15. Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante Capítulo 15 Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante Los modelos factoriales de análisis de varianza (factorial = más de un factor) sirven para evaluar el efecto

Más detalles

Inferencia Estadística

Inferencia Estadística Felipe José Bravo Márquez 11 de noviembre de 2013 Para realizar conclusiones sobre una población, generalmente no es factible reunir todos los datos de ésta. Debemos realizar conclusiones razonables respecto

Más detalles

Análisis de la Varianza de un Factor

Análisis de la Varianza de un Factor Práctica de Estadística con Statgraphics Análisis de la Varianza de un Factor Fundamentos teóricos El Análisis de la Varianza con un Factor es una técnica estadística de contraste de hipótesis, cuyo propósito

Más detalles

Pruebas de Hipótesis de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Pruebas de Hipótesis de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides Pruebas de ipótesis de Una y Dos Muestras UCR ECCI CI-35 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides ipótesis Estadísticas Conceptos Generales En algunos casos el científico

Más detalles

APROXIMACIÓN DE LA DISTRIBUCIÓN BINOMIAL A LA NORMAL, LA CALCULADORA Y

APROXIMACIÓN DE LA DISTRIBUCIÓN BINOMIAL A LA NORMAL, LA CALCULADORA Y APROXIMACIÓN DE LA DISTRIBUCIÓN BINOMIAL A LA NORMAL, LA CALCULADORA Y LAS TIC Abel Martín ( * ) Rosana Álvarez García ( ) En dos artículos anteriores ya hemos estudiado la distribución Binomial de parámetros

Más detalles

Capítulo 12. Análisis de variables categóricas: El procedimiento Tablas de contingencia. Tablas de contingencia

Capítulo 12. Análisis de variables categóricas: El procedimiento Tablas de contingencia. Tablas de contingencia Capítulo 12 Análisis de variables categóricas: El procedimiento Tablas de contingencia En las ciencias sociales, de la salud y del comportamiento es muy frecuente encontrarse con variables categóricas.

Más detalles

DESCRIPCIÓN ESPECÍFICA

DESCRIPCIÓN ESPECÍFICA DESCRIPCIÓN ESPECÍFICA NÚCLEO: COMERCIO Y SERVICIO SUBSECTOR: PRODUCCION Y SALUD OCUPACIONAL Nombre del Módulo: Análisis estadístico de datos. total: 45 HORAS. Objetivo General: Analizar la conformidad

Más detalles

60! hrs.! hrs.! hrs.!!!

60! hrs.! hrs.! hrs.!!! Carta Descriptiva 1 UMA 1001-95 " Estadística Descriptiva #$%&'$()*+'$(,%) Ciencias Sociales y Administración Principiante Obligatoria 60 hrs. hrs. hrs. Matemáticas Básicas Estadística Inferencial #+&+'$-$%&.+)/%(0$.-1.$'(23,4%50(

Más detalles

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 003 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS Junio, Ejercicio 3, Opción A Junio, Ejercicio 3, Opción B Reserva 1, Ejercicio 3,

Más detalles

Academia de Matemáticas. Apuntes para la Materia de Estadística II. Guía Básica para el Estudio de la Estadística Inferencial.

Academia de Matemáticas. Apuntes para la Materia de Estadística II. Guía Básica para el Estudio de la Estadística Inferencial. UNIVERSIDAD MICHOACANA DE SAN NICOLÁS DE HIDALGO Facultad de Contaduría y Ciencias Administrativas Academia de Matemáticas Apuntes para la Materia de Estadística II Guía Básica para el Estudio de la Estadística

Más detalles

Problemas. Intervalos de Confianza y Contrastes de Hipótesis

Problemas. Intervalos de Confianza y Contrastes de Hipótesis Problemas. Intervalos de Confianza y Contrastes de Hipótesis Ejemplos resueltos y propuestos Intervalos de Confianza Variable Nomal en la población Se selecciona una muestra de tamaño n de una población

Más detalles

Clase 8: Distribuciones Muestrales

Clase 8: Distribuciones Muestrales Clase 8: Distribuciones Muestrales Distribución Muestral La inferencia estadística trata básicamente con generalizaciones y predicciones. Por ejemplo, podemos afirmar, con base a opiniones de varias personas

Más detalles

UCLM - Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG)

UCLM - Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG) PAEG Junio 0 Propuesta A Matemáticas aplicadas a las CCSS II º Bachillerato UCLM - Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG) Matemáticas aplicadas a las Ciencias Sociales

Más detalles

Tema 5: Estimación puntual y por intervalos

Tema 5: Estimación puntual y por intervalos Tema 5: Estimación puntual y por intervalos Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 5: Estimación puntual y por intervalos Curso

Más detalles

Capítulo 19 Análisis no paramétrico: El procedimiento Pruebas no paramétricas

Capítulo 19 Análisis no paramétrico: El procedimiento Pruebas no paramétricas Capítulo 19 Análisis no paramétrico: El procedimiento Pruebas no paramétricas En los capítulos 13 al 18 hemos estudiado una serie de procedimientos estadísticos diseñados para analizar variables cuantitativas:

Más detalles

Problemas resueltos del Tema 3.

Problemas resueltos del Tema 3. Terma 3. Distribuciones. 9 Problemas resueltos del Tema 3. 3.1- Si un estudiante responde al azar a un examen de 8 preguntas de verdadero o falso Cual es la probabilidad de que acierte 4? Cual es la probabilidad

Más detalles

Repaso de matrices, determinantes y sistemas de ecuaciones lineales

Repaso de matrices, determinantes y sistemas de ecuaciones lineales Tema 1 Repaso de matrices, determinantes y sistemas de ecuaciones lineales Comenzamos este primer tema con un problema de motivación. Problema: El aire puro está compuesto esencialmente por un 78 por ciento

Más detalles

Tipo A Tipo B Min. y Máx. Gambas 2 1 50 Langostinos 3 5 180 Contenedores 1 1 50 Coste 350 550 350x + 550y

Tipo A Tipo B Min. y Máx. Gambas 2 1 50 Langostinos 3 5 180 Contenedores 1 1 50 Coste 350 550 350x + 550y IES Fco Ayala de Granada Sobrantes 010 (Modelo 6) Soluciones Germán-Jesús Rubio Luna MATEMÁTICAS CCSS II Sobrantes 010 (Modelo 6) SELECTIVIDAD ANDALUCÍA OPCIÓN A EJERCICIO 1 (.5 puntos) Un supermercado

Más detalles

Hay diferencias en la media del HOMA entre los diabéticos y los no diabéticos? Resumen del procesamiento de los casos

Hay diferencias en la media del HOMA entre los diabéticos y los no diabéticos? Resumen del procesamiento de los casos Test de hipótesis t de Student Hay diferencias en la media del HOMA entre los diabéticos y los no diabéticos? Resumen del procesamiento de los casos HOMA Casos Válidos Perdidos Total N Porcentaje N Porcentaje

Más detalles

EXPERIMENTACIÓN. Eduardo Jiménez Marqués

EXPERIMENTACIÓN. Eduardo Jiménez Marqués EXPERIMENTACIÓN Eduardo Jiménez Marqués 1 CONTENIDO: 1. Experimentación...3 1.1 Concepto...3 1. Definición...4 1.3 Dificultad...4 1.4 Ventaja...5 1.5 Planificación...5 1.6 Aplicaciones...5 1.7 Metodología...6

Más detalles

DIRECTRICES Y ORIENTACIONES GENERALES PARA LAS PRUEBAS DE ACCESO A LA UNIVERSIDAD

DIRECTRICES Y ORIENTACIONES GENERALES PARA LAS PRUEBAS DE ACCESO A LA UNIVERSIDAD Curso 2014/2015 Asignatura: MATEMÁTICAS APLICADAS A LAS CC.SS. II 1º Comentarios acerca del programa del segundo curso del Bachillerato, en relación con la Prueba de Acceso a la Universidad 0. INTRODUCCIÓN

Más detalles

PRUEBAS PARAMETRICAS Y PRUEBAS NO PARAMETRICAS. Juan José Hernández Ocaña

PRUEBAS PARAMETRICAS Y PRUEBAS NO PARAMETRICAS. Juan José Hernández Ocaña PRUEBAS PARAMETRICAS Los métodos paramétricos se basan en el muestreo de una población con parámetros específicos, como la media poblacional, la desviación estándar o la proporción p. Además deben de reunir

Más detalles

MATEMÁTICAS aplicadas a las Ciencias Sociales II

MATEMÁTICAS aplicadas a las Ciencias Sociales II MATEMÁTICAS aplicadas a las Ciencias Sociales II UNIDAD 1: SISTEMAS DE ECUACIONES. MÉODO DE GAUSS Sistemas de ecuaciones lineales Sistemas equivalentes. Transformaciones que mantienen la equivalencia.

Más detalles

Clase 5: Variables Aleatorias y Distribuciones de Probabilidad

Clase 5: Variables Aleatorias y Distribuciones de Probabilidad Clase 5: Variables Aleatorias y Distribuciones de Probabilidad Variables Aleatorias Una variable aleatoria es una función que asocia un número real con cada elemento del EM. Ejemplo 1: El EM que da una

Más detalles

Curso: Métodos de Monte Carlo. Unidad 1, Sesión 2: Conceptos básicos

Curso: Métodos de Monte Carlo. Unidad 1, Sesión 2: Conceptos básicos Curso: Métodos de Monte Carlo. Unidad 1, Sesión 2: Conceptos básicos Departamento de Investigación Operativa Instituto de Computación, Facultad de Ingeniería Universidad de la República, Montevideo, Uruguay

Más detalles

LICENCIADO EN CIENCIAS AMBIENTALES PROGRAMA DE ESTADÍSTICA

LICENCIADO EN CIENCIAS AMBIENTALES PROGRAMA DE ESTADÍSTICA LICENCIADO EN CIENCIAS AMBIENTALES PROGRAMA DE ESTADÍSTICA CURSO 2010-2011 TITULACIÓN: CIENCIAS AMBIENTALES ASIGNATURA: ESTADISTICA ÁREA DE CONOCIMIENTO: Estadística e Investigación Operativa Número de

Más detalles

Cómo aplicar las pruebas paramétricas bivariadas t de Student y ANOVA en SPSS. Caso práctico.

Cómo aplicar las pruebas paramétricas bivariadas t de Student y ANOVA en SPSS. Caso práctico. Universitat de de Barcelona. Institut de de Ciències de de l Educació Cómo aplicar las pruebas paramétricas bivariadas t de Student y ANOVA en SPSS. Caso práctico. María José Rubio

Más detalles

Tema 5: Introducción a la inferencia estadística

Tema 5: Introducción a la inferencia estadística Tema 5: Introducción a la inferencia estadística 1. Planteamiento y objetivos 2. Estadísticos y distribución muestral 3. Estimadores puntuales 4. Estimadores por intervalos 5. Contrastes de hipótesis Lecturas

Más detalles

Puedes descargar este examen en pdf desde esta dirección (busca el enlace Dropbox en la parte inferior de la página):

Puedes descargar este examen en pdf desde esta dirección (busca el enlace Dropbox en la parte inferior de la página): Univ. de Alcalá. Estadística 2014-15 Dpto. de Física y Matemáticas Grado en Biología. Examen final. Miércoles, 21 de Enero de 2015. Apellidos: Nombre: INSTRUCCIONES (LEER ATENTAMENTE). Puedes descargar

Más detalles

Tema 2 - Introducción

Tema 2 - Introducción Tema 2 - Introducción 1 Tema 1. Introducción a la inferencia estadística Planteamientos y objetivos. Revisión de distribuciones multivariantes. Esperanza y varianza de sumas de v.a. independientes. Tema

Más detalles

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS 1) INTRODUCCIÓN El análisis de varianza es una técnica que se puede utilizar para decidir si las medias de dos o más poblaciones son iguales. La prueba se

Más detalles

Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma:

Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma: Ignacio Martín Tamayo 25 Tema: ANÁLISIS DE VARIANZA CON SPSS 8.0 ÍNDICE --------------------------------------------------------- 1. Modelos de ANOVA 2. ANOVA unifactorial entregrupos 3. ANOVA multifactorial

Más detalles

Curso Práctico de Bioestadística Con Herramientas De Excel

Curso Práctico de Bioestadística Con Herramientas De Excel Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla MBA barcillo@gmail.com (593-9) 4194239 Fabrizio Marcillo Morla Guayaquil, 1966. BSc. Acuicultura. (ESPOL 1991). Magister

Más detalles

CONTRASTES DE HIPÓTESIS DE 1 POBLACIÓN

CONTRASTES DE HIPÓTESIS DE 1 POBLACIÓN CONTRASTES DE IPÓTESIS DE POBLACIÓN Autores: Alicia Vila (avilag@uoc.edu), Máximo Sedano (msedanoh@uoc.edu), Ángel A. Juan (ajuanp@uoc.edu), Anna López (alopezrat@uoc.edu). ESQUEMA DE CONTENIDOS Definición

Más detalles

Estimación puntual. Estadística aplicada a la empresa II Prof. D. Juan José Pérez Castejón

Estimación puntual. Estadística aplicada a la empresa II Prof. D. Juan José Pérez Castejón Estimación puntual Estadística aplicada a la empresa II Prof. D. Juan José Pérez Castejón 1 ESTIMACIÓN PUNTUAL Tras hacernos a la idea en el tema anterior de lo que la inferencia estadística es y persigue,

Más detalles

Muestreo estadístico. Relación 2 Curso 2007-2008

Muestreo estadístico. Relación 2 Curso 2007-2008 Muestreo estadístico. Relación 2 Curso 2007-2008 1. Para tomar la decisión de mantener un determinado libro como texto oficial de una asignatura, se pretende tomar una muestra aleatoria simple entre los

Más detalles

ANÁLISIS DE DATOS NO NUMERICOS

ANÁLISIS DE DATOS NO NUMERICOS ANÁLISIS DE DATOS NO NUMERICOS ESCALAS DE MEDIDA CATEGORICAS Jorge Galbiati Riesco Los datos categóricos son datos que provienen de resultados de experimentos en que sus resultados se miden en escalas

Más detalles

Grado en Finanzas y Contabilidad

Grado en Finanzas y Contabilidad Econometría Grado en Finanzas y Contabilidad Apuntes basados en el libro Introduction to Econometrics: A modern Approach de Wooldridge 5.2 Estimadores de Variables Instrumentales La endogeneidad aparece

Más detalles

Límites. Definición de derivada.

Límites. Definición de derivada. Capítulo 4 Límites. Definición de derivada. 4.1. Límites e indeterminaciones Hemos visto en el capítulo anterior que para resolver el problema de la recta tangente tenemos que enfrentarnos a expresiones

Más detalles

Unidad 6. Distribuciones de probabilidad continua, muestreo y distribución de muestras

Unidad 6. Distribuciones de probabilidad continua, muestreo y distribución de muestras Unidad 6 Distribuciones de probabilidad continua, muestreo y distribución de muestras Introducción La unidad 5 se enfocó en el estudio de las distribuciones de probabilidad discreta, entre las cuales

Más detalles