CONTRASTES DE HIPÓTESIS DE 1 POBLACIÓN



Documentos relacionados
Solución ESTADÍSTICA. Prueba de evaluación contínua 2 - PEC2

ESTIMACIÓN. puntual y por intervalo

Pruebas de. Hipótesis

Tests de hipótesis estadísticas

Problemas de Probabilidad resueltos.

Práctica 5. Contrastes paramétricos en una población

Tema 12: Contrastes Paramétricos

Tema 3. Comparaciones de dos poblaciones

Pruebas de Hipótesis de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Nombre...Apellidos... Grado en:...grupo:...

PRUEBAS DE HIPÓTESIS

Hipótesis Alternativa: Afirmación sobre las posibles alternativas que se tienen a la afirmación hecha en la hipótesis nula.

ANÁLISIS DE DATOS NO NUMERICOS

Test ( o Prueba ) de Hipótesis

Indicaciones específicas para los análisis estadísticos.

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

Métodos estadísticos y numéricos Contraste de hipótesis pag. 1 PROBLEMAS RESUELTOS DE CONTRASTE DE HIPÓTESIS

Inferencia Estadística

CONTRASTE DE HIPÓTESIS DE DOS POBLACIONES

Estimación. Intervalos de Confianza para la Media y para las Proporciones

Ecuaciones de primer grado con dos incógnitas

Intervalo para la media (caso general)

7.6 Comparación entre dos medias Poblacionales usando muestras independientes

Muestreo estadístico. Relación 2 Curso

EJERCICIOS DE MATEMÁTICAS I HOJA 4. Ejercicio 1. Se consideran los vectores

Problemas. Intervalos de Confianza y Contrastes de Hipótesis

Biometría Clase 8 Pruebas de hipótesis para una muestra. Adriana Pérez 1

PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica.

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

ESTIMACION DE INTERVALOS DE CONFIANZA

Pruebas de Acceso a las Universidades de Castilla y León

TEMA 4: Variables binarias

TEMA 7: Análisis de la Capacidad del Proceso

Control Estadístico de Procesos

x y 8000 x + y a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas.

TEMA 4: Introducción al Control Estadístico de Procesos

"CONTRASTES DE HIPÓTESIS" 4.4 Parte básica

TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones.

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

Tema 1: Test de Distribuciones de Probabilidad

Programa para el Mejoramiento de la Enseñanza de la Matemática en ANEP Proyecto: Análisis, Reflexión y Producción. Fracciones

Inferencia Estadística

Estadística y Método Científico Hugo S. Salinas. Fuente:

MODELOS DE PROBABILIDAD

MUESTREO TIPOS DE MUESTREO

Tema 5: Introducción a la inferencia estadística

(.$263*7.5"4+%#,"8..9$ $.$ # "4< $ 8 $ 7

LA DISTRIBUCIÓN NORMAL

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros.

UNIDAD DIDÁCTICA 7 ANÁLISIS DE ÍTEMS Y BAREMACIÓN DE UN TEST

ÍNDICE DISEÑO DE CONTADORES SÍNCRONOS JESÚS PIZARRO PELÁEZ

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

Capítulo 7: Distribuciones muestrales

Inferencia Estadística

DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS

Empresa de telefonía celular: Transintelcel

UNIDAD 1. LOS NÚMEROS ENTEROS.

15 CORREO WEB CORREO WEB

Matemáticas 2º BTO Aplicadas a las Ciencias Sociales

Test de hipótesis. Si H0 es cierta el estadístico. sigue una distribución t de Student con n grados de libertad: s n

Calculadora de Tamaño muestral GRANMO

PRUEBA DE KOLMOGOROV SMIRNOV (Contraste sobre la forma de la distribución) F(X) es la función de distribución que hipotetizamos.

Tema 7 COSTO ESTÁNDAR

Ejercicio de estadística para 3º de la ESO

Estimación de una probabilidad

INFERENCIA ESTADÍSTICA: CONTRASTE DE HIPÓTESIS

Aula Banca Privada. La importancia de la diversificación

Matrices equivalentes. El método de Gauss

de la empresa Al finalizar la unidad, el alumno:

IMPLANTACIONES DE ERP. CÓMO CONSEGUIR EL ÉXITO? MasEmpresa

SPSS: ANOVA de un Factor

PRUEBAS DE ACCESO A LA UNIVERSIDAD FASE GENERAL: MATERIAS DE MODALIDAD

Tema 10. Estimación Puntual.

ACCIONES Y OTROS TÍTULOS DE INVERSIÓN

IES Fco Ayala de Granada Junio de 2012 (General Modelo 4) Soluciones Germán-Jesús Rubio Luna

FICHERO DE AYUDA DEL PROGRAMA MEGAPRIMI

1 Marketing Avanzado: Eventos y Campañas

UNIDAD 1 LAS LEYES FINANCIERAS DE CAPITALIZACIÓN DESCUENTO

Tema 2. Espacios Vectoriales Introducción

T.1 CONVERGENCIA Y TEOREMAS LÍMITE

LÍMITES Y CONTINUIDAD DE FUNCIONES

Las técnicas muestrales, los métodos prospectivos y el diseño de estadísticas en desarrollo local

DIRECCIÓN FINANCIERA I TEMA 3

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere.

Grado en Ingeniería. Estadística. Tema 3

Diagnosis y Crítica del modelo -Ajuste de distribuciones con Statgraphics-

PANEL DE CONTROL (Zona de Administración) MANUAL DE USO Por conexanet. Revisión 1.1 Fecha

CONCLUSIONES DEL ESTUDIO DE LOS HÁBITOS TURÍSTICOS DE LOS HABITANTES DE BARCELONA

FICHERO DE AYUDA DEL PROGRAMA MEGAEURO

INFORME DE ANÁLISIS DE ENCUESTAS DE SATISFACCIÓN DE USUARIOS PERÍODO

Tema 5: Análisis conjunto y teoremas límite

Aproximación local. Plano tangente. Derivadas parciales.

Curso Práctico de Bioestadística Con Herramientas De Excel

DETERMINACIÓN DEL VOLUMEN DE PEDIDO.

MATEMÁTICAS CCSS II Sobrantes 2010 (Modelo 1) SELECTIVIDAD ANDALUCÍA

LABORATORIO Nº 2 GUÍA PARA REALIZAR FORMULAS EN EXCEL

Curso de Estadística no-paramétrica

MANUAL DE EJECUCION DE LA ESTRATEGIA Ibex35 Evolución por Josep Codina

Divisibilidad y números primos

Transcripción:

CONTRASTES DE IPÓTESIS DE POBLACIÓN Autores: Alicia Vila (avilag@uoc.edu), Máximo Sedano (msedanoh@uoc.edu), Ángel A. Juan (ajuanp@uoc.edu), Anna López (alopezrat@uoc.edu). ESQUEMA DE CONTENIDOS Definición Explicación gráfica Ejemplo de cálculo P - VALOR Ejemplo de cálculo Distribución Normal C- POBLACIÓN Distribución t-student Caso práctico con Minitab Proyecto e-math

INTRODUCCIÓN En este math-block, se pretende entender qué es y para qué se utiliza un contraste de hipótesis, así como saber calcular e interpretar los p-valor a la hora de realizar dichos contrastes para la media poblacional, sea o no conocida la desviación estándar poblacional. OBJETIVOS Definir una hipótesis y realizar la prueba de ésta Entender el concepto de p-valor Saber calcular el p-valor en los contrastes de hipótesis unilaterales y bilaterales Saber interpretar el resultado del p-valor a la hora de tomar decisiones en los contrastes de hipótesis CONOCIMIENTOS PREVIOS Es recomendable haber revisado los math-blocks correspondientes a La distribución normal y Estimación puntual y intervalos de confianza, así como los ejercicios asociados resueltos con Minitab. Proyecto e-math 2

CONCEPTOS FUNDAMENTALES Concepto de contraste de hipótesis Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad para determinar si la hipótesis es un enunciado razonable. Contraste de hipótesis de una población Un contraste de hipótesis es un proceso estadístico que permite elegir una hipótesis de trabajo de entre dos posibles y antagónicas. El contraste comienza con la formulación de dos hipótesis sobre el valor de algún parámetro poblacional, siendo ambas incompatibles (si una es cierta, la otra necesariamente ha de ser falsa). Supondremos cierta una de ellas, a la cual llamaremos hipótesis nula, y trataremos de determinar hasta qué grado las observaciones registradas son coherentes con. Sólo en caso de que haya fuertes indicios de incompatibilidad entre el supuesto de que sea cierta y los datos obtenidos empíricamente, descartaremos como hipótesis de trabajo y en su lugar tomaremos como cierta la hipótesis alternativa. Dos ejemplos de contrastes de hipótesis serían: ( i ) : µ = : µ ( ii) : σ = 2,5 : σ > 2,5 ( ) Contraste Bilateral ( ) Contraste Unilateral (>) En el siguiente esquema se representan las cuatro combinaciones posibles (en función de la decisión que tomemos y de la certeza o no de la hipótesis nula) de todo contraste de hipótesis: Decisión tomada Verdadera ipótesis Nula Falsa No descartar Decisión correcta de tipo A Probabilidad -α Error de tipo II Probabilidad β Descartar Error de tipo I Probabilidad α Decisión correcta de tipo B Probabilidad -β Tendremos una decisión correcta de tipo A cuando hayamos optado por no descartar la hipótesis nula y resulte que ésta es cierta. Por su parte, una decisión correcta de tipo B ocurrirá cuando hayamos decidido descartar la hipótesis nula y resulte que ésta era falsa. ablaremos de error de tipo I cuando hayamos descartado la hipótesis nula siendo ésta cierta (error que se considera como muy grave). Finalmente, acontecerá un error de tipo II cuando hayamos optado por no descartar la hipótesis nula y resulte que ésta es falsa. Dado que descartaremos o no la hipótesis nula a partir de muestras obtenidas (es decir, no dispondremos de información completa sobre la población), no será posible garantizar que la decisión tomada sea la correcta. Proyecto e-math 3

Lo que sí podremos hacer es controlar la probabilidad de cometer un error. Ahora bien, cuál de ellos? En un contraste de hipótesis lo interesante es rechazar la hipótesis nula. Por lo tanto el riesgo que estoy dispuesto a asumir de equivocarme al rechazar la, error de tipo I, es el que queremos controlar. Fijémonos que a error de tipo I más pequeño más seguridad al rechazar la hipótesis nula. Ahora bien, al empequeñecer el error de tipo I estamos javascript:sendmail()aumentando el error de tipo II, puesto que cuanta más probabilidad de aceptar más posibilidades de que aceptemos casos donde se cumpla (error de tipo II). Usualmente el error de tipo I se fija en,,,5 ó,. Fijado el error de tipo I para empequeñecer el error de tipo II debemos aumentar el tamaño de muestra. Ahora bien, aumentar el número de muestra no siempre es posible ya sea por falta de presupuesto o tiempo, por inviabilidad, Llamaremos potencia del contraste a la probabilidad de rechazar la hipótesis nula siendo ésta falsa. Fijémonos que, a mayor potencia, mejor contraste, puesto que podremos aceptar la hipótesis alternativa con poca probabilidad de que sea falsa. Denotaremos por α el nivel de significación o probabilidad de cometer un error de tipo I, y por β la probabilidad de cometer un error de tipo II. Con lo cual, la potencia es de - β. Como ya hemos indicado usualmente α se fija en,,,5 o,. Notamos otra vez que α, β, y el tamaño muestral n están interrelacionados, de forma que si hacemos disminuir cualquiera de ellos alguno de los dos restantes habrá de aumentar. Así, p.e., si queremos tomar un α menor deberemos aceptar que aumente β o bien incrementar el tamaño de la muestra n. Finalmente, llamaremos estadístico de contraste a una v.a. calculada a partir de las observaciones muestrales, la cual se usa conjuntamente con un criterio de decisión (establecido a priori) para determinar si hemos de descartar o no la hipótesis nula. Concepto de p-valor. Definimos el p-valor como la probabilidad de que, suponiendo cierta, el estadístico de contraste tome un valor al menos tan extremo como el que se obtiene a partir de las observaciones muestrales, i.e., el p-valor es el área de la cola de la distribución (o colas si el test es bilateral) definida a partir del estadístico de contraste:. El p-valor sólo puede calcularse una vez tomada la muestra, obteniéndose niveles críticos distintos para cada muestra. 2. El p-valor puede interpretarse como un nivel mínimo de significación en el sentido de que niveles de significación α, iguales o superiores al p - valor llevarán a rechazar la hipótesis nula. Por tanto, cuanto menor sea el p - valor mayor es el grado de incompatibilidad de la muestra con, lo que lleva a rechazar. 3. El cálculo del p-valor no proporciona de modo sistemático una decisión entre y. Esta forma de abordar los tests, nos permite una visión más amplia, por cuanto nos da información de para qué niveles de significación puede rechazarse la hipótesis nula, y para cuales no se puede. Para lo que sigue, tendremos en cuenta la siguiente propiedad: Supuesto: X se distribuye según una normal. Proyecto e-math 4

Recordatorio TCL: Si X se distribuye normalmente X también lo hará. En caso contrario, necesitaremos tomar un tamaño muestral n grande (generalmente, n > 3 es suficiente). Uso del p-valor en los contrastes sobre µ con σ conocida Dada una población X (que sigue una distribución cualquiera), con media µ (desconocida) y desviación estándar σ conocida, se trata de contrastar alguno de los tres tests siguientes: : µ = µ : µ µ o bien : µ = µ : µ < µ o bien : µ = µ : µ > µ x µ Estadístico de contraste: z* = N(,) σ n Si contiene > p-valor = P(Z>z*) Si contiene < p-valor = P(Z<z*) Si contiene p-valor = P(Z< - z* ó Z> z* ) = 2 P(Z< z* ) P-valor cuando contiene ">",4 Función de densidad (f.d.p.),3,2,, p-valor z* Valores de la v.a. Z P-valor cuando el test es bilateral,4 Función de densidad (f.d.p.),3,2,, p-valor -/z*/ /z*/ Valores de la v.a. Z Proyecto e-math 5

El p-valor nos proporciona el grado de credibilidad de la hipótesis nula: si el valor de p fuese muy pequeño (inferior a,), significaría que la hipótesis nula es del todo increíble (en base a las observaciones obtenidas), y por tanto la descartaríamos; si el valor de p oscilase entre,5 y, significaría que hay fuertes evidencias en contra de la hipótesis nula, por lo que la rechazaríamos o no en función del valor que hubiésemos asignado (a priori) a α. Finalmente, si el valor de p es grande (superior a,5), no habría motivos suficientes como para descartar la hipótesis nula, por lo que la tomaríamos como cierta. Criterio de decisión: Descartaremos si p-valor α (normalmente α =,5). En caso contrario aceptaremos (p-valor > α) Ejemplo utilizando la tabla de la normal. Un banco quiere analizar si las comisiones que cobra a sus clientes por operaciones en el mercado bursátil difieren significativamente de las que cobra la competencia, cuya media es de 2 euros mensuales con una desviación estándar de 4,3 euros. Este banco toma una muestra de 64 operaciones bursátiles y observa que la comisión promedio es de 3,6 euros. Contrastar, al nivel de significación del 5%, que este banco no difiere significativamente en el cobro de las comisiones por operaciones en la Bolsa con respecto a la competencia. Sea X = Comisiones que se cobran por operaciones en el mercado bursátil Tenemos: X (µ, 4,3) Queremos contrastar: : : µ = 2 : µ 2 Es decir, queremos contrastar si µ es 2 euros como la competencia o si por el contrario es distinto de esta cantidad. Calculamos el estadístico de contraste, Z * = X µ σ X = X µ σ n 3,6 2 = = 4,3 64,6,5375 = 2,98 Como es un contraste de dos extremos, ahora tenemos que calcular el p-valor correspondiente a z*=2,98, es decir el área que hay por debajo de z=-2,98 más el área que hay por encima de z= 2,98, i.e., el área en las dos colas. Si observamos la tabla de la distribución normal estándar, podemos comprobar que el área que hay a la izquierda de z=-2,98 es,4 y el área que hay a la derecha de 2,98 es también -,9986=,4 por lo que el p-valor= 2*,4=,28 Como el p-valor es menor que el nivel de significación, rechazaremos la hipótesis nula a un nivel de significación del 5%. Por lo tanto existe evidencia estadística de que la comisión promedio que cobra este banco difiere significativamente de la competencia. Proyecto e-math 6

Uso del p-valor en los contrastes sobre µ con σ desconocida Dada una población X (que sigue una distribución cualquiera), con media µ y desviación estándar σ desconocidas, se trata de contrastar alguno de los tres tests siguientes: : µ = µ : µ µ o bien : µ = µ : µ < µ o bien : µ = µ : µ > µ x µ Estadístico de contraste: t* = t Student( n ) s n Criterio de decisión: Descartaremos si p-valor α (normalmente α =,5). Ejemplo utilizando la tabla de la t-student La directora del departamento de personal de una importante corporación está reclutando un gran número de empleados para un puesto en el extranjero. Durante el proceso de selección, la administración le pregunta cómo van las cosas, y ella responde que cree que la puntuación promedio en la prueba de aptitudes será de aproximadamente 9 puntos. Cuando la administración revisa 9 de los resultados de la prueba compilados, encuentra que la puntuación media es 83,24 y la desviación estándar de esta puntuación es. Si la administración desea probar la hipótesis : µ = 9 vs a : µ 9 al nivel de significación del %, Cuál es el valor del estadístico de contraste y su p-valor? : µ = 9 : µ 9 a Suponemos que la población de resultados de todos los candidatos sigue una distribución normal. X N( µ ; σ ) y entonces la distribución muestral de cada media muestral de cada muestra de cada población seguirá también una normal : X N µ ; S n Como no se conocen las desviaciones estándar de las dos poblaciones, tendremos que utilizar la distribución de la t-student como distribución del estadístico de contraste. X µ X µ t = = t student( n ) σ σ X n Si calculamos el estadístico t de contraste nos queda: Proyecto e-math 7

t = X µ ˆ σ X = X µ ˆ σ n 83,25 9 = 9 = 2,6747 Como los grados de libertad son 8, entonces como tenemos un contraste de dos colas, es decir en la hipótesis alternativa aparece el distinto, es decir : µ = 9 : µ 9 ; entonces el p-valor de t = -2,6747 será la probabilidad de estar por encima de 2,6747 más la probabilidad de estar por debajo de t =-2,6747. Cuando no aparece en la tabla de la t-student el valor exacto del estadístico del cual se quiere calcular su p-valor, se toma como referencia el valor más cercano, en este caso t=-2,5524. Por tanto el p-valor = P(t>2,5524)+P(t<- 2,5524)=,+,=2*,=,2, porque a la derecha de 2,5524 hay la misma probabilidad que a la izquierda de -2,5524 Así que el p-valor de t=-2,6747 será menor a,2 porque a mayor valor del estadístico menor área por encima como se puede ver en la tabla. Cuando los grados de libertad no aparezcan en la tabla de la t-student, se toma los grados de libertad más cercanos al cual se quiere tener en cuenta. Si el contraste hubiese sido de una cola, bien por la derecha o bien por la izquierda, : µ > 9 ó : µ < 9, entonces el p valor del estadístico (supongamos que el estadístico es t = 2,6747) si el contraste es de cola derecha, es decir (mayor que), sería la probabilidad de estar por encima de t = 2,5524 que sería,, por lo que el p-valor de t= 2,6747 sería menor que,. Si es por la cola izquierda (es decir menor que), el p-valor del estadístico (supongamos que el estadístico vale t= -2,6747) sería la probabilidad de estar por debajo de t = -2,5524 que sería,, por lo que el p-valor de t= - 2,6747 sería menor que,. Uso del p-valor en los contrastes sobre la prob. de éxito p en una binomial Supongamos que una población X se distribuye según una binomial con probabilidad de éxito p desconocida. A fin de estimar dicho parámetro, tomamos una muestra de tamaño n y definimos la probabilidad muestral de éxito como: p = nº éxitos observados / n. Se tratará de contrastar alguno de los tres tests siguientes: : p = p : p p o bien : p = : p < p p o bien : p = p : p > p Supuesto : La distribución de X es aproximadamente normal. X N np, np( p). Recordemos que si n 2, n*p 5, y n*(-p) 5, entonces ( ) Supuesto 2: Las n observaciones que constituyen la muestra han sido seleccionadas de forma aleatoria e independiente de una población que no ha cambiado durante el muestreo. Estadístico de contraste: z* = p p p( p) N(,) n Criterio de decisión: Descartaremos si p-valor α (normalmente α =,5). Proyecto e-math 8

Ejemplo utilizando la tabla de la normal Un portal e-business sabe que el 6% de todos sus visitantes a la web están interesados en adquirir sus productos pero son reacios al comercio electrónico y no realizan finalmente la compra vía Internet. Sin embargo, en la dirección del portal se piensa que en el último año, el porcentaje de gente que está dispuesta a comprar por Internet ha aumentado y eso se debe reflejar en sus resultados empresariales. Contrastar al nivel de significación del 2% si en el último año se ha reducido el porcentaje de gente que no está dispuesta a comprar por Internet, si para ello se tomó una muestra de 5 visitantes para conocer su opinión y se observó que el 55% no estaba dispuesto a realizar compras vía on-line. A: : p =,6 : p <,6 La distribución del número de visitantes del portal que no están dispuestos a comprar vía internet se va a aproximar a una normal debido a que n*p = 5*,6 = 3 5. Calculamos el estadístico de control estandarizado: p p,55,6 z * = = = 2,27 p( p),6(,6) n 5 Como es un contraste de un extremo, por la izquierda, ahora tenemos que calcular el p-valor correspondiente a z*=-2,27 es decir el área que hay bajo la curva a la izquierda de -2,27 en la tabla de la normal. Entonces si vamos a la tabla de la normal, podemos ver que el área que hay por debajo de z = -2,27 es,6. Como el p-valor =,6 es menor que el nivel de significación que es,2(2%), entonces rechazaremos la hipótesis nula a un nivel de significación del 2%.. En conclusión existe evidencia estadística que la proporción de visitantes al portal que están dispuestos a comprar a través de Internet ha aumentado o dicho de otra manera que el porcentaje de visitantes que son reacios a comprar vía on-line ha disminuido. Casos hipotéticos:. Si el contraste hubiese sido unilateral por la derecha, es decir p >, 6 y z= 2,27, tendríamos que tener en cuenta el áreas que hay por encima de z=-2,27,, es decir -área por debajo de z=2,27, es decir P ( Z < 2,27) =,9884 =, 6 Como el p-valor=,6 es menor que el nivel de significación que es,2(2%), entonces rechazaremos la hipótesis nula a un nivel de significación del 2%. En conclusión existe evidencia estadística que la proporción de visitantes al portal que están dispuestos a comprar a través de Internet ha disminuido o dicho de otra manera que el porcentaje de visitantes que son reacios a comprar vía on-line ha aumentado. Proyecto e-math 9

2. Si el contraste hubiese sido bilateral, es decir en la alternativa hubiese aparecido p, 6 y z = 2,27 el p-valor sería igual a la suma del área por encima de z=2,27 más el área por debajo de z = -2,27, es decir,6 dos veces, p-valor = 2*,6=,232. Como el p-valor=,232 es mayor que el nivel de significación que es,2(2%), entonces no rechazaremos la hipótesis nula a un nivel de significación del 2%. En conclusión existe evidencia estadística que el porcentaje de visitantes que son reacios a comprar vía on-line es del 6%. P-valor cuando el contraste es bilateral,4 Función de densidad (f.d.p.),3,2,, -/z*/= - 2,27 Valores de la v.a. Z p-valor: suma de ambas áreas =,232,6,6 /z*/ = 2,27 Proyecto e-math

CASOS PRÁCTICOS CON SOFTWARE. Una multinacional desea analizar el sueldo neto por año de sus empleados en las empresas situadas en España. Para ello se tomó una muestra de 4 directivos y se obtuvo el salario bruto anual de cada uno. En los últimos años se había estimado que el salario medio anual de los trabajadores en España era de 8. euros, con una desviación estándar de 2.6 euros. Salarios brutos medios anuales en miles de euros. 8,263 2,3956 8,4742 8,5457 9,26 3,24 8,8842 8,999 4,756 6,678 7,8783 2,6542 8,2433 6,887 2,429 5,2542 6,648 9,553 6,6 8,896 2,767 22,4938 8,246 7,2399 7,5592 5,4 23,535 2,2367 6,5339 2,873 9,.844 4,976 2,357 7,5765 6,6488 6,947 22,3734 8,2373 4,63 2,8947 a) El jefe de personal considera que el sueldo medio anual debe ser menor que 8. euros y quiere contrastar, con un nivel de significación del.5, la hipótesis oficial de que el tiempo medio es de 8. euros frente a la hipótesis de que dicha media es menor. El contraste de hipótesis que estableceremos será : µ=8 vs. : µ<8 Seleccionamos Stat > Basic Statistics > -Sample Z: Proyecto e-math

Z-Test Test of mu = 8. vs mu < 8. The assumed sigma = 2.6 Variable N Mean StDev SE Mean Z P C 4 8.29 2.474.4.3.62 Dado que el p-valor obtenido.62 >.5, no descartaremos la hipótesis nula, esto significa que parece razonable considerar que el salario medio bruto anual sea de es de 8. euros. b) Igualmente, realiza el mismo contraste que en el apartado a), pero suponiendo ésta vez que no conoces la desviación estándar. Análogamente, seleccionamos Stat > Basic Statistics > -Sample t, obteniendo los siguientes resultados: T-Test of the Mean Test of mu = 8. vs mu < 8. Variable N Mean StDev SE Mean T P C 4 8.29 2.474.39.33.63 Por tanto, observamos que el p-valor.63 >.5, lo cual nos indica que no rechazaremos la hipótesis nula, es decir, asumiremos como posible la opción de que el salario bruto medio anual sea 8. euros, ya que no tenemos indicios suficientes para rechazar esta posibilidad. Proyecto e-math 2

2. El Dpto. de Marketing de una empresa europea quiere analizar la eficacia de su fuerza de ventas. Para ello tomó una muestra de 5 comerciales repartidos por sus varias delegaciones en Europa y se obtuvo en euros lo que cada comercial ha facturado en los últimos seis meses. Se ha comprobado que, hasta ahora, que el volumen facturado por la fuerza de ventas hasta ahora seguía una distribución aproximadamente normal de media 65. y desviación típica de 45.. a) Realizar un contraste de hipótesis bilateral sobre la media de la población para un nivel de significación α=,5. Tomamos como hipótesis nula : µ = 65, siendo la hipótesis alternativa : µ 65 Copiamos los datos en una hoja de Minitab y seleccionamos Stat > Basic Statistics > - Sample Z : Proyecto e-math 3

Z-Test Test of mu = 65 vs mu not = 65 The assumed sigma = 45 Variable N Mean StDev SE Mean Z P Precio 5 53775 46 3674-3.6.23 Observar que el p-valor obtenido es de,23 <,5. Esto indica que deberíamos rechazar la hipótesis nula. Por tanto, concluiremos que hay indicios suficientes para pensar que la facturación obtenida por la fuerza de ventas ha variado. b) Realizar un contraste similar al anterior suponiendo que esta vez no conocemos la desviación estándar σ. En este caso, tenemos que utilizar la distribución t-student, en lugar de la normal debido a que la desviación estándar es desconocida. Seleccionamos Stat > Basic Statistics > -Sample t: Proyecto e-math 4

T-Test of the Mean Test of mu = 65 vs mu not = 65 Variable N Mean StDev SE Mean T P Precio 5 53775 46 3398-3.3.2 Observar que el p-valor obtenido,2 sigue siendo inferior a,5, lo que nos lleva nuevamente a rechazar la hipótesis nula. Por ello, podemos concluir que efectivamente la facturación obtenida por la fuerza de ventas ha variado. 3. Supongamos que trabajamos para un candidato a la alcaldía de nuestra ciudad y nos encontramos en plena campaña electoral. Nuestro candidato estima que tiene el apoyo del 55% de los votantes. Sin embargo, acaban de llegar a nuestra oficina los datos de una encuesta reciente en la que sólo 86 de 2 potenciales votantes (seleccionados de forma aleatoria) optan por nuestra opción. Nos interesa contrastar, a un nivel de significación del,5, las hipótesis : p =,55 vs. : p <,55. Observar que se verifican los supuestos. En particular, el supuesto de normalidad se verifica dado que n = 2 > 2, np = 2*,55 > 5, y n(-p) = 2*,45 > 5. Realicemos el contraste: Seleccionamos: Stat > Basic Statistics > Proportion : Entramos en el menú Options y rellenamos los campos como se muestra en la imagen siguiente: Proyecto e-math 5

Test and Confidence Interval for One Proportion Test of p =,55 vs p <,55 Sample X N Sample p 95, % CI Z-Value P-Value 86 2,43 (,36387;,49863) -3,4, A raíz del resultado obtenido ( p-valor =, <,5 ), concluimos que deberemos descartar la hipótesis nula, i.e., los datos obtenidos en la última encuesta sobre intención de voto sugieren que el porcentaje de votantes que apoyan nuestra candidatura es inferior al 55%. De hecho, a partir de las observaciones, podemos afirmar con un nivel de confianza del 95% que el porcentaje de votos favorables se sitúa entre un 36% y un 5%. Proyecto e-math 6

RESUMEN-ESQUEMA SOBRE IC & C PARA POBLACIÓN NP significa que deberemos usar métodos No Paramétricos (fuera del contenido del curso) Proyecto e-math 7

TABLA DE LA t-student Esta tabla nos da los valores de a tales que P[ t(df) a ] = p donde t(df) sigue una distribución t-student con df grados de libertad VALORES DE P DF,4,25,5,,5,25,,5,3249,,9626 3,777 6,337 2,762 3,82 63,6559 2,2887,865,3862,8856 2,92 4,327 6,9645 9,925 3,2767,7649,2498,6377 2,3534 3,824 4,547 5,848 4,277,747,896,5332 2,38 2,7765 3,7469 4,64 5,2672,7267,558,4759 2,5 2,576 3,3649 4,32 6,2648,776,342,4398,9432 2,4469 3,427 3,774 7,2632,7,92,449,8946 2,3646 2,9979 3,4995 8,269,764,8,3968,8595 2,36 2,8965 3,3554 9,26,727,997,383,833 2,2622 2,824 3,2498,262,6998,93,3722,825 2,228 2,7638 3,693,2596,6974,877,3634,7959 2,2 2,78 3,58 2,259,6955,832,3562,7823 2,788 2,68 3,545 3,2586,6938,795,352,779 2,64 2,653 3,23 4,2582,6924,763,345,763 2,448 2,6245 2,9768 5,2579,692,735,346,753 2,35 2,625 2,9467 6,2576,69,7,3368,7459 2,99 2,5835 2,928 7,2573,6892,69,3334,7396 2,98 2,5669 2,8982 8,257,6884,672,334,734 2,9 2,5524 2,8784 9,2569,6876,655,3277,729 2,93 2,5395 2,869 2,2567,687,64,3253,7247 2,86 2,528 2,8453 2,2566,6864,627,3232,727 2,796 2,576 2,834 22,2564,6858,64,322,77 2,739 2,583 2,888 23,2563,6853,63,395,739 2,687 2,4999 2,873 24,2562,6848,593,378,79 2,639 2,4922 2,797 25,256,6844,584,363,78 2,595 2,485 2,7874 26,256,684,575,35,756 2,555 2,4786 2,7787 27,2559,6837,567,337,733 2,58 2,4727 2,777 28,2558,6834,56,325,7 2,484 2,467 2,7633 29,2557,683,553,34,699 2,452 2,462 2,7564 3,2556,6828,547,34,6973 2,423 2,4573 2,75 35,2553,686,52,362,6896 2,3 2,4377 2,7238 4,255,687,5,33,6839 2,2 2,4233 2,745 45,2549,68,485,37,6794 2,4 2,42 2,6896 5,2547,6794,473,2987,6759 2,86 2,433 2,6778 6,2545,6786,455,2958,676 2,3 2,39 2,663 7,2543,678,442,2938,6669,9944 2,388 2,6479 8,2542,6776,432,2922,664,99 2,3739 2,6387 9,254,6772,424,29,662,9867 2,3685 2,636,254,677,48,29,662,984 2,3642 2,6259 2,2539,6765,49,2886,6576,9799 2,3578 2,674 5,2538,676,4,2872,655,9759 2,355 2,69 2,2537,6757,39,2858,6525,979 2,345 2,66 3,2536,6753,382,2844,6499,9679 2,3388 2,5923 E+9,2533,6745,364,286,6449,96 2,3263 2,5758 a Proyecto e-math 8

BIBLIOGRAFÍA [] D.A. Lind, R.D. Mason, W.G. Marchal (2): Estadística para Administración y Economía. Ed. Irwin McGraw-ill.F. [2] Kvanli, A. Introduction to Business Statistics South-Western [3] R. Johnson (996): Elementary Statistics. Ed. Duxbury [4] Richard I. Levin & David S. Rubin (996): Estadística para Administradores. Ed. Prentice all. ENLACES http://oak.cats.ohiou.edu/~wallacd/shyp.html : Características y ejemplos del contraste de hipótesis para una muestra, conocida la media y desviación estándar de la población. http://oak.cats.ohiou.edu/~wallacd/sci.html : Características y ejemplos de intervalos de confianza para una muestra, conocida la media de la población. http://halweb.uc3m.es/esp/personal/personas/stefan/esp/applet.htm : Colección de applets de conceptos básicos de Estadística. http://e-stadistica.bio.ucm.es/mod_intervalos/intervalos_applet.html : Applet sobre estimación por intervalos. http://e-stadistica.bio.ucm.es/mod_contraste/contraste_applet.html : Applet sobre contraste de hipótesis. Proyecto e-math 9