PRUEBAS DE HIPOTESIS Es posible estimar u parámetro a partir de datos muestrales, bie sea ua estimació putual o u itervalo de cofiaza. Pero: Si mi objetivo o es estimar u parámetro, sio determiar el cumplimieto de ua hipótesis sobre el parámetro? El ivel de pobreza ha dismiuido, referecia aterior (30%) R=/ Pruebas de Hipótesis Claramete el objetivo mas que saber el valor exacto del parametro, cosiste e validar la hipótesis plateada
Como Opera ua Prueba de Hipotesis Població(N) µ Muestra () Resultados Decisió Parece que µ = l X l µ? Evidecia µ = l O µ > l Hipótesis l X Al parecer µ > l Su decisió se fudameta e la evidecia recogida a través de ua muestra represetativa
PRUEBAS DE HIPOTESIS Defiició: Procedimieto estadístico que a través del estudio de ua muestra aleatoria permite determiar el cumplimieto de ua hipótesis plateada sobre algua característica de la població. Características: La decisió se toma partiedo de la evidecia que se recaba a través de ua muestra aleatoria Determia mediate calculo de probabilidades si el cumplimieto de la hipótesis es razoable
Alguas Defiicioes: PRUEBAS DE HIPOTESIS Hipótesis de ivestigació: Idea o cojetura que se tiee a priori y que se desea cotrastar a través de la realidad. Es la suposició de ua verdad que aú o se ha establecido, es decir, ua cojetura que se hace sobre la realidad que aú o se cooce y que se ha formulado precisamete co el objeto de llegar a coocimieto de uevos hechos Grasseau. Teoria de la Ciecia. Pag 03. Ejemplos: H. La pobreza e cali (medida a travez del NBI) ha dismiuido a u ivel iferior al 30%. H. El promedio de vida es de 70 años.
PRUEBAS DE HIPOTESIS Alguas Defiicioes: Hipótesis Estadística: Represetació de la hipótesis de ivestigació e forma de ecuació matemática y e fució de parámetros poblacioales. Ejemplo: H : P < 0.30 La pobreza e Cali (medida a travez del NBI) ha dismiuido a u ivel iferior al 30%. H : µ = 70 El promedio de vida es de 70 años. Las hipótesis de ivestigació puede desglosarse e dos hipótesis estadísticas que se deomia Hipótesis ula e Hipótesis Altera:
PRUEBAS DE HIPOTESIS La hipótesis ula siempre debe platearse e térmios de igualdad, mietras que la hipótesis altera depederá del coocimieto que tega el ivestigar del problema o de la hipotesis de ivestigació. Ejemplo: Caso. La pobreza e Cali (medida a travez del NBI) ha dismiuido a u ivel iferior al 30%. (H 0 ): P = 0.3 vs (H ): P<0.3 Caso. El tiempo de vida promedio de determiada bacteria es meor a 0 días. µ = 70 70 (H 0 ): vs (H ): µ < 70 o µ 70 o µ > Depede del objetivo del ivestigador
Bajo que criterio acepto o o acepto la hipótesis ula? La verdad o falsedad de la hipótesis NO puede coocerse co total seguridad a meos que pueda examiarse toda la població La úica herramieta de la cual se dispoe es aceptar o rechazar la hipótesis ula co base e lo que se observe e ua muestra aleatoria. Es decir el valor del estimador dará algua evidecia sobre el valor que asume el parámetro. Regió Crítica Regió de aceptació Regió Crítica Se acepta H Se acepta H 0 Se acepta H P 0. 30 P = 0.30 P 0.30 0.5 0.30 0.35 Valores Críticos
PRUEBAS DE HIPOTESIS Se debe eteder que la aceptació de ua hipótesis implica ta solo que los datos o arrojaro suficiete evidecia que idique que esta o se cumple. ERRORES EN LAS PRUEBA DE HIPOTESIS Codició real Decisió H 0 verdadera H 0 falsa Rechazar H 0 Error Tipo I ok Aceptar H 0 ok Error Tipo II
TIPOS DE ERROR EN PRUEBAS DE HIPOTESIS Error Tipo I: Rechazar ua hipótesis ula cuado es verdadera Error Tipo II: No rechazar ua hipótesis ula cuado es falsa P(Error Tipo I) = α = Nivel de sigificacia P(Error Tipo II) = β Potecia de la Prueba = - P(Error Tipo II) Capacidad que tiee la prueba de rechazar ua hipótesis ula cuado esta es falsa. α β Lo ideal seria que tato como sea muy pequeños, pero esto solo se logra aumetado el tamaño de la muestra
ERRORES EN PRUEBAS DE HIPOTESIS H 0 verdadera H 0 Falsa β α Acepto H 0 Valor Critico No acepto H 0 Nótese como los errores e pruebas de hipótesis está relacioados de maera iversa
EJECUCION DE UNA PRUEBA DE HIPOTESIS. Platear ua hipótesis de ivestigació.. Traducir la hipótesis de ivestigació e hipótesis estadísticas 3. Fijar Nivel de Sigificacia α 4. Determiar u estadístico de prueba co distribució coocida (verificar supuestos). 5. Determiar regió de aceptació y regió de rechazo 6. Evaluar el estadístico de prueba e la muestra obteida aleatoriamete. 7. Cotrastar estadístico de prueba versus regió de aceptació y rechazo. 8. Decisió. Rechaza Ho si el valor del estadístico de prueba cae e la regió de rechazo
Estadísticos de prueba y sus distribucioes Caso Comparació ua població cotra u valor objetivo H 0 H Estadístico de Prueba Distribució µ µ 0 µ = µ 0 µ > µ 0 µ < P = P 0 P P > P < µ 0 P 0 P 0 P 0 X µ T = 0 σ X µ 0 T = Z = S P P 0 P ( P o o ) Z t( ) Z Muestras grades Muestras pequeñas y simétricas (Distribució ormal) Muestras grades
Estadísticos de prueba y sus distribucioes Caso Comparació de poblacioes H 0 H Estadístico de Prueba Distribució µ µ = d µ µ d T = ( X X ) ( µ µ ) t ( + S p + µ µ > d Distribucioes ( ) simetricas ) S + ( S S p = + µ µ < d ) P P = d P P d P d P d P > P < Z = ( pˆ pˆ ) ( P P ) pˆ ˆ ˆ ( p) p + ( pˆ ) Z Muestras Grades
Forma de la Regió de Rechazo La forma regió de rechazo depede de cómo se platee la altera: hipótesis. Hipótesis altera uilateral (Ua sola cola). Hipótesis Altera Bilaterales (dos colas)
Valores Críticos para Pruebas de Hipótesis desde la Distribució Normal Estádar Pruebas de dos colas (bilaterales) sigificacia 0, 0,075 0,05 0,05 0,0 Valor critico -,64,64 -,78,78 -,96,96 -,4,4 -,58,58 Pruebas de ua cola ( <) sigificacia 0, 0,075 0,05 0,05 0,0 Valor critico -,8 -,44 -,64 -,96 -,33 Pruebas de ua cola ( >) sigificacia 0, 0,075 0,05 0,05 0,0 Valor critico,8,44,64,96,33
Ejemplo ASOFONDOS es la asociació que regula los fodos de pesioes. Esta etidad sugiere que la edad de jubilació debe icremetarse, debido a que las codicioes de riesgo de los idividuos e la actualidad ha dismiuido, logrado icremetar su esperaza de vida, que hasta hace alguos años se había calculado e 70 años. Su afirmació la platea fudametádose e ua muestra de 00 registros de muertes que dio como resultado ua edad promedio de muerte de 7,8 años co desviació de 5 años. Que opia al respecto??
SOLUCIÓN Paso. Plateamieto de Hipótesis de Ivestigació La edad promedio de muerte es superior a 70 años µ > 70 Paso. Plateamieto de Hipótesis Estadísticas H : µ = 70 VS H : µ > 70 0 Paso 3. Selecció ivel de sigificacia α = 0.05 Paso 4. Selecció y calculo del estadístico de prueba z c = x µ σ 7.8 5 70 0 = = 00,
SOLUCIÓN Paso 5. Determiació Regió de Aceptació, Rechazo Regió de Aceptació z 0.05 =.64 Paso 6. Cotraste del estadístico de Prueba Paso 7. Decisió Z c =, Acepto Ho No existe suficiete evidecia para pesar que la esperaza de vida ha aumetado Paso 8. Calculo del Valor P p( z >,) = 0,
Valor P como Criterio de Decisió Defiició: Probabilidad de que el estadístico de prueba arroje u resultado ta extremo o más extremo que el observado cuado la Hipótesis ula es verdadera Criterio de Decisió Si el valor P es relativamete grade (valor p > sigificacía) Es razoable pesar que la Hipótesis ula puede ser cierta (se acepta Ho) Si el valor P es muy pequeño (valor p < sigificacía) se rechaza la Hipótesis ula De forma ligera puede verse como la probabilidad de que la Hipótesis Nula sea Verdadera
Ejemplos. Ua població Ejercicio. El calcio se preseta ormalmete e la sagre de los mamíferos e cocetracioes de alrededor de 6 mg por cada 00 ml del total de sagre. Ua serie de ueve pruebas sobre u paciete revelaro ua media muestral de 6, mg de calcio por 00 ml del volume total de sagre, y ua desviació estádar muestral de mg. Hay algua evidecia, para u ivel del 5% de sigificacia, de que el ivel medio de calcio para este paciete sea más alto del ormal? Ejercicio. E el ceso de 993 el porcetaje de hogares e Cali co más de NBI (pobres) era del 30%. Hoy, se afirma que esta cifra ha dismiuido. Para corroborar lo aterior se ha tomado ua muestra aleatoria de 00 Hogares ecotrado u porcetaje de 8.5%. Corrobora los resultados la afirmació aterior? Ejercicio 3. Se sabe que el 40% de los pacietes que se somete tratamietos para la adicció a las drogas, preseta resultados satisfactorios, los restates preseta recaídas. Para determiar si u uevo método reduce el porcetaje de recaídas, se aplica éste a 50 pacietes de los cuales 5 presetaro evetos de recaídas. Puede cocluirse que el uevo método es efectivo?
Ejemplos. Ua població Ejercicio 4. Alguas persoas afirma que es posible que las comuidades margiales esté presetado problemas de bajo peso al acer etre sus iños. Si se sabe que e ua població ormal el peso medio al acer de los iños es de 3, kg (6,4 lbs), tomado como referecia la muestra de 50 iños que se ha veido trabajado, determie la veracidad de la hipótesis que postula que el peso medio al acer de esta comuidad se ecuetra por debajo de lo ormal. (Utilice el criterio del valor p, usado u ivel de sigificacía del 5%) 0 Boxplot Peso al Nacer e la Comuidad X Valor P 8 6 8,0 No hay simetría e la distribució. Dos colas (0,056) Cola Superior (0,97) Cola Iferior (0,08) Peso 4 5,0 Los resultados del test puede o ser ta cofiables. 0 Cual es decisió? Solució: Pruebas o Parametricas
Distribució muestral de la diferecia de medias Si se toma aleatoriamete dos muestras aleatorias idepedietes de dos poblacioes co distribució ormal co parámetros µ, µ y σ,σ, etoces la distribució de la diferecia de medias se puede modelar segú los siguietes casos: Caso : Variazas coocidas Z = ( x x ) ( µ N σ σ + µ ) ( 0,) Aplica tambié para variables o ormales siempre y cuado los tamaños muestrales y sea relativamete grades (TLC)
a) Variazas Iguales Distribució muestral de la diferecia de medias σ σ = Caso : Variazas descoocidas ) ( ) ( ) ( + + = t S x x T µ µ σ σ + p S b) Variazas diferetes ) ( ) ( ) ( v p t S x x T + = µ µ ) * ( ) * ( + + = S S S p ) ( ) ( + + = S S S S V
Distribució de la diferecia de proporcioes ( ) ( ) (0,) ) ˆ ( ˆ ) ˆ ( ˆ ˆ ˆ N p p p p P P p p Z + =
Ejemplos. Comparació dos poblacioes idepedietes Ejercicio 5. Muchos autores afirma que los pacietes co depresió tiee ua fució cortical por debajo de lo ormal debido a u riego saguíeo cerebral por debajo de lo ormal. A dos muestras de idividuos, uos co depresió y otros ormales, se les midió u ídice que idica el flujo saguíeo e la materia gris (dado e mg/(00g/mi))obteiédose: Grupo Tamaño de Muestra Promedio Desviació Estádar Depresivos 9 47 7,8 Normales 53,8 6, Hay evidecia sigificativa a favor de la afirmació de los autores?
Ejemplos. Comparació dos poblacioes idepedietes Ejercicio 7: Para evaluar ua vacua para la gripe se seleccioa u grupo de 00 idividuos de riesgo. Se elige aleatoriamete a 00 de ellos y se les sumiistra la vacua (V+); de ellos 0 preseta posteriormete la gripe. E los otros 00 pacietes si vacuar (V-) se preseta 0 casos. Estimar la proporció de persoas co gripe e ambos casos. Platee las hipótesis estadísticas respectivas (Hipótesis ula y altera) Hay evidecia de que la vacua es eficaz?. Differece Test: (V+) (V-) Valor P Dos colas (0,078) Cola Superior (0,96) Cola Iferior (0,039)
Ejemplos. Comparació dos poblacioes idepedietes Ejercicio 6. Supoga que se ecesita costruir u acueducto para el muicipio de cadelaria, para ello la ciudad dispoe de dos poteciales fuetes de agua, Rio A y Rio B, pero dispoe de presupuesto para istalar solo ua plata de tratamieto e la cercaía de uo de los ríos y desde ahí sumiistrar el líquido a toda la muicipalidad. Existe dos parámetros técicos para la istalació de la plata, el primero tiee que ver co el caudal del rió, que segú cálculos de igeiería requiere ser mayor a 50 litros por segudo para mateer u adecuado ivel de servicio. El segudo parámetro tiee que ver co los idicadores de calidad de agua (DBO: Demada Bioquímica de Oxigeo) cuyo máximo valor promedio permitido es del orde de 7,5 mg/lt. Para realizar la evaluació técica se ha realizado valoracioes del caudal durate 50 días e ambos ríos (se registra si cumple co la codició o o) y se toma muestras de agua por día. Los resultados se resume e la siguiete tabla. INDICADOR RIO A RIO B Numero de días co el caudal míimo 46 40 Promedio DBO 5mg/lt 7mg/lt Desviació Estádar DBO mg/lt,5mg/lt
Ejemplo. Comparació de dos muestras apareadas E u programa de Cotrol de Efermedades Cróicas, la hipertesió está icluida como la primera patología a cotrolar. 5 pacietes hipertesos so sometidos al programa y cotrolados e su tesió asistólica ates y después de 6 meses de tratamieto. Los datos so los siguietes: Iicio 80 00 60 70 80 90 90 80 90 60 70 90 00 0 0 Fi 40 70 60 40 30 50 40 50 90 70 0 60 70 60 50 es eficaz el tratamieto? d: Iicio - Fi o 40 30 0 30 50 40 50 30 0-0 50 30 30 50 70 T = t d = 3.7 S d =.9 d s d d Estadístico de Prueba
Ejemplo. Comparació de dos muestras apareadas Co el objetivo de dismiuir los ídices de homicidios e la ciudad de Cali, la secretaria de gobiero ha decidido icremetar el pie de fuerza policial para 0 de las comuas de Cali y realizar operativos de forma itesiva durate u mes. Si el resultado del ejercicio es efectivo pesaría e ampliarse a las comuas restates. Los resultados fuero los siguietes (tasas de homicidios por mes) Comua 3 7 8 9 4 5 7 Febrero 50 35 36 4 5 30 70 46 53 56 Abril 45 3 38 38 9 30 74 48 45 50 Ha sido eficaz el operativo d =,4 S d = 4,35
Ejemplo. Comparació de dos muestras apareadas Paired T-Test ad CI: Febrero. Abril Paired T for Febrero - Abril N Mea StDev SE Mea Febrero 0 44,30 3,5 4,8 Abril 0 4,90 3,5 4,9 Differece 0,40 4,35,38 95% lower boud for mea differece: -, T-Test of mea differece = 0 (vs > 0): T-Value =,0 P-Value = 0,68