6. Conceptos básicos

La inferencia estadística POBLACIÓN Y MUESTRA Población Censo vs. Muestra Elemento o unidad Muestreo

La inferencia estadística POBLACIÓN Y MUESTRA

La inferencia estadística POBLACIÓN Y ESTRATOS

La inferencia estadística

Notación estadística

Qué proporción de la foto tendría que estar descubierta para poder decir de qué objeto se trata con cierto grado de confianza?

4 de 25? Pero, cuáles son más informativas? Las elegidas al azar. Combinaciones posibles de 4 cuadros de 25: 12 650!!

Cuando no se tiene acceso a toda la información de un fenómeno, es mejor elegir al azar que usar cualquier otro método. Ejemplo: Qué porcentaje de los votantes votaría por el candidato X? Imposible preguntarle a todos. Preguntamos sólo a unos cuántos; la mejor forma de elegirlos es al azar.

Tipos de muestreo Probabilístico o Aleatorio Al azar simple

Tipos de muestreo No probabilístico o no aleatorio Accidental

Cálculo del tamaño de la muestra n = z 2 p q E 2 Donde z Nivel de confianza o seguridad. E Nivel de precisión o Error máximo de estimación. p Valor proporcional de la variable en la poblacional. Se puede obtener revisando la literatura o por estudio piloto previos. En caso de no contar con dicha información, se utiliza valor p = 0.5 (50%). q Valor del complemento de p. Se calcula con: q = 1 - p

Patrón circular de la lógica de la prueba de hipótesis Planteamiento de la hipótesis de investigación Conclusiones respecto de la hipótesis planteada Traducción a través de definiciones operacionales y estadísticas Traducción de las conclusiones estadísticas a las conclusiones de investigación Establecimiento de las hipótesis estadísticas Observación y análisis de los datos relacionados con la hipótesis Confirmación o rechazo de la hipótesis estadística

Trabajo estadístico *Image via Bing *Image via Bing *Image via Bing *Image via Bing

Principios de inferencia estadística 1. Hay un modelo estadístico que pueda usarse para entender ciertos eventos observados.

Principios de inferencia estadística 2. Se observa un evento y éste es el foco de interés.

Principios de inferencia estadística 3. Pueden considerarse dos explicaciones: Explicación 1: El evento, aunque es raro, no es contrario al modelo estadístico; la rareza del evento es debida al azar. Explicación 2: El evento es tan raro en comparación con el modelo estadístico dado que se concluye que es extraordinario y que el modelo, por alguna razón, no se aplica a esta circunstancia.

Principios de inferencia estadística 4. Hay una posibilidad de error al adoptar cualquiera de las dos explicaciones. Habrá que minimizar las posibilidades de error.

1. Hay un modelo estadístico que pueda usarse para entender ciertos eventos observados. 2. Se observa un evento y éste es el foco de interés. 3. Pueden considerarse dos explicaciones: Explicación 1: El evento, aunque es raro, no es contrario al modelo estadístico; la rareza del evento es debida al azar. Explicación 2: El evento es tan raro en comparación con el modelo estadístico dado que se concluye que es extraordinario y que el modelo, por alguna razón, no se aplica a esta circunstancia. 4. Hay una posibilidad de error al adoptar cualquiera de las dos explicaciones. Habrá que minimizar las posibilidades de error. Principios de inferencia estadística 1. No hay diferencia entre los grupos; es decir, los dos grupos responden en forma similar. 2. Observamos las respuestas de los sujetos de ambos grupos; es el evento de interés. 3. Hay dos explicaciones: Explicación 1: Realmente no hay diferencia entre los dos grupos; cualquier diferencia observada se debe a las variaciones del azar. Explicación 2: El grupo 1 y el grupo 2 difieren en su ejecución. Las respuestas observadas en los sujetos son tan extraordinarias que no es probable que se obtengan únicamente por azar. Deben haberse obtenido porque ambos grupos realmente difieren. 4. La adopción de una explicación u otra implicará algún riesgo de error, el cual debe minimizarse.

Principios de inferencia estadística Ejemplo: Supongamos que estamos interesados en comparar a hombres y mujeres en el Test de la bayoneta del aceite, el cual consiste en levantar el cofre del coche del participante y pedirle que señale la bayoneta del aceite. El propósito del estudio es determinar si los hombres y las mujeres difieren en su ejecución del Test de la bayoneta del aceite.

Supóngase que cuatro hombres y cuatro mujeres son elegidos al azar de la población de posibles sujetos.

Principios de la inferencia estadística 1. No hay diferencias en el Test de la bayoneta del aceite entre hombres y mujeres, entonces la respuesta de los dos grupos será similar. La probabilidad de que una mujer pase el test es la misma que la probabilidad que tiene un hombre de pasarlo. 2. Observaremos la ejecución de ocho personas en el Test de la bayoneta del aceite. Éste es nuestro evento de interés. 3. Se examinan dos explicaciones: Explicación 1: Realmente no hay diferencia entre hombres y mujeres en el Test de la bayoneta del aceite; cualquier diferencia en la respuesta de estas ocho personas se debe sólo a las variaciones del azar. Explicación 2. Los hombres y las mujeres difieren en el Test de la bayoneta del aceite. Las respuestas observadas para estos ocho sujetos son tan extraordinarias que es improbable que hayan sido obtenidas sólo por azar. Deben haberse obtenido porque los hombres y las mujeres realmente difieren. 4. La adopción de una explicación o la otra implica algún riesgo de error, el cual deseamos minimizar.

M 4 0 M 4 0 M 4 0 M 4 0 M 4 0 Todos los posibles resultados (25) que podrían obtenerse de cuatro hombres (H) y cuatro mujeres (M) que hicieron el Test de la bayoneta del aceite; cada uno de ellos pasando (P) o reprobando (R) el test: M 0 4 M 0 4 M 0 4 M 0 4 M 0 4 M 1 3 M 1 3 M 1 3 M 1 3 M 1 3 M 2 2 M 2 2 M 2 2 M 2 2 M 2 2 M 3 1 M 3 1 M 3 1 M 3 1 M 3 1

Cuál configuración nos convencería de que los hombres (H) y las mujeres (M) difieren en pasar (P) o reprobar (R) el test? M 0 4 M 0 4 M 0 4 M 0 4 M 0 4 M 1 3 M 1 3 M 1 3 M 1 3 M 1 3 M 2 2 M 2 2 M 2 2 M 2 2 M 2 2 M 3 1 M 3 1 M 3 1 M 3 1 M 3 1 M 4 0 M 4 0 M 4 0 M 4 0 M 4 0

Qué tan convincente es? Probabilidad de error Si un resultado observado pudiera haber sido obtenido fácilmente sólo por azar cuando en realidad no hay diferencia entre los grupos, obtener ese resultado difícilmente podría ser una prueba convincente de que los grupos sí difieren. Ejemplo: P R H 2 2 M 3 1

Si los resultados del Test de la bayoneta del aceite fueran: M 0 4 M 0 4 M 0 4 M 0 4 M 0 4 M 1 3 M 1 3 M 1 3 M 1 3 M 1 3 M 2 2 M 2 2 M 2 2 M 2 2 M 2 2 M 3 1 M 3 1 M 3 1 M 3 1 M 3 1 M 4 0 M 4 0 M 4 0 M 4 0 M 4 0

Si adoptáramos la explicación 2 y concluyéramos que los hombres y las mujeres difieren, basaríamos nuestra conclusión en evidencia poco sólida. La probabilidad de cometer un error decir que existe una diferencia cuando de hecho no la hay sería muy alta. El proceso de inferencia estadística comúnmente se realiza de tal manera que estos errores no ocurran.

Podríamos determinar que un resultado como ése probablemente nos convencería de que los grupos difieren. Pero si queremos aplicar el principio 4, debemos ser más precisos. De los 25 probables resultados, cuántos son tan extremos, o más, que el observado? Los más extremos son: P R P R H 4 0 H 0 4 M 0 4 M 4 0

Los más extremos: M 0 4 M 0 4 M 0 4 M 0 4 M 0 4 M 1 3 M 1 3 M 1 3 M 1 3 M 1 3 M 2 2 M 2 2 M 2 2 M 2 2 M 2 2 M 3 1 M 3 1 M 3 1 M 3 1 M 3 1 M 4 0 M 4 0 M 4 0 M 4 0 M 4 0

Los resultados tan extremos como el observado son: P R P R P R P R H 4 0 H 3 1 H 1 3 H 0 4 M 1 3 M 0 4 M 4 0 M 3 1 Juntos hay 2 + 4 = 6 resultados que son tan extremos como, o más extremos que, el resultado observado. La probabilidad de obtener los resultados observados o resultados más extremos sólo por azar es 6/25 o 0.24.

Tan extremos como el obtenido: M 0 4 M 0 4 M 0 4 M 0 4 M 0 4 M 1 3 M 1 3 M 1 3 M 1 3 M 1 3 M 2 2 M 2 2 M 2 2 M 2 2 M 2 2 M 3 1 M 3 1 M 3 1 M 3 1 M 3 1 M 4 0 M 4 0 M 4 0 M 4 0 M 4 0

Siguiente pregunta: Un resultado obtenido que tiene una probabilidad de 24% de ser igualado o sobrepasado meramente por azar, es suficientemente extremo para ser una evidencia convincente de que los hombres en verdad difieren en el Test de la bayoneta del aceite? Supongamos que consideramos denominar a nuestro resultado observado convincentemente extremo.

Esto significaría que rechazaríamos la explicación de no diferencia (1) a favor de la explicación de que los grupos difieren (2). Cuál es nuestra probabilidad de cometer un error? Si adoptamos la explicación 2 y concluimos que los hombres difieren de las mujeres, la probabilidad de cometer un error es de 0.24 o 24%, lo cual es un riesgo enorme en la investigación científica. Preferiríamos riesgos más pequeños: 10% o 5% o 1%.

Así que diremos que no podemos concluir que hay una verdadera diferencia entre los hombres y las mujeres en el Test de la bayoneta del aceite, pues el riesgo de error asociado con la adopción de la explicación 2 es demasiado grande, por lo que debemos refugiarnos en la explicación 1: no hay diferencias entre hombres y mujeres.

Errores estadísticos Cuál es la verdad La hipótesis nula es verdadera La hipótesis nula es falsa Qué decisión se tomó La hipótesis nula es verdadera La hipótesis nula es falsa Correcto

Errores estadísticos Cuál es la verdad La hipótesis nula es verdadera La hipótesis nula es falsa Qué decisión se tomó La hipótesis nula es verdadera La hipótesis nula es falsa Error Tipo I

Errores estadísticos Cuál es la verdad La hipótesis nula es verdadera La hipótesis nula es falsa Qué decisión se tomó La hipótesis nula es verdadera La hipótesis nula es falsa Error Tipo II

Errores estadísticos Cuál es la verdad La hipótesis nula es verdadera La hipótesis nula es falsa Qué decisión se tomó La hipótesis nula es verdadera La hipótesis nula es falsa Correcto Error Tipo I α Error Tipo II β Correcto

α, β y n

Pasos para la prueba de hipótesis 1. Hipótesis de investigación La V1 se relaciona con la V2 2. Hipótesis estadísticas: Hipótesis nula H 0 La V1 no se relaciona con la V2 Hipótesis alterna H A La V1 se relaciona con la V2 3. Prueba estadística 4. Regla de decisión 0.05 (0.01, 0.001) 5. Cálculos 6. Decisión Se rechaza (o no se rechaza) la hipótesis nula 7. Conclusión La V1 se relaciona con la V2 (o no se relaciona)