1.1. La ciencia de la estadística:. El origen de la estadística:. Ciencia descriptiva. Evaluación de juegos de azar Ciro el Grande (560-530 A.C.) Si tengo 1 As y 2 reyes, que descarte es mas conveniente (1 As, 2 Reyes, 1+2)? 1
1.1. La ciencia de la estadística:. Definición formal e informal. Aplicaciones de la Estadística:. Resumen de datos. Análisis de muestras. Contraste de hipótesis. Cuantificación de relaciones. Predicción de variables. El modelo estadístico:. Paramétrico/No Paramétrico. Clásico/Bayesiano (33 º C en promedio) Ciencia que permite obtener conclusiones de la investigación empírica basándose en modelos matemáticos Variable estudiada = Efecto Sistemático + Efecto Aleatorio 2
Tema I. Introducción 1.2. Algunas definiciones:. Población. Variable aleatoria. Distribución de frecuencias Cuando en una población conocemos los posibles valores o medidas de un atributo y su probabilidad correspondiente 3
1.3. La estadística descriptiva: - Tipos de variable:. Cualitativa. Rangos. Numérica Tema I. Introducción Variables Cualitativas 4
1.3. La estadística descriptiva: - Tipos de variable:. Cualitativa. Rangos. Numérica Posiciones en el Mundial F1 Poles en el Mundial, en los últimos 6 premios: Alonso: 4, 3, 2, 4, 6, 2 Hamilton: 3, 1, 2, 1, 3, 1 Se pueden utilizar los métodos de las cualitativas y de las numéricas 5
Tema I. Introducción Discreta (nº de pelos) 1.3. La estadística descriptiva: - Tipos de variable:. Cualitativa. Rangos. Numérica:. Discreta. De intervalo ( cuantitativa ) De intervalo (longitud de pelos, en mm) Las de intervalo pueden tener valores entre cada dos valores cualesquiera 6
Tema I. Introducción Población de 10 medidas 1.3. La estadística descriptiva: - Descripción de una variable de intervalo en una población:. Medidas de centralidad:. Media. Moda. Mediana Tabla de Frecuencias: Valor 9 10 11 12 13 14 Media = (X i ) = 11.3 n 11 10 12 9 14 11 10 12 11 13 Frecuencia 1 2 3 2 1 1 3.5 3 Moda = 11 2.5 2 1.5 Mediana = 11 (el segundo 11) 1 0.5 0 7 9 10 11 12 13 14
Tema I. Introducción 1.3. La estadística descriptiva: - Descripción de una variable en una población:. Medidas de dispersión:. Varianza. Desviación típica. Coeficiente de variación Var = 1,2 y 3 (x i2 ) = 1297 ( x i ) = 113 σ 2 = 2,23333 σ = 1,4944 σ 2 = Fórmula práctica: ( x i ) 2 x i2 - n n σ 2 CV (adimensional) = x 100 = 19,8% μ Tabla de Frecuencias Valor 9 10 11 12 13 14 Frecuencia 1 2 3 2 1 1 8
Tema I. Introducción Probabilidad en dados 1.4. La probabilidad y sus reglas:. Probabilidad. Distribución de probabilidades Cuando un evento puede ocurrir de N maneras mutuamente excluyentes (las 6 caras de un dado), la probabilidad de que ocurra una de ellas (el 6) es 1/N (1/6 en el ejemplo) La probabilidad de sacar negro será 4/8 = 0,5 Distribución de probabilidad de tirada de 3 dados Probabilidad en ruleta 9
1.4. La probabilidad y sus reglas: - Propiedades elementales de la probabilidad. Siempre mayor que 0; P(E i ) 0. La suma de probabilidades de todos los eventos posibles es 1: P(E 1 ) + P(E 2 ) + P(E n ) = 1. La probabilidad de que ocurra E 1 óe 2 es la suma P(E 1 óe 2 ) = P(E1) + P(E2). La probabilidad de dos sucesos independientes es el producto P(E 1 y E 2 ) = P(E 1 ) x P (E 2 ) Probabilidad de 1 ó 3? Probabilidad de 4 y 2, sucesivamente? 1/8 + 1/8 = 0,25 1/8 x 1/8 = 0,015625 10
1.4. La probabilidad y sus reglas: - Necesidad de trucos de conteo para estimar probabilidades. Factoriales de n (ordenaciones posibles sin restricciones) n! = n x (n-1) x (n-2) x 1. Permutaciones (arreglo ordenado de objetos) n! npr = n x (n-1) x (n-2) x (n-r+1) = (n-r)!. Combinaciones (permutaciones sin importar el orden) Permutaciones de 4 objetos de dos En algunas permutaciones sólo cambia el orden: n n! = r r! (n-r)! combinaciones de 4 de dos en dos 4! 4 x 3 x 2! 4 x 3 2! X 2! = 2! x 2! = 2 x 1 = 2 x 3 = 6 11
1.4. La probabilidad y sus reglas: - Ejemplos sencillos de estimación de probabilidades:. Probabilidad empleado < 30. Probabilidad enfermería. Probabilidad enfermería y < 30. Probabilidad <30 siendo enfermero Nº de empleados por clases de edad en un Hospital Trabajo <30 31-35 >35 Tot Médicos 5 25 75 105 Laboratorio 50 35 35 120 Enfermería 575 442 203 1220 Farmacia 13 8 3 24 Otros 135 101 69 305 TOTAL 778 611 385 1774 778/1774 = 0,44 1220/1774 = 0,69 575/1774 = 0,32 575/1220 = 0,47 Otra estrategia de obtención de las probabilidades: la probabilidad de ser enfermero y menor de 30 0,69 x 0,44 = 0,30 5/105 = 0,05 12
1.5. La distribución de probabilidad y la inferencia estadística: - Cálculo de la distribución de probabilidad de tirar una moneda 6 veces:. Representamos el número de caras que salen: 0, 1, 2, 3, 4, 5 y 6. Probabilidad de una tirada ½. Probabilidad de una tirada n veces (½) n c c c c c c Probabilidad = (½) 6 = 0,015625 + + + + + + Probabilidad = (½) 6 = 0,015625 + c c c c c + + c c c c c + c c c c c c + c c c c c c + c c etc. 6 6! 6 = 6! = 1 Combinaciones de 6 de 5 en 5 Probabilidad = 6 x (½) 6 = 0,09375 Nº de tiradas 6 6! 5 = 5!x1! = 6 Nº de caras etc. Tabla Resumen Nº caras 0 1 2 3 4 5 6 Probabilidad 0.016 0.094 0,234 0,312 0,234 0.094 0.016 13
1.5. La distribución de probabilidad y la inferencia estadística: - Cálculo de la distribución de probabilidad de tirar una moneda 6 veces:. Obtención de la distribución de probabilidad. Utilización de la inferencia estadística:. Que probable sería que de 6 tiradas se obtuviesen?:. A) 6 caras. B) 1 cara. C) Al menos 2 caras. D) entre 1 y 5 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 0,016 0,094 0,234 0,312 0,234 0,094 0,016 0 1 2 3 4 5 6 a) p = 0,016 b) p = 0,094 c) p = 1- (0,016 + 0,094) = 0,89 d) p = 0,968 El test estadístico de una/dos colas 14
1.6. El modelo estadístico general para poblaciones: - Estamos interesados en un determinado atributo (estadístico):. Por ejemplo la media de un carácter (μ) - Conocemos su distribución de probabilidad en la población - Nos hacemos preguntas sobre la probabilidad de que ciertos valores puedan darse en nuestra población Estadística Paramétrica Probabilidad Distribución de Probabilidad hipotética Valores del estadístico. La función se describe matemáticamente. La función es integrable Estadística NO Paramétrica. La función se genera empíricamente (mediante ordenadores y números pseudo-aleatorios). Se tabulan los resultados empíricos o se evalúa mediante conteo 15
1.7. La distribución normal y la estadística paramétrica: - ESTADÍSTICA PARAMÉTRICA (asumimos una distribución normal) - Una distribución muy frecuente y muy conveniente:. Función matemática depende de μ y σ. Es simétrica, con media = moda = mediana. La función matemática es integrable Se puede conocer la probabilidad de un área bajo la curva, en relación por ejemplo a su σ 16
1.7. La distribución normal y la estadística paramétrica: - Conjunto de distribuciones normales, con μ y σ - La conversión a una sola distribución normal: distribución normal unitaria (Distribución Z; 0 y 1) - Interpretación de tablas 17
1.8. La inferencia paramétrica para poblaciones: - Conocemos TODOS los valores de la población - Estimación de intervalos de confianza. Ejemplo de Población ALUMNOS DE UNA CLASE: 10,2 9,7 10 9,6 8,7 11 10,5 10,9 X? Estadística descriptiva: Media de población conocida (μ) = 10,07 Varianza (σ 2 ) = 0,499 Desviación típica (σ) = 0,707 OBTENCIÓN DE INTERVALO DE CONFIANZA Distribución Z Población Real INT1 INT2 0 ± 15% (65%=0,39) 10,07 ± 0,27 (0,39 x 0,707) 9,8 10,34 0 ± 30% (80%=0,84) 10,07 ± 0,59 (0,84 x 0,707) 9,5 10,7 0 ± 47,5% (97,5%=1,96) IC 95% 10,07 ± 1,38 (1,96 x 0,707) 8,7 11,4 0 ± 49,5% (99,5%=2,58) IC 99% 10,07 ± 1,82 (2,58 x 0,707) 8,2 11,9 Método General Media ± z σ 18
1.8. La inferencia paramétrica para poblaciones: - Realización de un test de hipótesis (la otra cara del mismo fenómeno):. Dos hipótesis alternativas (H 0 y H 1 ). Evaluación de la Ho en función de un nivel de significación (5%) Ejemplo de Población ALUMNOS DE UNA CLASE: 10,2 9,7 10 9,6 8,7 11 10,5 10,9 X? Nivel significación 5% (p una cola 0.025) Si X = 11; H 0 = pertenece a la población; H 1 =no (valor μ)/σ = (11 10,07)/0,707 = 1,32 : p en tabla z = 0.09; (0,18 dos colas) Según NS del 5% se acepta H 0 Si X = 11,9; H 0 = pertenece a la población; H 1 =no (valor μ)/σ = (11,9 10,07)/0,707 = 1,32 : p en tabla z = 0.005; (0,01 dos colas) Se rechaza H1 (p = 0.01; significativo para NS de 0,05) Método General Valor μ σ = z 19
Referencias Bibliográficas LIBROS: Daniel, W.W. 1989. Bioestadística. Base para el análisis de las ciencias de la salud. Limusa, México. Sokal,R.R., Rohlf, F.J. 1995. Biometry. Freeman and co., New York PÁGINAS WEB: http://personal5.iddeo.es/ztt/tem/t11_estadistica_introduccion.htm (algunos conceptos básicos de estadística) http://www.statsoft.com/textbook/sttable.html (tablas en línea para ver probabilidades de la distribución Z) http://home.ubalt.edu/ntsbarsh/excel/excel.htm (programación de cálculos estadísticos en EXCEL) 20