Bioestadística
Bioestadística Docentes: Edgardo Rodríguez Juan Passucci Rosana Cepeda Marcelo Rodriguez
Bioestadística Curso: Teórico. 9 hs Práctico: Com A: 12-14hs Com B: 14-16hs Parciales Promoción
Bioestadística Di Rienzo, J.A., Casanoves, F., Gonzalez, L.A., Tablada, E.M., Diaz, M., Robledo, C.W., Balzarini, M.G. (2001) Estadística para las Ciencias Agropecuaria. Editorial Triunfar, Cordoba, Argentina. 4ta edición
Estadística Conjunto de métodos científicos relacionados con la recolección, presentación y análisis de datos, para la deducción de conclusiones y la toma de decisiones objetivas. Es el arte de la decisión en presencia de incertidumbre.
Estadística Descriptiva Inductiva o Inferencial (Analítica).
Estadística Descriptiva Población: Conjunto de individuos u objetos que presentan una característica común observable. Ubicada en tiempo y espacio Muestra: Parte de la población, que mantiene las características de la misma. Solo debe diferir en el tamaño. Subconjunto.
Estadística Descriptiva Variable: Característica o propiedad de los elementos de la población, que podemos medir u observar y que difieren entre sí. Variable aleatoria Característica de los elementos de la población, cuyo valor no esta predeterminado, sino que es azarozo. Veremos después una definición más formal.
Estadística Descriptiva Tipos de variables Cuantitativas Discretas: Número de animales, cantidad de huevos Continuas: Peso corporal, altura, edad, presión arterial. Cualitativas o categóricas Nominales: Sexo, raza, sanos y enfermos Ordinales: Chico, mediano y grande Alto, mediano y bajo
Estadística Descriptiva Recolección de datos Censo: se recolecta la información de todos los individuos de la población Muestreo: se mide una parte de la población (subconjunto) Fuentes: Primaria o secundaria Depuración de datos
Estadística descriptiva Presentación de datos Tablas Simples (categorías o intervalos de clase) Doble entrada Maestras
Tabla Simple Tabla 1. Cantidad de alumnos en FCV, según año de la carrera. Tandil. 2010 año Frec. 1 320 2 240 3 190 4 180 5 170 Total 1100
Tabla Doble Entrada Tabla 2. Cantidad de alumnos en FCV, por genero, según año de la carrera. Tandil. 2010 año Mujeres Varones Total 1 120 200 320 2 100 140 240 3 90 100 190 4 70 110 180 5 50 120 170 Total 430 670 1100
Tabla Maestra Tabla 3. Cantidad de alumnos en FCV, por procedencia y genero, según año de la carrera. Tandil. 2010 Bs. As. Resto del País años Mujeres Varones Mujeres Varones Total 1 80 120 40 80 320 2 60 90 40 50 240 3 60 60 30 40 190 4 50 80 20 30 180 5 35 80 15 40 170 Total 285 430 145 240 1100
Ejemplo Un experiencia consistió en contar el número de crías por perra (n=50). Los valores resultantes del conteo fueron los siguientes: 10 8 6 3 9 7 5 4 6 9 8 10 7 9 10 6 8 6 3 2 4 3 2 7 5 5 4 3 7 6 6 7 8 8 6 7 7 7 9 8 5 3 2 1 4 3 0 6 6 8
Ejemplo Tabla 4. Distribución de frecuencias para la variable número de crías por perra, en el criadero Mascotas.com, en 2010. Nº de crías Frec. Frec. rel. Frec. acum. Frec. acum. rel. 0 1 0.02 1 0.02 1 1 0.02 2 0.04 2 3 0.06 5 0.10 3 6 0.12 11 0.22 4 4 0.08 15 0.30 5 4 0.08 19 0.38 6 9 0.18 28 0.56 7 8 0.16 36 0.72 8 7 0.14 43 0.86 9 4 0.08 47 0.94 10 3 0.06 50 1
Ejemplo Ganancias de peso de 46 terneros: 39.6 44.4 43.9 42.9 47.9 46.9 48.3 40.4 45.8 44.2 39.1 46.3 41.9 51.2 50.2 47.7 43.9 47.0 42.6 46.6 44.8 43.7 47.2 41.3 37.4 43.1 43.9 48.9 41.5 42.5 48.2 40.7 41.8 46.7 42.3 43.3 44.1 49.8 40.6 44.0 44.0 44.5 45.1 45.4 45.2 45.7 Identificamos el valor mínimo y el máximo Calculamos el rango rango Ap Ls Li 51.2 37.4 13.8 Dividimos por la cantidad de intervalos Ls Li 13.8 2.76 5 5
Intervalos x frec. frec.rel. (37.40-40.16) 38.78 (40.16-42.92) 41.54 (42.92-45.68) 44.30 (45.68-48.44) 47.06 (48.44-51.20) 49.82
Iintervalos x frec. frec.rel. (37.40-40.16) 38.78 3 0.07 (40.16-42.92) 41.54 11 0.24 (42.92-45.68) 44.30 16 0.35 (45.68-48.44) 47.06 12 0.26 (48.44-51.20) 49.82 4 0.09
0.37 frecuencias relativas 0.28 0.18 0.09 0.00 35 38 41 44 47 50 53 pesos
Iintervalos x frec. frec.rel. fa far fa far (37.40-40.16) 38.78 3 0.07 3 0.07 46 1 (40.16-42.92) 41.54 11 0.24 14 0.30 43 0.93 (42.92-45.68) 44.30 16 0.35 30 0.65 32 0.70 (45.68-48.44) 47.06 12 0.26 42 0.91 16 0.35 (48.44-51.20) 49.82 4 0.09 46 1 4 0.09
Estadística descriptiva Representación de datos Gráficos Cuantitativas Histograma Grafico de tallos y hojas Polígono de frecuencias Grafico de cajas Cualitativas Gráfico de barras Gráficos circulares
Histograma 10 9 8 7 Frecuencia 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 11 Edad
Polígono de frecuencia 10 9 8 7 Frecuencia 6 5 4 3 2 1 0 0 2 4 6 8 10 Años
Gráfico de Tallos y Hojas Stem Leaf # 9 0 1 8 0 1 7 000 3 6 000000 6 5 00000000000 11 4 000000000000000 15 3 0000000000 10 2 00000 5 1 000 3 ----+----+----+----+---+
Gráfico de caja Nº crías 10 9 8 7 6 4 3 2 1 0
Gráfico de Barras % 90 80 70 60 50 40 30 20 10 0 1er trim. 2do trim. 3er trim. 4to trim. Chicos Medianos Grandes
Gráfico de Circular Buenos Aires Tucuman Misiones Salta La Pampa
Estadística descriptiva Resumen de la información Cuantitativos Medidas de Tendencia Central (o posición) Medidas de Dispersión Cualitativos Razón Proporción Tasas Indices
M.T.C Las medidas de tendencia central son valores numéricos localizados en el centro del conjunto de datos y que los representan adecuadamente a los fines de análisis. Las medidas más utilizadas son la media, la mediana y la moda
M.T.C. Población= A 0.17 frecuencias relativas 0.13 0.09 0.04 0.00 0 25 50 75 100 125 150 175 200 Peso
M.T.C. Población= B 0.17 frecuencias relativas 0.13 0.09 0.04 0.00 0 25 50 75 100 125 150 175 200 Peso
M.T.C. Población= C 0.17 frecuencias relativas 0.13 0.09 0.04 0.00 0 25 50 75 100 125 150 175 200 Peso
M.T.C. Media Aritmética: La media aritmética es el promedio de todas las observaciones. x = n i x i n Ejemplo: Calcular la media aritmética para el siguiente conjunto de datos. 5 9 12 7 15 3 (5+9+12+7+15+3)/6 = 51/6 = 8.5 Por lo tanto, la media aritmética es: 8.5 x n i 1 f i n x i
M.T.C Moda: El valor que más se repite (puede no existir y si existe puede no ser única). Ejemplo: Se le preguntó a una muestra de 10 estudiantes por el número de hermanos que tiene. Sus respuestas fueron: 2, 1, 2, 0, 0, 1, 4, 5, 2, 3. La moda es 2 porque se repite tres veces. Interpretación: La mayoría de estudiantes tienen dos hermanos.
M.T.C Mediana: es el valor que se encuentra en el centro del conjunto de datos ordenados. Por lo tanto, el 50% de los datos son menores que la mediana. La mediana se utiliza cuando los datos presentan valores muy extremos. Cuando la media aritmética no es muy representativa del conjunto.
M.T.C Si n es impar la mediana es la observación que está en el lugar (n+1)/2: Md Si n es par: la mediana es el promedio de las observaciones n/2 y (n/2)+1: Md 2 X n1 2 2 X n X n 1 2
M.T.C Ejemplo: Encontrar la mediana para el siguiente conjunto de datos: 9 12 5 16 8 3 11 Primero se ordenan los datos: 3 5 8 9 11 12 16 Una vez ordenados, como el número de datos es impar (7), se busca el que tiene la posición (n+1)/2, o sea (7+1)/2 = 4. Este número es el 9 y representa la mediana.
M.T.C Ejemplo: Calcula la mediana para el siguiente conjunto de datos 8.3 5.7 9.2 3.9 7.4 11.8 10.6 4.3 Nuevamente se ordenan los datos 3.9 4.3 5.7 7.4 8.3 9.2 10.6 11.8 Una vez ordenados, como el número de datos es par (8), se busca el número que tiene la posición n/2 y el que tiene la posición (n/2)+1. En este caso 8/2 =4 y (8/2)+1 =5 Los números que tienen las posiciones cuarta y quinta son 7.4 y 8.3. Estos números se promedian y el resultado será la mediana:(7.4+8.3)/2 = 7.85.
M.T.C. Media Armónica Mh n i1 n Mh k 1 Xi i1 n fi 1 Xi Media Geométrica n MG n x n i. x2. x3... xn. i1 x i
Media Aritmética Propiedades La suma las desviaciones de cada valor de la variable respecto al promedio es cero suma de cuadrados mínima n i x i x 1 0 ) ( n i i n i i A x x x 1 2 1 2 ) ( ) (
Media Aritmética Propiedades Si a cada observación se le suma (o resta) un valor constante c, el promedio de la nueva variable será igual al promedio de los valores originales, más (o menos) la constante c. Sea x 1, x 2, x 3,..., x n un conjunto de observaciones de la variable X y c una constante, y la variable Y es tal que: Luego: Y y i n i1 x yi n c i X c
Media Aritmética Propiedades Si a cada observación x i se la multiplica (o divide) por una constante k la media aritmética de la nueva variable será igual al promedio original multiplicado (o dividido) por la constante k Sea x 1, x 2, x 3,..., x n un conjunto de observaciones de la variable X y k una constante, y la variable Y es tal que: y k * i x i Luego: Y n y i n n kx n k i1 i1 i1 i n x i n k X
Media Aritmética Propiedades Si x i = k para todo i, donde k es constante luego el promedio es k Sean X 1 y X 2 dos variables aleatorias y hacemos y i = x 1i + x 2i luego Y X 1 X 2
Medidas de Dispersión Son medidas que nos dicen qué tan dispersos se encuentran los datos con respecto a su media. VARIANCIA S 2 :La variancia) es el promedio de las desviaciones al cuadrado entre los datos y su media aritmética 2 2 i1 var( X ) ˆ S n ( x i x) n 1 2
Medidas de dispersión Desvio estandar S S 2 Amplitud ó Rango Rango= x máx -x mín Desvio medio i1. D M. n x x n 1
Medidas de Dispersión Coeficiente de Variabilidad S C. V. 100 x Covariancia cov( x, y) n x x y y i i i1 n 1
Error estandar e. e. S n 2 S n
Variancia Propiedades Var (x)0 Si k es constante, luego Var(k)=0 Var(kx)=k 2 Var(x) Var(k+x)=Var(x) Sean X e Y dos variables aleatorias, luego Var(x+y)=Var(x) + Var(y) + 2cov(x,y) Var(x-y)=Var(x) + Var(y) - 2cov(x,y)