Bioestadística Carrera de Enfermería - 2 Semestre 2013 1 1 Universidad de Atacama Facultad de Ingeniería Departamento de Matemática e-mail: david.elal@uda.cl
Contenidos 1 Introducción 2
Introducción Conceptos previos Qué es la Estadística? Estadística es la ciencia que trata de los métodos y medios para recopilar, organizar, presentar, analizar e interpretar datos estadísticos, así como de realizar inferencias a partir de ellos, con el propósito de ayudar a la toma de decisiones.
Introducción Conceptos previos Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.
Introducción Conceptos previos Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. Estadística Inferencial Apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.
Introducción Conceptos previos Ejemplo Por ejemplo un anuario informa que los accidentes en faenas mineras en chile, durante el año 2011, fueron de 21.567 mientras que en el año 2012 fueron de 25.469.
Introducción Conceptos previos Ejemplo Por ejemplo un anuario informa que los accidentes en faenas mineras en chile, durante el año 2011, fueron de 21.567 mientras que en el año 2012 fueron de 25.469. Observe que: podemos concluir que hubo un incremento de los accidentes, en dicho período, de un 18,09 %, este trabajo pertenece al campo de la estadística descriptiva.
Introducción Conceptos previos Ejemplo Por ejemplo un anuario informa que los accidentes en faenas mineras en chile, durante el año 2011, fueron de 21.567 mientras que en el año 2012 fueron de 25.469. Observe que: podemos concluir que hubo un incremento de los accidentes, en dicho período, de un 18,09 %, este trabajo pertenece al campo de la estadística descriptiva. Sin embargo: éste no sería el caso si se utilizaran los datos para predecir el número de accidente, por ejemplo, para el año 2014, situación que corresponde al campo de la estadística inferencial
Tablas de Frecuencia Distribución de la información El método mas común de resumir datos consiste en presentarlos en forma condensada en tablas o gráficas, y aquí la palabra clave es: Distribución de la información
Tablas de Frecuencia Tabla de Frecuencia Una tabla compuesta de filas y columnas donde todos los datos de la población en estudio se distribuyen según un criterio definido en las celdas generadas por la intersección de las filas y columnas se conoce con el nombre de Tabla de Frecuencia.
Tablas de Frecuencia Tabla de Frecuencia Una tabla compuesta de filas y columnas donde todos los datos de la población en estudio se distribuyen según un criterio definido en las celdas generadas por la intersección de las filas y columnas se conoce con el nombre de Tabla de Frecuencia. Ejemplo de Tablas de Frecuencia Mostraremos a continuación algunas tablas de frecuencias, a modo de ejemplo, e interpretaremos algunos datos ubicados en diferentes celdas de cada tabla.
Tablas de Frecuencia Tabla : Personas con ingreso menor que el mínimo. Edad (en años) Menores de 16 1.233 de 16 a 21 932 de 22 a 44 779 de 45 a 64 175 Número de personas (en miles) de 65 y mas 863 3.982
Tablas de Frecuencia Tabla : Accidentabilidad laboral. Año N de accidentes Accidentes Totales Itinere 2007 486.109 5.196 2008 671.004 5.933 2009 801.416 6.918 2010 821.458 7.339 2011 787.182 7.550 3.567.169 32.936
Tablas de Frecuencia Pregunta! En que porcentaje disminuyó el número de accidentes en el año 2011 respecto al año 2010?.
Tablas de Frecuencia Pregunta! En que porcentaje disminuyó el número de accidentes en el año 2011 respecto al año 2010?. Respuesta disminuyó en un 4.17 %
Tablas de Frecuencia Pregunta! En cuanto aumentó el número de accidentes Itinere el año 2011 respecto al año 2010?
Tablas de Frecuencia Pregunta! En cuanto aumentó el número de accidentes Itinere el año 2011 respecto al año 2010? Respuesta aumentó en un 2,87 %
Tablas de Frecuencia Pregunta! En cuanto varió el número de accidentes el año 2011 respecto al año 2009?
Tablas de Frecuencia Pregunta! En cuanto varió el número de accidentes el año 2011 respecto al año 2009? Respuesta disminuyó en un 1,78 %
Tablas de Frecuencia Tabla : Distribución de niños recién nacidos durante el primer semestre del año 2010, en una comuna X. Meses del año 2010 Enero 60 Febrero 72 Marzo 84 Abril 60 Mayo 108 frecuencia f Junio 96 480
Tablas de Frecuencia Distribución de personas según nivel de colesterol en la sangre Nivel de frecuencia Colesterol( mg 100ml ) f 80-119 13 120-159 150 160-199 442 200-239 299 240-279 115 280-319 34 320-359 9 360-399 5 1067
Clasificación de los Datos o Información Tipo de Datos 1 Datos Cualitativos 1. Nominal 2. Ordinal 2 Datos Cuantitativo 1. Discreto 2. Continuo
Clasificación de los Datos o Información Datos Cualitativo Nominal Cuando los datos representan una cualidad como por ejemplo: El grupo sanguíneo dado por: A, B, AB, y 0. representa información cualitativa nominal (lo nominal se debe a que no se puede establecer un orden entre las diferentes clasificación del grupo sanguíneo).
Clasificación de los Datos o Información Datos Cualitativo Nominal Cuando los datos representan una cualidad como por ejemplo: El grupo sanguíneo dado por: A, B, AB, y 0. representa información cualitativa nominal (lo nominal se debe a que no se puede establecer un orden entre las diferentes clasificación del grupo sanguíneo). Así, entonces: La variable grupo sanguíneo es cualitativa nominal
Clasificación de los Datos o Información Datos Cualitativo Ordinal Un conjunto de datos cualitativos ordinal, a diferencia del caso cualitativo nominal, se pueden ordenar ya sea de mayor a menor o viceversa. Por ejemplo: Si estudiamos el grado de recuperación de un paciente al aplicarle un tratamiento, podemos tener como información lo siguiente: Nada, Poco, Moderado, Bueno y Muy Bueno.
Clasificación de los Datos o Información Datos Cualitativo Ordinal Un conjunto de datos cualitativos ordinal, a diferencia del caso cualitativo nominal, se pueden ordenar ya sea de mayor a menor o viceversa. Por ejemplo: Si estudiamos el grado de recuperación de un paciente al aplicarle un tratamiento, podemos tener como información lo siguiente: Nada, Poco, Moderado, Bueno y Muy Bueno. Así, entonces: La variable grado de recuperación de un paciente es cualitativa ordinal
Clasificación de los Datos o Información Datos Cuantitativo Discreto Cuando los datos representan una cantidad (valor numérico) estamos frente a información cuantitativa. Los datos cuantitativos serán discretos cuando siempre un valor intermedio entre dos cualesquiera de ellos tiene una interpretación coherente. Por ejemplo: El número de hijos: representa información cuantitativa pero un valor entre 2 hijos y 3 hijos, por ejemplo 2,5 hijos, no tiene interpretación lógica, por lo que la variable número de hijos cae en el caso discreto. En general el caso discreto se presenta cuando contamos el número de veces que ocurre un fenómeno.
Clasificación de los Datos o Información Datos Cuantitativo Discreto Cuando los datos representan una cantidad (valor numérico) estamos frente a información cuantitativa. Los datos cuantitativos serán discretos cuando siempre un valor intermedio entre dos cualesquiera de ellos tiene una interpretación coherente. Por ejemplo: El número de hijos: representa información cuantitativa pero un valor entre 2 hijos y 3 hijos, por ejemplo 2,5 hijos, no tiene interpretación lógica, por lo que la variable número de hijos cae en el caso discreto. En general el caso discreto se presenta cuando contamos el número de veces que ocurre un fenómeno. Así, entonces: La variable: número de hijos es cuantitativa discreta
Clasificación de los Datos o Información Datos Cuantitativo Continuo Un conjunto de datos cuantitativo continuo, a diferencia del caso cuantitativo discreto, se reconoce cuando un valor intermedio entre dos cualesquiera de ellos tiene una interpretación coherente. Por ejemplo: Si consideramos el peso de un niño al nacer, entonces cualquier valor, por ejemplo, entre 3 kilos y 4 kilos tiene sentido interpretativo
Clasificación de los Datos o Información Datos Cuantitativo Continuo Un conjunto de datos cuantitativo continuo, a diferencia del caso cuantitativo discreto, se reconoce cuando un valor intermedio entre dos cualesquiera de ellos tiene una interpretación coherente. Por ejemplo: Si consideramos el peso de un niño al nacer, entonces cualquier valor, por ejemplo, entre 3 kilos y 4 kilos tiene sentido interpretativo Así, entonces: La variable peso de un niño al nacer es cuantitativa continua
Tipos de Gráficos Representación Gráfica Hemos visto como un conjunto de datos se puede distribuir en una tabla de frecuencias perdiéndose la precisión de ellos, sin embargo, nos convencimos lo provechoso que resulta tabular la información concluyendo que vale la pena perder esta precisión para ganar en interpretación. Los datos distribuidos en una tabla de frecuencias pueden ser acompañados de gráficos o pictogramas para que de un sólo vistazo darnos cuenta de las características de la información.
Tipos de Gráficos Representación Gráfica Hemos visto como un conjunto de datos se puede distribuir en una tabla de frecuencias perdiéndose la precisión de ellos, sin embargo, nos convencimos lo provechoso que resulta tabular la información concluyendo que vale la pena perder esta precisión para ganar en interpretación. Los datos distribuidos en una tabla de frecuencias pueden ser acompañados de gráficos o pictogramas para que de un sólo vistazo darnos cuenta de las características de la información. Gráfico de Barras, Gráfico de Sectores y Pictogramas Los gráficos mas usuales para representar el comportamiento de variables son los: diagramas de barras, diagrama de sectores y pictogramas.
Tipos de Gráficos Ejemplo de gráficos: Recordemos la siguiente Tabla de distribución con el agregado de una nueva columna conocida como frecuencia relativa que denotamos por la letra h y que está representada en porcentaje. Tabla : Niños recién nacidos 1er semestre del 2010 Meses del frecuencia frecuencia relativa año 2010 f h( %) Enero 60 Febrero 72 Marzo 84 Abril 60 Mayo 108 Junio 96 480
Tipos de Gráficos Ejemplo de gráficos: Recordemos la siguiente Tabla de distribución con el agregado de una nueva columna conocida como frecuencia relativa que denotamos por la letra h y que está representada en porcentaje. Tabla : Niños recién nacidos 1er semestre del 2010 Meses del frecuencia frecuencia relativa año 2010 f h( %) Enero 60 12,5 Febrero 72 15 Marzo 84 17,5 Abril 60 12,5 Mayo 108 22,5 Junio 96 20 480
Tipos de Gráficos Ejemplo de Gráficos Observe que la variable que considera los meses enero, febrero, marzo, abril, mayo y junio, corresponde a una variable Cualitativa Ordinal.
Tipos de Gráficos Ejemplo de Gráficos Observe que la variable que considera los meses enero, febrero, marzo, abril, mayo y junio, corresponde a una variable Cualitativa Ordinal. Gráfico de Barra Un gráfico de barras para esta tabla de frecuencias sería:
Tipos de Gráficos Gráfica de Barra
Tipos de Gráficos Ejemplo de Gráficos de Torta o Circular En el siguiente gráfico la variable toma los valores: Soltero, Casado, Viudo y Separado. Por lo que se trata entonces de una variable Cualitativa Nominal.
Tipos de Gráficos Gráfica de Torta
Tipos de Gráficos Un gráfico de Barras para el caso de un variable Cuantitativa Discreta usando doble barra sería, por ejemplo:
Tipos de Gráficos Gráfica de Barra
Tipos de Gráficos Un Pictograma es un tipo de gráfico que en lugar de barras utilizan figuras proporcionales a la frecuencia. A continuación veremos algunos ejemplos:
Tipos de Gráficos Pictograma
Tipos de Gráficos Pictograma
Construcción de Tablas de Frecuencias Construcción de una tabla de frecuencias Hasta ahora hemos conocido, analizado y discutido las ventajas de una tabla de de frecuencias y además las hemos acompañado de gráficos para ayudar a una mejor comprensión del comportamiento de la información. Pero la pregunta que surge es Cómo se construye una Tabla de Frecuencia?.
Construcción de Tablas de Frecuencias Construcción de una tabla de frecuencias Hasta ahora hemos conocido, analizado y discutido las ventajas de una tabla de de frecuencias y además las hemos acompañado de gráficos para ayudar a una mejor comprensión del comportamiento de la información. Pero la pregunta que surge es Cómo se construye una Tabla de Frecuencia?. Construcción de una tabla de frecuencias En respuesta a lo anterior haremos el ejercicio de enfrentarnos a un conjunto de datos, analizarlo, tabularlo y sacar el mejor provecho interpretativo posible de ellos. Aprovecharemos además de ir definiendo nuevos conceptos y conocer nuevos tipos de gráficos:
Construcción de Tablas de Frecuencias Los datos que a continuación se presentan corresponden a los sueldos de 120 empleados (expresado en miles) de una empresa X. 1170 1207 1581 1277 1305 1472 1077 1319 1537 1849 1332 1418 1949 1403 1744 1532 1219 896 1500 1671 1471 1399 1041 1379 821 1558 1118 1533 1510 1760 1826 1309 1426 1288 1394 1545 1032 1289 695 803 1440 1421 1329 1407 718 1457 1449 1455 2051 1677 1119 1020 1400 1442 1593 1962 1263 1788 1501 1668 1352 1340 1459 1823 1451 1138 1592 982 1981 1091 1428 1603 1699 1237 1325 1590 1142 1425 1550 913 1470 1783 1618 1431 1557 896 1662 1591 1551 1612 1249 1419 2162 1373 1542 1631 1567 1221 1972 1714 949 1539 1634 1637 1649 1607 1640 1739 1540 2187 1752 1648 1978 640 1736 1222 1790 1188 2091 1829
Construcción de Tablas de Frecuencias Construcción de una tabla de frecuencias Claramente estamos bajo el estudio de una variable Cuantitativa Continua por tratarse de sueldo que tiene valor interpretativo hasta el centavo, es decir, entre dos sueldos siempre va tener un valor interpretativo un sueldo intermedio entre ellos.
Construcción de Tablas de Frecuencias Recomendaciones Nos proponemos elaborar una tabla de frecuencia y sacar de ella el máximo de información, pero para ello, debemos tener presente los siguientes consideraciones: 1 Seleccionar el número apropiado de clases o intervalo 2 Obtener la amplitud de cada clase o intervalo. 3 Establecer los límites de cada clase o intervalo para evitar los traslapes y asi impedir que un dato pueda ser clasificado en dos o mas clases.
Construcción de Tablas de Frecuencias Cálculo del número de intervalos Si N representa el número de intervalos a encontrar, entonces la regla de Sturges propone calcularlo así: N = 1 + 3, 3 log n donde n es el número total de datos.
Construcción de Tablas de Frecuencias En nuestro caso n = 120 luego: N = 1 + 3, 3 log120 = 1 + 3, 3 2, 0792 = 7, 86 8 Así el número de intervalos (o clases) es N = 8.
Construcción de Tablas de Frecuencias Amplitud o Rango
Construcción de Tablas de Frecuencias Amplitud de cada intervalo La amplitud total resulta ser de 1547 y debe dividirse por el número de intervalos que es 8, por lo que la longitud de cada intervalo sería de: 1547 8 = 193, 375
Construcción de Tablas de Frecuencias Amplitud de cada intervalo Si la amplitud de cada intervalo 193,375 lo encontramos FEO y quisiéramos que fuera de 194. Entonces en vez de la longitud 1547 deberíamos extenderla a 1552, es decir agregarle 5 unidades. Para lograr esto último,y recurriendo a una conducta de equidad, restamos dos unidades al dato menor y sumamos dos unidades al dato mayor y decidimos en forma aleatoria ubicar la quinta unidad, es decir, restar al dato menor o sumar al datos mayor (puede ser mediante el lanzamiento de una moneda).
Construcción de Tablas de Frecuencias Amplitud de cada intervalo Si la amplitud de cada intervalo 193,375 lo encontramos FEO y quisiéramos que fuera de 194. Entonces en vez de la longitud 1547 deberíamos extenderla a 1552, es decir agregarle 5 unidades. Para lograr esto último,y recurriendo a una conducta de equidad, restamos dos unidades al dato menor y sumamos dos unidades al dato mayor y decidimos en forma aleatoria ubicar la quinta unidad, es decir, restar al dato menor o sumar al datos mayor (puede ser mediante el lanzamiento de una moneda). Amplitud de cada intervalo Suponga que el sorteo indicó restar al dato menor, entonces el nuevo dato menor es 637 y el nuevo dato mayor es 2189.
Construcción de Tablas de Frecuencias Intervalos frecuencia - (f) 637 831 831 1025 1025 1219 1219 1413 1413 1607 1607 1801 1801 1995 1995 2189
Construcción de Tablas de Frecuencias Intervalos frecuencia - (f) 637 831 5 831 1025 6 1025 1219 11 1219 1413 24 1413 1607 38 1607 1801 23 1801 1995 9 1995 2189 4
Histogramas, Polígonos y Ojiva Histograma
Histogramas, Polígonos y Ojiva Histograma y Polígono de Frecuencia
Histogramas, Polígonos y Ojiva Intervalos frecuencia frecuencia - (f) relativa (h %) 637-831 5 831-1025 6 1025-1219 11 1219-1413 24 1413-1607 38 1607-1801 23 1801-1995 9 1995-2189 4 120
Histogramas, Polígonos y Ojiva Intervalos frecuencia frecuencia - (f) relativa (h %) 637-831 5 4,2 831-1025 6 5 1025-1219 11 9,1 1219-1413 24 20 1413-1607 38 31,7 1607-1801 23 19,2 1801-1995 9 7,5 1995-2189 4 3,3 120 100
Histogramas, Polígonos y Ojiva Histograma Relativo y Polígono de Frecuencia Relativo
Histogramas, Polígonos y Ojiva Intervalos frecuencia frecuencia frecuencia - (f) relativa (h %) acumulada(f) 637-831 5 4,2 831-1025 6 5 1025-1219 11 9,1 1219-1413 24 20 1413-1607 38 31,7 1607-1801 23 19,2 1801-1995 9 7,5 1995-2189 4 3,3 120 100
Histogramas, Polígonos y Ojiva Intervalos frecuencia frecuencia frecuencia - (f) relativa (h %) acumulada(f) 637-831 5 4,2 5 831-1025 6 5 11 1025-1219 11 9,1 22 1219-1413 24 20 46 1413-1607 38 31,7 84 1607-1801 23 19,2 107 1801-1995 9 7,5 116 1995-2189 4 3,3 120 120 100
Histogramas, Polígonos y Ojiva Intervalos frec. frec. frec. frec. acum. - (f) rel.(h %) acum.(f) relativa (H %) 637-831 5 4,2 5 831-1025 6 5 11 1025-1219 11 9,1 22 1219-1413 24 20 46 1413-1607 38 31,7 84 1607-1801 23 19,2 107 1801-1995 9 7,5 116 1995-2189 4 3,3 120 120 100
Histogramas, Polígonos y Ojiva Intervalos frec. frec. frec. frec. acum. - (f) rel.(h %) acum.(f) relativa (H %) 637-831 5 4,2 5 4,2 831-1025 6 5 11 9,2 1025-1219 11 9,1 22 18,3 1219-1413 24 20 46 38,3 1413-1607 38 31,7 84 70 1607-1801 23 19,2 107 89,2 1801-1995 9 7,5 116 96,7 1995-2189 4 3,3 120 100 120 100
Histogramas, Polígonos y Ojiva Ojiva o Histograma Acumulado
Cálculo de Percentiles Definición de percentil Dado un conjunto de datos perteneciente a una población y suponiendo ordenada de menor a mayor, se define el percentil(k), y se denota por P k a aquel valor que deja a su izquierda el k % de los datos y a su derecha (100-k) %
Cálculo de Percentiles Resuelva el siguiente ejercicio 1 Encuentre P 70 de los datos correspondientes a los sueldos de los 120 ejecutivos de la empresa X (con solo observar la ojiva porcentual) 2 Encuentre P 80 y P 50 de los datos correspondientes a los sueldos de los 120 ejecutivos de la empresa X, utilizando la siguiente fórmula: ( ) k 100 n F a a P k = liminf + f
Cálculo de Percentiles Explicación de la fórmula de cálculo de percentil En primer lugar, para poder usar la fórmula de cálculo del percentil, debemos identificar el intervalo donde se encuentra el percentil pedido, por ejemplo si se nos pide el percentil 80, es decir, P 80 debemos seguir los siguientes pasos:
Cálculo de Percentiles Explicación de la fórmula de cálculo de percentil 1 Calcular el 80 % de los datos, es decir,:
Cálculo de Percentiles Explicación de la fórmula de cálculo de percentil 1 Calcular el 80 % de los datos, es decir,: 80 100 n = 80 120 = 96 100
Cálculo de Percentiles Explicación de la fórmula de cálculo de percentil 1 Calcular el 80 % de los datos, es decir,: 80 100 n = 80 120 = 96 100 2 Ahora se considera la columna de la frecuencia acumulada (F) y se recorre de arriba hacia abajo hasta llegar a la celda que supere al número 96. Que resulta ser el número:
Cálculo de Percentiles Explicación de la fórmula de cálculo de percentil 1 Calcular el 80 % de los datos, es decir,: 80 100 n = 80 120 = 96 100 2 Ahora se considera la columna de la frecuencia acumulada (F) y se recorre de arriba hacia abajo hasta llegar a la celda que supere al número 96. Que resulta ser el número: 107
Cálculo de Percentiles Explicación de la fórmula de cálculo de percentil 1 Calcular el 80 % de los datos, es decir,: 80 100 n = 80 120 = 96 100 2 Ahora se considera la columna de la frecuencia acumulada (F) y se recorre de arriba hacia abajo hasta llegar a la celda que supere al número 96. Que resulta ser el número: 107 3 De la celda, encontrada en el punto anterior, se recorre hacia la izquierda hasta llegar al intervalo buscado, que resulta ser:
Cálculo de Percentiles Explicación de la fórmula de cálculo de percentil 1 Calcular el 80 % de los datos, es decir,: 80 100 n = 80 120 = 96 100 2 Ahora se considera la columna de la frecuencia acumulada (F) y se recorre de arriba hacia abajo hasta llegar a la celda que supere o sea igual al número 96. Que resulta ser el número: 107 3 De la celda, encontrada en el punto anterior, se recorre hacia la izquierda hasta llegar al intervalo buscado, que resulta ser: [1607 1801[
Cálculo de Percentiles Explicación de la fórmula de cálculo de percentil Conocido el intervalo [1607 1801[, donde se encuentra el P 80, podemos identificar mejor los elementos que aparecen en la fórmula, es decir, en:
Cálculo de Percentiles Explicación de la fórmula de cálculo de percentil ( 80 100 P 80 = liminf + 120 F a ) a f donde: i) liminf = límite inferior del intervalo [1607 1801[ = 1607 ii) f = frecuencia del intervalo [1607 1801[ = 23 iii) a = amplitud del intervalo [1607 1801[ = 194 iv) Fa = Frecuencia acumulada hasta antes del intervalo [1607 1801[ = 84
Cálculo de Percentiles Explicación de la fórmula de cálculo de percentil Así el percentil 80 sería: P 80 = 1607 + ( 80 100 120 84) 194 23 = 1607 + 2328 23 = 1607 + 101,28 = 1708,28
Cálculo de Percentiles Explicación de la fórmula de cálculo de percentil Así el percentil 80 sería: P 80 = 1607 + ( 80 100 120 84) 194 23 = 1607 + 2328 23 = 1607 + 101,28 = 1708,28 Desafío Queda como desafío encontrar: 1 la mediana= P 50 y 2 el percentil 70 = P 70
Cálculo de Percentiles Definición de Rango intercuartil Se define el Rango intercuartil como el ancho del intervalo entre el primer y el tercer cuartil
Cálculo de Percentiles Definición de Rango intercuartil Se define el Rango intercuartil como el ancho del intervalo entre el primer y el tercer cuartil Definición de Rango intercuartil Se define el primer cuartil como el percentil 25 y el tercer cuartil como el percentil 75, de tal modo que el Rango intercuartil está dado por: Rango Intercuartil = P 75 P 25
Cálculo de Percentiles Ejercicio de Rango intercuartil Como ejercicio encuentre el Rango intercuartil de los sueldos de los 120 empleados.
Población y Muestra Definición de Parámetro y Muestra Si un conjunto de datos consta de todas las observaciones posibles de un cierto fenómeno, se denomina Población; si un conjunto de datos consta de solamente una parte de estas observaciones se llama Muestra
Parámetro y Estadístico Definición de Parámetro y Estadístico Intimamente relacionado con los conceptos de población y muestra está el de Parámetro y Estadístico
Parámetro y Estadístico Definición de Parámetro y Estadístico Intimamente relacionado con los conceptos de población y muestra está el de Parámetro y Estadístico Definición de Parámetro Un Parámetro es una medición numérica que describe alguna característica de una población
Parámetro y Estadístico Definición de Parámetro y Estadístico Intimamente relacionado con los conceptos de población y muestra está el de Parámetro y Estadístico Definición de Parámetro Un Parámetro es una medición numérica que describe alguna característica de una población Definición de Estadístico Cuando la medición numérica describe alguna característica de una muestra de la población el parámetro toma el nombre de Estadístico
Parámetro y Estadístico Gráfico
Parámetro y Estadístico Ejemplo de Parámetro Una encuesta aplicada a la cadena de empresas ABC entregó la siguiente información: Del total de accidentes ocurridos durante el año 2012; 86 resultaron fatales. Si definimos un indicador que mida la gravedad de los accidentes podríamos pensar en la expresión: IL = N de Fallecidos Total de Accidentes 100000 donde: IL = 86 100000 = 162, 39 53.576 En tal caso tenemos que IL es un parámetro
Medidas de Tendencia Central El promedio Sean x 1, x 2, x 3,..., x n n datos reales, se define el promedio de los n datos, y se denota por X, como X = xi n
Medidas de Tendencia Central El promedio Considere el siguiente conjunto de datos: x 1 = 2, x 2 = 6, x 3 = 4, x 4 = 2, x 5 = 2 x 6 = 3, x 7 = 4, x 8 = 3, x 9 = 2, x 10 = 4 X = xi n = x 1 + x 2 + x 3 +... + x 10 10 = 2 + 6 + 4 +... + 4 10 = 32 10 = 3, 2
Medidas de Tendencia Central Cálculo del promedio con datos tabulados Tabla de frecuencia para cálculo del promedio x f fx 2 4 8 3 2 6 4 3 12 6 1 6 10 32
Medidas de Tendencia Central Cálculo del promedio con datos tabulados Tabla de frecuencia para cálculo del promedio x f fx 2 4 8 3 2 6 4 3 12 6 1 6 10 32 X = fx f = 32 10 = 3, 2
Medidas de Tendencia Central Promedio Ponderado Sean x 1, x 2, x 3,..., x n n datos reales, se define el promedio ponderado de los n datos, y se denota por X p, como donde p i = 1 X p = x i p i
Medidas de Tendencia Central Ejemplo de Promedio Poderado Un estudiante tiene las siguientes cuatro calificaciones en la asignatura de Estadística 63, 39, 40 y un 50 en la escala de 1 a 100 y la nota de aprobación es un 50. La importancia de los tópicos contemplado en cada prueba son distintos y el profesor, consciente de esto, tiene la duda en elegir entre tres alternativas de ponderación que se ilustran en la siguiente tabla:
Medidas de Tendencia Central Ejemplo de Promedio Ponderado Notas Alternativa1 Alternativa2 Alternativa3 63 0, 25 0, 2 0, 3 39 0, 25 0, 3 0, 2 40 0, 25 0, 2 0, 2 50 0, 25 0, 3 0, 3 1 1 1 Bajo la alternativa 1, se tiene que: xi p i = x 1 p 1 + x 2 p 2 + x 3 p 3 + x 4 p 4 = 63 0, 25 + 39 0, 25 + 40 0, 25 + 50 0, 25 = 48
Medidas de Tendencia Central Ejemplo de Promedio Ponderado Notas Alternativa1 Alternativa2 Alternativa3 63 0, 25 0, 2 0, 3 39 0, 25 0, 3 0, 2 40 0, 25 0, 2 0, 2 50 0, 25 0, 3 0, 3 1 1 1 Bajo la alternativa 2, se tiene que: xi p i = x 1 p 1 + x 2 p 2 + x 3 p 3 + x 4 p 4 = 63 0, 2 + 39 0, 3 + 40 0, 2 + 50 0, 3 = 47
Medidas de Tendencia Central Ejemplo de Promedio Ponderado Notas Alternativa1 Alternativa2 Alternativa3 63 0, 25 0, 2 0, 3 39 0, 25 0, 3 0, 2 40 0, 25 0, 2 0, 2 50 0, 25 0, 3 0, 3 1 1 1 Bajo la alternativa 3, se tiene que: xi p i = x 1 p 1 + x 2 p 2 + x 3 p 3 + x 4 p 4 = 63 0, 3 + 39 0, 2 + 40 0, 2 + 50 0, 3 = 50
Medidas de Tendencia Central Ejemplo de Promedio Ponderado Estrechamente relacionado con el promedio está el importante parámetro que se denomina desviación estándar. Aunque no es una medida de tendencia central lo veremos a continuación de un modo superficial dado el grado de acercamiento mencionado, sin embargo, lo veremos con mucho detalle cuando abordemos, mas adelante, las medidas de variabilidad.
Medidas de Tendencia Central Introducción a la Desviación Estándar Sean x 1, x 2, x 3,..., x n n datos reales, se define la varianza de los n datos, y se denota por S 2 X, como S 2 X = (xi X) 2 n
Medidas de Tendencia Central Introducción a la Desviación Estándar Sean x 1, x 2, x 3,..., x n n datos reales, se define la varianza de los n datos, y se denota por S 2 X, como S 2 X = (xi X) 2 n Introducción a la Desviación Estándar Se define la desviación estándar de los n datos, y se denota por S X, como la raíz cuadrada de la varianza, es decir S X = SX 2
Medidas de Tendencia Central Propiedades de la Varianza 1 Sean x 1, x 2, x 3,..., x n n datos reales, entonces: SX 2 = X 2 X 2.
Medidas de Tendencia Central Propiedades de la Varianza 1 Sean x 1, x 2, x 3,..., x n n datos reales, entonces: SX 2 = X 2 X 2. 2 Si x 1 = k, x 2 = k, x 3 = k,..., x n = k, k R entonces X = k y SX 2 = 0
Medidas de Tendencia Central Ejercicio de cálculo de la Desviación Estándar Considere el siguiente conjunto de datos: x 1 = 2, x 2 = 6, x 3 = 4, x 4 = 2, x 5 = 2 x 6 = 3, x 7 = 4, x 8 = 3, x 9 = 2, x 10 = 4 y para el cálculo de la varianza apliquemos la propiedad: SX 2 = X 2 X 2.
Medidas de Tendencia Central Ejercicio de cálculo de la Desviación Estándar Primeramente calculemos X y luego la elevamos al cuadrado: X = xi n = x 1 + x 2 + x 3 +... + x 10 10 = 2 + 6 + 4 +... + 4 10 = 32 10 = 3, 2
Medidas de Tendencia Central Ejercicio de cálculo de la Desviación Estándar Primeramente calculemos X y luego la elevamos al cuadrado: X = xi n = x 1 + x 2 + x 3 +... + x 10 10 = 2 + 6 + 4 +... + 4 10 = 32 10 = 3, 2 luego: X 2 = 10, 24
Medidas de Tendencia Central Ejercicio de cálculo de la Desviación Estándar Calculemos ahora X 2 para ello debemos elevar cada dato al cuadrado y luego calcular su promedio: x 2 1 = 4, x 2 2 = 36, x 2 3 = 16, x 2 4 = 4, x 2 5 = 4 x 2 6 = 9, x 2 7 = 16, x 2 8 = 9, x 2 9 = 4, x 2 10 = 16
Medidas de Tendencia Central Ejercicio de cálculo de la Desviación Estándar X 2 = x 2 i n = x 1 2 + x 2 2 + x 3 2 +... + x 10 2 10 4 + 36 + 16 +... + 16 = 10 = 118 10 = 11, 8
Medidas de Tendencia Central Ejercicio de cálculo de la Desviación Estándar y se tiene entonces que: SX 2 = X 2 X 2 = 11, 8 10, 24 = 1, 56
Medidas de Tendencia Central Ejercicio de cálculo de la Desviación Estándar y se tiene entonces que: S 2 X = X 2 X 2 = 11, 8 10, 24 = 1, 56 y la desviación estándar es: S X = SX 2 = 1, 56 1, 25
Medidas de Tendencia Central Ejercicio de cálculo de la Desviación Estándar con datos tabulados Recordemos los datos anteriores para calcular la desviación estándar,aprovechando el hecho de que muchos de ellos se repiten y lo podemos presentar en una tabla de frecuencia. x 1 = 2, x 2 = 6, x 3 = 4, x 4 = 2, x 5 = 2 x 6 = 3, x 7 = 4, x 8 = 3, x 9 = 2, x 10 = 4
Medidas de Tendencia Central Ejercicio de cálculo de la Desviación Estándar con datos tabulados Tabla de frecuencia para cálculo de la desviación estándar x f fx x 2 fx 2 2 4 3 2 4 3 6 1-10
Medidas de Tendencia Central Ejercicio de cálculo de la Desviación Estándar con datos tabulados La tabla de frecuencia es la siguiente: Tabla de frecuencia para cálculo de la desviación estándar x f fx x 2 fx 2 2 4 8 4 16 3 2 6 9 18 4 3 12 16 48 6 1 6 36 36-10 32-118
Medidas de Tendencia Central Ejercicio de cálculo de la Desviación Estándar con datos tabulados S 2 = X 2 X 2 fx 2 = f = 118 10 ( ) fx 2 f ( ) 32 2 10 = 11, 8 3, 2 2 = 11, 8 10, 24 = 1, 56 por lo que: S = 1, 56 1, 25
Medidas de Tendencia Central Mediana La mediana de un conjunto de datos es aquel valor (no necesariamente pertenece al conjunto de los datos) que una vez ordenada la información se ubica de tal manera que deja a su izquierda el 50 % de los datos y el otro 50 % a su derecha.
Medidas de Tendencia Central Mediana La mediana de un conjunto de datos es aquel valor (no necesariamente pertenece al conjunto de los datos) que una vez ordenada la información se ubica de tal manera que deja a su izquierda el 50 % de los datos y el otro 50 % a su derecha. Mediana Ya conocemos la Mediana y la hemos calculado cuando los datos son continuos y están tabulados usando la fórmula: ( 50 100 P 50 = liminf + n F a ) a f Sin embargo, ahora veremos como se encuentra la Mediana con datos continuos discretos.
Medidas de Tendencia Central Criterios para encontrar la Mediana en datos continuos discretos Una vez ordenado los datos (menor a mayor o viceversa), distinguiremos dos casos para el cálculo de la mediana: 1 Cuando el número de datos es impar (n impar), la mediana, es el dato que está en el centro. 2 Cuando el número de datos es par (n par), la mediana, es el valor que toma el promedio de los dos datos centrales
Medidas de Tendencia Central Ejercicio de cálculo de la Mediana El número de accidentes, de la empresa Royal & Anderson, en los primeros 5 meses del año 2011 fueron respectivamente: 12, 8, 15, 9, 12.
Medidas de Tendencia Central Ejercicio de cálculo de la Mediana El número de accidentes, de la empresa Royal & Anderson, en los primeros 5 meses del año 2011 fueron respectivamente: Ejercicio de cálculo de la Mediana 12, 8, 15, 9, 12. La mediana no es 15, ya que previamente se debe ordenar la muestra (de menor a mayor o de mayor a menor). Si se considera como criterio ordenarlo de menor a mayor se tiene:
Medidas de Tendencia Central Ejercicio de cálculo de la Mediana El número de accidentes, de la empresa Royal & Anderson, en los primeros 5 meses del año 2011 fueron respectivamente: Ejercicio de cálculo de la Mediana 12, 8, 15, 9, 12. La mediana no es 15, ya que previamente se debe ordenar la muestra (de menor a mayor o de mayor a menor). Si se considera como criterio ordenarlo de menor a mayor se tiene: Ejercicio de cálculo de la Mediana 8 9 12 12 15
Medidas de Tendencia Central Ejercicio de cálculo de la Mediana 8 9 12 12 15
Medidas de Tendencia Central Ejercicio de cálculo de la Mediana 8 9 12 12 15 y se puede apreciar que la mediana es 12.
Medidas de Tendencia Central Ejercicio de cálculo de la Mediana A continuación se muestra una tabla con información mas completa que la dada en el ejemplo anterior, considerando el número total de accidentes por mes, del año 2011, de la empresa Royal & Anderson, sobre la cual calcularemos la Mediana. Distribución del número de accidentes de la empresa Royal & Anderson, durante el año 2011 Ene Feb Mar Abr May Jun 12 8 15 9 12 16 Jul Ago Sep Oct Nov Dic 10 9 7 8 15 17
Medidas de Tendencia Central Ejercicio de cálculo de la Mediana al ordenar la información se tiene que: 7 8 8 9 9 10 12 12 15 15 16 17 donde se observa que 10 y 12 son los datos centrales y así la mediana sería 10 + 12 Mediana = = 11 2
Medidas de Tendencia Central Cálculo de Cuartiles Si representamos los cuartiles por Q 1, Q 2, y Q 3. y para comprender mejor el concepto ordenamos la información ( de menor a mayor) e imaginemos que se disponen en la siguiente recta:..
Medidas de Tendencia Central Ejercicio de cálculo de la Mediana