Probabilidad y Estadística Fundamental Tarea # 2 Tema: Medidas descriptivas de resumen Docente: Pablo Emilio Berdugo Camacho Estudiantes: Carlos David Argote Heredia Edison Días Doza Johana Zuñiga Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería 19/09/2015
1) En la siguiente tabla se muestra cual medida de tendencia central se usó para cada una de las variables y el resultado de tal medida. Variable Técnico Rating Porcentaje Medida de Tendencia Central Moda Moda Mediana Completamente Resultado 2 Satisfecho Tabla 1.1 Medidas de tendencia central para cada variable En las variables Técnico y Rating se usó la moda por ser variables de carácter categórico, mientras que en la variable porcentaje se usó la mediana dado que la variable presenta un comportamiento asimétrico y con valores extremos que tergiversan a medidas como la media. De la anterior gráfica podemos concluir que el Técnico 2 tuvo la mayor frecuencia, igualmente la opción Completamente Satisfecho, referente a la variable rating, fue la de mayor frecuencia. 37,3 25,00% 20,00% 15,00% 10,00% 5,00% 0,00% Variable Porcentaje Tabla 1.2 Gráfico de variable Porcentaje que muestra la mediana. La mediana para la variable porcentaje representa en donde se acumulan el 50% de los datos, en este caso en 37,3%, de los cuales el primer 50% de los datos se distribuye en un menor número de valores como se muestra en la tabla 1.2. 2) Haciendo uso de los cuantíales adecuados responda las siguientes preguntas. Tec.1 Tec.2 Tec.3 Tec.4 Q1 20,18 22,23 20,60 18,10 Q3 53,95 63,55 41,93 45,00 Tabla 2. Cuartil 1 y 3 de la variable Porcentaje discriminada por Técnico. a) El mayor porcentaje para el 25% será el Q 1, comparándolos obtenemos que el Tec.2 tiene el mayor porcentaje en el primer 25%. b) El menor porcentaje para la tercera parte será el Q 3, comparándolos obtenemos que el Tec.3 tiene el menor porcentaje para la tercera parte.
Percentage 3) Diagramas de caja, dispersión y asimetría. a) No hay valores atípicos ya que lo ƒ min y ƒ max son respectivamente -27,875 y 98,725 y los valores mínimos y máximos son respectivamente 1,3 y 93,0. Además de lo anterior podemos inferir del Box-Plot que después del Q 3 los datos se vuelven asimétricos tendiendo estos a valores extremos en la derecha, sin embargo antes del Q 3 los valores son relativamente simétricos. Q1 = 19,6 Q2 = 35,3 Q3 = 51,25 Min = 1,3 Max = 93 0,0 20,0 40,0 60,0 80,0 100,0 Tabla 3.1 Box-Plot de la Variable Porcentaje. b) En el box plot discriminado por técnico se puede observar que la mediana en las cuatro graficas fluctúa entre 30 y 40 %, es decir que en los cuatro casos el 50% de los servicios no alcanzaron el 40% en porcentaje. Presenta 4 valores atípicos, 3 en la gráfica para el Tec.3 y 1 en la gráfica Tec.4 que representan un alto costo del producto al cual se le hizo la revisión respecto a los demás productos de la muestra. Estos valores atípicos se observaron ya que los ƒ min y ƒ max son respectivamente (-30,49;-39,76;-11,39;-22,25) y (104,61; 125,53; 73,91; 85,35) y en el caso de los 2 últimos son menores a los máximos los valores del técnico 3 y 4, así los valores que los pase serán atípicos
100 90 80 70 60 50 40 30 20 10 0 84,7 87,2 84,4 75,7 Tec.1 Tec.2 Tec.3 Tec.4 Tabla 3.2 Box-Plot de Var. Porcentaje discriminado por Técnico. c) A continuación se presenta la tabla en donde se ordenan de menor a mayor las variables técnico en cuanto al grado de dispersión de la variable porcentaje. Desviación estándar tec.3 18,575 tec.4 18,819 tec.1 20,163 tec.2 24,701 Tabla 3.3 Grado de desviación de la Var. Porcentaje Estas desviaciones están calculadas respecto a la media de la variable Porcentaje discrimina por técnico. En la tabla 3.2 podemos observar que el grafico de la variable técnico 2 es la más dispersa en un mayor número de valores Entre la variable técnico 3 y 4 se observa una diferencia mínima respecto a dispersión si las comparamos con las otras dos variables. d) Cof. Asimetría CS 0,295071831 NS -0,839647999 MS -0,031865892 Tabla 3.4 Grado de asimetría Este coeficiente de asimetría está calculado para el variable porcentaje discriminado por nivel de satisfacción (CS: Completamente Satisfecho, NS: No Satisfecho, MS: Medianamente Satisfecho), como se muestra en la tabla 3.5, al ser mayor a 0 indica que hay una tendencia de mayor número de valores hacia la derecha de la mediana jalada por los valores extremos. En los otros dos casos el coeficiente es menor a 0 lo que indica una tendencia de mayor número de valores a la izquierda de la mediana.
25,00% 20,00% 15,00% 10,00% 5,00% 0,00% Percentage discriminado por CS Percentage Tabla 3.5 Porcentaje discriminado por Rating.