Clase 1 Módulo: Minería de datos Docente: Gustavo Valencia Zapata

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Clase 1 Módulo: Minería de datos Docente: Gustavo Valencia Zapata"

Transcripción

1 v.1.0 Clase 1

2 Temas Clase 1: Conceptos Estadísticos para Minería de Datos Tipos de variables La distribución normal Conceptos básicos Estadística descriptiva Referencias

3 Conceptos básicos Conceptos básicos El principal objetivo de la estadística es producir información útil y de interés a partir de hechos numéricos. Para alcanzar este objetivo se recomienda prestar atención a básicamente tres cosas [7]: 1. Producir datos de calidad 2. Organizar y analizar estos datos 3. Obtener conclusiones a partir de estos datos Las conclusiones basadas en datos, sea que se obtengan de manera formal o informal, tienen una componente de incertidumbre ya que siempre habrá variabilidad en los datos.

4 Conceptos básicos Los datos varían. Fenómenos naturales, el Hombre, Los animales, las cosas, medidas repetidas hechas sobre un mismo ente varían. Si la variabilidad no existiera viviríamos en el mundo de lo constante, nada nos sorprendería ni el pasado o el futuro, todo sería igual y la estadística difícilmente sería la misma; que pensar de aquellas disciplinas modernas que dependen de la estadística como la minería de datos, visualización de información o la inteligencia de Negocios. La estadística propone métodos para enfrentar situaciones donde la variabilidad y la incertidumbre están presentes. Con estos métodos se puede analizar datos a fin de separar y evidenciar la presencia de patrones sistemáticos de la siempre presente variabilidad Antes de que los hechos numéricos se usen para bien o para mal se deben producir datos. Los datos pueden estar disponibles o se pueden obtener vía experimental o por observación.

5 Conceptos básicos Ejemplos: Disponible: Registros médicos de un Hospital Observación: Contar el número de vehículos que obvian un semáforo en rojo en una calle determinada. (Proceso pasivo) Experimental: Comparar la efectividad de dos o más medicamentos. (Proceso activo) Para realizar un estudio estadístico se requieren datos, que pueden comprender a toda la Población de referencia (Censo), o solo a una parte de ella (Muestra).

6 Conceptos básicos Población: Conjunto de todos los elementos que comparten un grupo común de características, y forman el universo para el propósito del problema de investigación. La población objetivo es la Población particular en que estamos interesados y sobre el cual se desea obtener algunas conclusiones por medio de métodos estadísticos Muestra: Es un subconjunto representativo de la población a partir del cual se pretende realizar inferencias respecto a la población de donde proceden. Es más práctico y ventajoso tomar muestras ya que optimiza los recursos disponibles. Unidad Estadística: Es el elemento o unidad base de la población o de la muestra. Cualquier miembro de la Población. Parámetro: Es cualquier valor característico de la población (valores verdadero), también llamados medidas numéricas que describen características esenciales en una población de interés. Variable: Es una característica de un individuo en la población o en la muestra cuya medida puede cambiar de valor.

7 Conceptos básicos Inferencia Estadística: Es una parte de la estadística cuya finalidad es obtener conclusiones respecto a la población a partir de datos observados en muestras. Ejemplo: El ministerio de transporte de un país, ha recibido continuas quejas de usuarios denunciando usurara en las tarifas del galón de combustible en estaciones de gasolina. A la fecha existen estaciones de gasolina en el país, por lo que el ministerio decide seleccionar al azar 200 estaciones y registrar el precio del galón de gasolina el mismo día para ser comparado con la tarifa oficial. Describa: Población, Variable, Muestra y proceso de Inferencia

8 Conceptos básicos Solución: Población: Las estaciones de gasolina es la Población de interés. Variable: El precio del galón de gasolina es la Variable de interés. Muestra: Las 200 estaciones auditadas son la muestra de la Población. Proceso de inferencia: La inferencia en este caso podría ser la generalización de la información de los precios en las estaciones de gasolina de la muestra. En particular el ministerio de transporte desea conocer la magnitud del problema de usura presente en la Población. Se propone calcular el promedio del valor galón y compararlo con la tarifa oficial.

9 Tipos de variables Tipos de Variables Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.

10 Tipos de variables Los datos que se recopilan como producto de un proceso de experimentación aleatoria pueden tener una amplia variedad de formas. Dependiendo del tipo de datos, la estadística proporciona una técnica adecuada para su estudio. Un conjunto de datos posee una serie de características de interés que pueden ser visualizadas ya sea en forma numérica o en forma gráfica. Las variables más comunes en estadística se dividen en Discretas, Continuas y Categóricas Discretas: Son aquellas variables cuyo rango de valores es finito o contable. Por ejemplo, el número de accidentes en una intersección en un determinado mes. El numero de hijos según los diferentes estratos socioeconómicos. Surgen de procesos que involucran conteos.

11 Tipos de variables Continuas: Son aquellas variables cuyo rango de valores es infinito. Es decir, que tiene tantos valores como puntos hay en un segmento rectilíneo. Por ejemplo, nivel de presión sanguínea, edad, peso, temperatura, etc. Surgen de procesos que involucran mediciones. Cualitativas(Categóricas): Sus valores consisten en una serie de clasificaciones. Por D Según la escala de medición, las más comunes son: Nominal: Los niveles no tienen un orden natural. Por ejemplo, afiliación religiosa (Católico, Testigo de Jehová, Protestante. No se puede determinar cual va primero). Género (Femenino, Masculino). Estado civil (Soltero, Casado, Unión libre). Color (Rojo, blanco, verde) Ordinal: Los niveles tienen algún orden, pero no es posible medir la distancia entre las categorías. Por ejemplo, Estrato socio económico, tamaño de un automóvil, Satisfacción (Poco, moderado, muy satisfecho)

12 Tipos de variables Intervalo: Tiene distancias numéricas entre dos niveles cualquiera de la escala. Por ejemplo, Ingreso (<200000, entre y , más de ). Se usa para mediciones de naturaleza cuantitativa que se hacen con escalas que tienen como base un valor de cero arbitrario. Por ejemplo un registro de 0 no indica la ausencia de temperatura. Razón: Se usa para mediciones de naturaleza cuantitativa que se hacen con escalas que tienen como base un valor de cero absoluto. Por ejemplo, longitud del brazo, estatura, tiempo de duración, número de artículos defectuosos en una línea de producción, presión sanguínea. Las variables continuas y discretas pertenecen a esta escala Si el peso de persona se mide en gramos, kilos o libras, esta constituye una medida cuantitativa, pero si se mide como bajo, medio o alto es cualitativa.

13 Estadística descriptiva La Estadística Descriptiva utiliza métodos numéricos y gráficos a fin de buscar patrones, resumir y presentar la información contenida en un conjunto de datos Medidas de Centralidad Medidas de Centralidad: Media Aritméticas para datos simples: Denota el promedio de un conjunto de datos. Se calcula dividiendo la suma del conjunto de datos entre el total de ellos.

14 Moda para datos simples: Es el valor de la variable que tiene mayor frecuencia absoluta, la que más se repite es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo. Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia siendo esta máxima. Mediana para datos simples: Es el valor que divide al conjunto de datos ordenados, en aproximadamente dos partes: 50% de valores son inferiores y otro 50% son superiores

15 Ejemplo: Considere los siguientes datos ordenados asociados a la edad de un club de lectura. 22, 33, 35, 44, 47, 49, 55, 56, 67, 68, 70, 75 Como es par, entonces la mediana es: Medidas de Dispersión La Varianza: Es una medida de dispersión de la información. Se obtiene como el promedio de los cuadrados de las desviaciones de los valores de la variable respecto de su media aritmética. Desviación Estándar: Conocida también como desviación típica, es una medida de dispersión que se obtiene como la raíz cuadrada de la varianza. Mide cuanto se separan los datos. Módulo: Visualización de Información

16 Ejemplo: Altura de perros Un club de amigos de los perros decidió medir la altura de sus mascotas (altura a la cruz), para identificar las diferencias entre cada raza en esta variable. Fuente: Gustavo Valencia Z. Notas de clase: Visualización de Información, 2012.

17 ALTURA DE PERROS ID Perro Altura_cruz (cm) P1 Gran Danés 76 P2 Bóxer 59 P3 Pinscher Alemán 49 P4 Bulldog Inglés 32 P5 Bull Terrier 30 P6 Schnauzer Miniatura 37 P7 Poodle 39 P8 Pinscher Miniatura 22

18 Es decir que la altura media a la cruz de los 8 perros es de 43 cm. Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.

19 Visualización de datos Para calcular la varianza, se debe identificar la diferencia con respecto a la media para cada perro. Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.

20 Visualización de datos La desviación estándar sería: Lo útil de la desviación estándar es que es más intuitiva. Se puede identificar que alturas están a una distancia menor que la desviación estándar de la media. Usando la desviación estándar tenemos una forma de saber lo normal referente a la altura. Podríamos concluir que el Galgo Inglés tiene una altura muy grande y el Pinscher Miniatura una muy pequeña, es decir, el Galgo Inglés y el Pinscher Miniatura no tienen una altura a la cruz estándar.

21 Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.

22 Tablas de frecuencia La distribución de frecuencia es un método para organizar y resumir grandes volúmenes de información. Suele ser útil para la VI al momento de construir graficas. El caso de variables Discretas y Nominales Ejemplo Quinto grado: El tutor de un grupo de quinto año escolar, desea visualizar la información de sus alumnos referida a la EDAD y GENERO. En total el grupo está conformado por 30 estudiantes entre los 8 y 11 años de edad.

23 Variable Discreta: EDAD Frecuencia Porcentaje Porcentaje válido Porcentaje acumulado Válidos ,0 10,0 10, ,3 43,3 53, ,0 40,0 93, ,7 6,7 100,0 Total ,0 100,0 Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.

24 Variable Nominal: GENERO Frecuenci a Porcentaje Porcentaje válido Porcentaje acumulado Válidos F 19 63,3 63,3 63,3 M 11 36,7 36,7 100,0 Total ,0 100,0 Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.

25 Se debe tener presente que para cualquier tipo de variare es fundamental que las contrario la tabla de frecuencia carecería de utilidad. El caso de variables Continuas En estos casos se recomienda agrupar los datos bajo el siguiente método: El número de clases se puede calcular con alguna de las siguientes formulas: La primera es llamada formula de Sturges.

26 Pasos: 1. Determinar el rango (diferencia entre el valor máximo y mínimo). 2. Valores extremos Si los datos son enteros, reste 0.5 al mínimo y súmele 0.5 al máximo Si los datos tienen una cifra decimal reste 0.05 al mínimo y súmele 0.05 al máximo 3. De esta manera de acuerdo al número de cifras decimales 4. Calcule nuevamente el rango (rango ampliado) 5. Calcule el número de clases con alguna de las formulas mencionadas 6. Calcule la amplitud de la siguiente forma:

27 6. Al nuevo mínimo se le suma la amplitud () para generar la primera clase (utilice intervalo semiabierto a derecha); luego al extremo superior de esa primera clase súmele la amplitud y de esta manera obtendrá la segunda clase. Repita este procedimiento hasta llegar a los grupos. 7. Ubique a cada individuo o elemento en las respectivas clases. Ejemplo Quinto grado: Sobre el mismo grupo de alumnos, el tutor quiere visualizar la información referida al PESO. Quinto Grado Peso en Kg

28 Tablas de frecuencia Procedimiento: Paso 1 Paso 2 y 3 Paso 4 Paso 5

29 Tablas de frecuencia Paso 6 Finalmente la tabla de frecuencia sería: Quinto Grado Peso en Kg. GRUPO_PESO ALUMNOS [20.55, 24.68) 4 [24.68, 28.81) 5 [28.81, 32.94) 3 [32.94, 37.07) 9 [37.07, 41.21) 5 [41.21, 45.34) 4

30 Tablas de frecuencia Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.

31 Tablas de contingencia (Cross Tables) Cuando en las unidades muéstrales se observan múltiples características registradas como variables cualitativas, la información puede resumirse usando una tabla de contingencia. Por ejemplo, una tabla 2X2 o de doble entrada luciría de la siguiente manera: Enfermedad Coronaria Fumador Si No Total Si No Total

32 Recordemos el caso relacionada al tipo de sangre estudiado en la actividad al inicio del modulo de VI. En este caso es una tabla 2X4 Tabla de contingencia GENERO * GRUPO_EDAD Recuento GRUPO_EDAD Total GENERO Hombre Mujer Total El uso de tablas de contingencias es el corazón del análisis estadístico de datos cualitativos [8] y es utilizado ampliamente en pruebas estadística son paramétricas [9]

33 Tablas de contingencia (Cross Tables) Cuando en las unidades muéstrales se observan múltiples características registradas como variables cualitativas, la información puede resumirse usando una tabla de contingencia. Por ejemplo, una tabla 2X2 o de doble entrada luciría de la siguiente manera: Enfermedad Coronaria Fumador Si No Total Si No Total

34 Distribución Normal Función de densidad de probabilidad Normal (continuos y discretos) Cuando en las unidades muéstrales se observan múltiples características registradas como variables cualitativas, la información puede resumirse usando una tabla de contingencia. Esta distribución juega un papel clave en el desarrollo de la inferencia estadística, pues muchas de las herramientas usadas en la toma de decisiones o en las pruebas de hipótesis, tienen su fundamento en esta distribución. Un gran número de estudios pueden ser aproximados usando una distribución normal. Algunas variables físicas, datos meteorológicos (temperatura, precipitaciones, presión atmosférica, etc.), mediciones en organismos vivos, notas o puntajes en pruebas de admisión o de aptitud, errores en instrumentación, proporciones de errores en diversos procesos, etc.

35 Esta distribución es absolutamente simétrica alrededor de su media. Variación de la distribución normal en función de la media Variación de la distribución normal en función de la desviación estándar Fuente: Portal Biomédico., 2010.

36 Retomando el ejemplo de los niños de quinto grado, nos podríamos pregunta si su distribución en relación a las variables peso y edad se comportan como una distribución normal. Un primer paso es construir un histograma para cada una de estas variables. Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.

37 Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, Podríamos decir que estas variables se distribuyen normalmente?

38 Retomando nuevamente la definición y conceptos teóricos de la función de densidad de probabilidad Normal, podríamos enunciar de una forma más formal: Sea X una variable aleatoria continua. Se dice que X se distribuye como una normal con parámetros y (estos parámetros determinan el centro y la dispersión de la distribución y la caracterizan completamente), lo cual se escribe, si X tiene función densidad de probabilidad dada por, Por medio del cálculo se puede probar que realmente esta función es función de densidad de probabilidad. Además, es simétrica alrededor de. Tiene forma acampanada, el área bajo la curva (considerando todo el dominio de la v.a) siempre es igual a 1.

39 Si X es una v.a. normal con parámetros y, la probabilidad de que se calcula así: Para calcular probabilidades relacionadas con la normal se hace necesario utilizar tablas estándar de normalidad. Esto es porque las integrales que surgen en este tipo de problemas son extremadamente difíciles de resolver. Afortunadamente, cualquier variable aleatoria normal se puede transformar en una normal con media = 0 y varianza = 1; esto se logra por medio de la siguiente transformación.

40 Suponga que X es una variable aleatoria normal con parámetros y. La variable aleatoria Z, se define como: Pero Es equivalente la probabilidad original a la obtenida con esta transformación? La respuesta es afirmativa, ya que, Una variable aleatoria X que se transforme de esta manera se dice que es una variable aleatoria estandarizada. Una vez una variable este estandarizada ya no es necesario resolver la integral ya que sus valores están tabulados.

41 Ejemplo: La resistencia a la comprensión de una serie de muestras de cemento puede modelarse por medio de una distribución normal con una resistencia media de 6000 kg y una desviación estándar de 100 kg por centímetro cuadrado Cuál es la probabilidad de que la resistencia de una muestra sea inferior a 6200 kg por centímetro cuadrado? Solución Sea X: Resistencia a la compresión de una muestra de cemento. Por la información del problema se sabe que. La probabilidad pedida es, Entonces, P X De esta forma se estandariza.

42 La distribución normal cumple la siguiente regla: El intervalo contiene aproximadamente el 68.2% de las mediciones. El intervalo 2 contiene aproximadamente el 95.4% de las mediciones. El intervalo 3 contiene algo más del 99.7% de las mediciones. Fuente: Juan C. Salazar. Elementos de probabilidad y estadística. Notas de clase. Universidad Nacional de Colombia. Sede Medellín, 2010.

43 El Diagrama Boxplot En 1977, John Tukey publicó un método eficiente para mostrar cinco números representativos o resumen de un conjunto de datos cuantitativos. La gráfica fue llamada Boxplot (Diagrama de caja y bigotes), la cual resume los siguientes elemento o medidas estadísticas. Mediana Percentiles de interés (25%, 50% y 75%) Máximo Mínimo Valores extremos El Boxplot representa la distribución de una variable continua, donde por medio de los cinco valores, se representan los conceptos de: Tendencia Central Dispersión Simetría Este gráfico es ideal para representar una desviación de la distribución normal.

44 Este gráfico es ideal para representar una desviación de la distribución normal. Mientras más grande es la caja y los bigotes, más dispersa es la distribución de los datos La distancia entre las medidas puede variar, pero no la cantidad de elementos, ya que entre una y la otra es aproximadamente la misma. La línea de la mediana indica la simetría. El Boxplot es también considerado un método gráfico para la detección de Outlier (valores extremos) y es muy utilizado en minería de datos en la etapa de exploración de datos para detectar valores que posiblemente sean influyentes para determinar la calidad de un modelo. Por otra parte existen técnicas estadísticas especializadas en la detección de estos registros influyentes, donde algunas emplean el análisis delos errores para dicho fin.

45 Los Outlier son valores extremos que se encuentran cerca de los límites del rango de datos o van en contra de la tendencia de los datos restantes. La identificación de valores atípicos es importante, ya que pueden obedecer a errores asociados al parámetro de calidad de los datos. Además, incluso si un Outlier es un valor valido, ciertos métodos estadísticos son sensibles a la presencia de valores atípicos y pueden ofrecer resultados inestables o disminuir en su poder predictivo. [10]

46 Boxplot para la variable Peso. Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.

47 Boxplot para la variable Edad. Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.

48 Boxplot y distribución normal Fuente:

49 Evaluación del supuesto de normalidad. Cuando se está en presencia de una muestra aleatoria, es ciertamente importante determinar si proviene o no de una población la cual se distribuye normalmente. Existen pruebas gráficas y estadísticas para determinar si un conjunto de n datos sobre una variable provienen o no de una distribución normal. Método gráfico: Q-Q Plot o gráfico de normalidad. Este método compara los valores empíricos (o muestrales) de los cuartiles con los valores reales (o teóricos) de los cuartiles de una normal. Si los datos provienen de una distribución normal, el gráfico de los cuartiles empíricos contra los reales lucirá como una línea recta. Si los datos se distribuyen normalmente los puntos en el gráfico caen de manera muy aproximada sobre una línea recta con intercepto µ y pendiente.

50 Fuente: Juan C. Salazar. Elementos de probabilidad y estadística. Notas de clase. Universidad Nacional de Colombia. Sede Medellín, 2010.

51 Prueba de Normalidad Shapiro-Wilk (No Paramétrica) Para probar normalidad univariada este test es el que más se recomienda. Es de resaltar que este test no pertenece a la familia de tests de Kolmogorov. Si solo se dispone de tablas para comparar este estadístico, se recomienda su uso cuando el tamaño maestral es menor o igual a 50 aunque los paquetes estadísticos actuales están en capacidad de calcularlo para muestras más grandes. El alcance de este curso no abordará el cálculo analítico de esta prueba de normalidad, sin embargo, en el texto de Conover de estadística No Paramétrica se encuentra en detalle el desarrollo analítico. Las hipótesis de esta prueba son: H0 (hipótesis nula): F(x) es una función de distribución normal, con media y varianza no especificadas. H1 (hipótesis alternativa): F(x) no es normal.

52 Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, Para la variable EDAD rechazo H0 y para PESO no se puede rechazar H0

53 Desde R es posible calcular el estadístico y valor p dela prueba Shapiro Wilk. > EDAD=c(9,10,9,10,9,9,10,10,9,9,10,9,8,10,9,10,11, + 9,10,11,9,10,9,9,9,8,10,10,8,10) > shapiro.test(edad) Shapiro-Wilk normality test data: EDAD W = 0.86, p-value = > PESO=c(33.1,35.4,36.6,45.3,37.0,38.7,23.5,34.6,44.5, ,35.0,36.2,27.3,28.6,39.9,36.9,38.7,21.4,42.0,30.4,25.3) > shapiro.test(peso) Shapiro-Wilk normality test data: PESO W = , p-value =

54 Índice de Asimetría La asimetría de una distribución hace referencia al grado en que los datos se reparten por encima (derecha) y por debajo (izquierda) de la tendencia central Índice de Curtosis La Curtosis hace referencia al grado de apuntamiento de la distribución.

55 Podríamos mencionar que si el valor del índice de Asimetría es 0±0.5, se habla de una posible distribución normal aunque es indispensable apoyarse en otras verificaciones. Si el valor del índice de Curtosis es 0±0.5, se dice que los datos están muy bien distribuidos. Se pudiera pensar que si la media, mediana y moda de una variable presentaran valores muy similares, se dice que los datos se distribuyen normalmente.

56 Diagrama de Dispersión Tipo de Variable Cuantitativa Discretas Continuas Cualitativa Nominales Ordinales Muestra en un eje cartesiano (xy) la relación que existe entre dos variables. Utilizados para ilustrar y comparar valores numéricos, como datos científicos, estadísticos y de ingeniería, entre otros. Nos informa del grado de correlación entre las dos variables: Muestra si el incremento o disminución de los valores de una de las variables (independiente), representada normalmente en el eje x, altera de alguna manera los valores de la otra variable (dependiente), representada generalmente en el eje y. Visualmente se puede interpretar la correlación entre dos variables, según la forma de la nube de puntos Módulo: Visualización de Información

57 Correlación nula: No existe ninguna relación entre las variables. Se dice que ambas son independientes. Correlación no lineal: Existe una relación entre las variables pero no es lineal. Fuente: Instituto Nacional de Estadística. España,2012. Correlación lineal: Existe una relación lineal negativa si al aumentar los valores de la variable independiente disminuyen los valores de la variable dependiente y relación lineal positiva si al aumentar los valores de la variable independiente aumentan los valores de la variable dependiente.

58 Tipos de Gráficos Fuente: Gustavo Valencia Z. Notas de clase: Visualización de Información, Actividad: Volumen del huevo. Los diagramas de dispersión simple (bidimensionales) suelen ser muy útiles para identificar visualmente la calidad un modelo comparando el valor conocido con el valor estimado.

59 Tipos de Gráficos Las matrices de dispersión proporcionan un método simple de presentar las relaciones entre pares de variables. Consiste en una matriz donde cada entrada presenta un grafico de dispersión sencillo. Un inconveniente es que si tenemos muchas variables el tamaño de cada entrada se reduce demasiado impidiendo ver con claridad las relaciones entre los pares de variables. Normalmente es empleado en la etapa de exploración cuando se desea identificar el tipo de correlación existente entre variables de tipo cuantitativo. Suele ser un paso inicial obligatorio al momento de la construcción de un modelo de regresión lineal.

60 Tipos de Gráficos Fuente: Gustavo Valencia Z. Notas de clase: Visualización de Información, Actividad: Volumen del huevo.

61 Tipos de Gráficos Correlación Trata de establecer la relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional. Se mide de -1 a 1. Correlación de Pearson. Mide la fuerza (intensidad) y dirección de una asociación lineal entre dos variables x y y. Correlación de Spearman. Mide la fuerza (intensidad) y dirección de una asociación monótona entre x y y. Por asociación monótona se entiende un incremento en x lleva a un incremento (o decremento) en y, pero este no es necesariamente lineal [7].

62 Tipos de Gráficos Correlación Spearman es robusto a la presencia de outliers, mientras que Pearson no lo es. Spearman es apropiado para datos ordinales y para datos agrupados en intervalos que no satisfacen el supuesto de normalidad. Pearson es ideal para variables continuas normales. Fuente: Gustavo Valencia Z. Notas de clase: Visualización de Información, Actividad: Volumen del huevo.

63 Tipos de Gráficos Fuente: Gustavo Valencia Z. Notas de clase: Visualización de Información, Actividad: Volumen del huevo.

64 Tipos de Gráficos Graficos Q-Q y Boxplot para el Volumen del huevo predicho. Fuente: Gustavo Valencia Z. Notas de clase: Visualización de Información, Actividad: Volumen del huevo.

65 Tipos de Gráficos Tarea Consultar una aplicación de la minería de datos en la industrio o la investigación académica. La fuente de información debe poseer un carácter formal (investigativo), es decir, debe ser un artículo publicado en algún journal. 2. Realice un análisis de datos asociados a ventas de detergente. Utilice la herramienta que esté a su alcance y las técnicas que comúnmente emplea en situaciones similares (tablas, gráficos, entre otros). Encuentre más detalles de esta actividad en el archivo Tarea 001 Análisis exploratorio

66 Referencias [7] Juan C. Salazar., Elementos de probabilidad y estadística. Notas de clase. Universidad Nacional de Colombia. Sede Medellín. [8] Alan Agresti. Categorical Data. Universidad Nacional de Colombia. Wiley, [9] W. J. Conover. Practical Nonparametric Statistic. Wiley, [10] Daniel T. Larose, Discovering Knowledge in Data: An Introduction to Data Mining. John Wiley & Son, 2005

ÁREAS DE LA ESTADÍSTICA

ÁREAS DE LA ESTADÍSTICA QUÉ ES LA ESTADÍSTICA? Es el arte de realizar inferencias y sacar conclusiones a partir de datos imperfectos. ÁREAS DE LA ESTADÍSTICA Diseño: Planeamiento y desarrollo de investigaciones Descripción: Resumen

Más detalles

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz Análisis de datos y gestión n veterinaria Tema 1 Estadística descriptiva Prof. Dr. José Manuel Perea Muñoz Departamento de Producción Animal Facultad de Veterinaria Universidad de Córdoba Córdoba, de Septiembre

Más detalles

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 Preg. 1. Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol en sangre de una serie de individuos, utilizamos

Más detalles

Estadística Inferencial. Estadística Descriptiva

Estadística Inferencial. Estadística Descriptiva INTRODUCCIÓN Estadística: Ciencia que trata sobre la teoría y aplicación de métodos para coleccionar, representar, resumir y analizar datos, así como realizar inferencias a partir de ellos. Recogida y

Más detalles

3 ANALISIS DESCRIPTIVO DE LOS DATOS

3 ANALISIS DESCRIPTIVO DE LOS DATOS 3 ANALISIS DESCRIPTIVO DE LOS DATOS 3.1 La tabulación de los datos 3.1.1 Tabla de distribución de frecuencias. 3.1.2 El histograma. 3.2 Medidas de tendencia central 3.2.1 La media. 3.2.2 La mediana. 3.2.3

Más detalles

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1 Bioestadística Tema 2: Estadísticos Tema 2: Estadísticos 1 Parámetros y estadísticos Parámetro: Es una cantidad numérica calculada sobre una población La altura media de los individuos de un país La idea

Más detalles

Tema 1: Análisis de datos univariantes

Tema 1: Análisis de datos univariantes Tema 1: Análisis de datos univariantes 1 En este tema: Conceptos fundamentales: muestra y población, variables estadísticas. Variables cualitativas o cuantitativas discretas: Distribución de frecuencias

Más detalles

Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental

Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental Universidad de Puerto Rico Recinto de Aguadilla Programa CeCiMat Elemental Definición de conceptos fundamentales de la Estadística y la Probabilidad y su aportación al mundo moderno Dr. Richard Mercado

Más detalles

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:

Más detalles

Fase 2. Estudio de mercado: ESTADÍSTICA

Fase 2. Estudio de mercado: ESTADÍSTICA 1. CONCEPTO DE ESTADÍSTICA. ESTADÍSTICA DESCRIPTIVA 2. 3. TABLA DE FRECUENCIAS 4. REPRESENTACIONES GRÁFICAS 5. TIPOS DE MEDIDAS: A. MEDIDAS DE POSICIÓN B. MEDIDAS DE DISPERSIÓN C. MEDIDAS DE FORMA 1 1.

Más detalles

Tema 3: Estadística Descriptiva

Tema 3: Estadística Descriptiva Tema 3: Estadística Descriptiva Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 3: Estadística Descriptiva Curso 2008-2009 1 / 27 Índice

Más detalles

Distribución normal estándar. Juan José Hernández Ocaña

Distribución normal estándar. Juan José Hernández Ocaña Distribución normal estándar Juan José Hernández Ocaña Tipos de variables jujo386@hotmail.com Tipos de variables Cualitativas Son las variables que expresan distintas cualidades, características o modalidades.

Más detalles

PROBABILIDAD. Unidad I Ordenamiento de la Información

PROBABILIDAD. Unidad I Ordenamiento de la Información 1 PROBABILIDAD Unidad I Ordenamiento de la Información 2 Captura de datos muestrales Conceptos básicos de la estadística 3 Población (o universo): Totalidad de elementos o cosas bajo consideración Muestra:

Más detalles

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill. GLOSARIO ESTADÍSTICO Fuente: Murray R. Spiegel, Estadística, McGraw Hill. CONCEPTOS Y DEFINICIONES ESPECIALES Es el estudio científico de los métodos para recoger, organizar, resumir y analizar los datos

Más detalles

Estadística Descriptiva

Estadística Descriptiva Nociones de Probabilidades y Estadística Estadística Descriptiva Luis A. Salomón Departamento de Ciencias Matemáticas Escuela de Ciencias, EAFIT Luis A. Salomón (EAFIT) Inspira Crea Transforma Curso 2016

Más detalles

Estadística Descriptiva

Estadística Descriptiva Estadística Descriptiva 1 Qué veremos 1. OBJECTIVOS DEL CURSO. DEFINICIONES IMPORTANTES 2. TIPOS DE VARIABLES 3 5 1. Estadísticos de tendencia central 2. Estadísticos de posición 3. Estadísticos de variabilidad/dispersión

Más detalles

ANÁLISIS DE DATOS. L.A. y M.C.E. Emma Linda Diez Knoth

ANÁLISIS DE DATOS. L.A. y M.C.E. Emma Linda Diez Knoth ANÁLISIS DE DATOS 1 Tipos de Análisis en función de la Naturaleza de los Datos Datos cuantitativos Datos cualitativos Análisis cuantitativos Análisis cuantitativos de datos cuantitativos (Estadística)

Más detalles

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables

Más detalles

Módulo de Estadística

Módulo de Estadística Módulo de Estadística Tema 2: Estadística descriptiva Tema 2: Estadísticos 1 Medidas La finalidad de las medidas de posición o tendencia central (centralización) es encontrar unos valores que sinteticen

Más detalles

Y accedemos al cuadro de diálogo Descriptivos

Y accedemos al cuadro de diálogo Descriptivos SPSS: DESCRIPTIVOS PROCEDIMIENTO DE ANÁLISIS INICIAL DE DATOS: DESCRIPTIVOS A diferencia con el procedimiento Frecuencias, que contiene opciones para describir tanto variables categóricas como cuantitativas

Más detalles

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- Estadística variable unidimensional 1. Conceptos de Estadística 2. Distribución de frecuencias 2.1. Tablas de valores con variables continuas 3. Parámetros

Más detalles

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Jesús Fernández Fernández Carmen María Sordo García DEPARTAMENTO DE MATEMÁTICA APLICADA Y CIENCIAS DE LA COMPUTACIÓN UNIVERSIDAD DE CANTABRIA

Más detalles

Repaso Estadística Descriptiva

Repaso Estadística Descriptiva Grado en Fisioterapia, 2010/11 Cátedra de Bioestadística Universidad de Extremadura 13 de octubre de 2010 Índice Descriptiva de una variable 1 Descriptiva de una variable 2 Índice Descriptiva de una variable

Más detalles

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2011

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2011 NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2011 CÓMO CARACTERIZAR UNA SERIE DE DATOS? POSICIÓN- dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos CENTRALIZACIÓN-

Más detalles

Unidad I: Descripción y gráficos estadísticos

Unidad I: Descripción y gráficos estadísticos Unidad I: Descripción y gráficos estadísticos A. Objetivo General: Proporcionar los conceptos y métodos necesarios de la Estadística para que el estudiante pueda organizar y resumir datos a partir de una

Más detalles

ESTADÍSTICA UNIDIMENSIONAL

ESTADÍSTICA UNIDIMENSIONAL ESTADÍSTICA UNIDIMENSIONAL DEFINICIÓN DE VARIABLE Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población. TIPOS DE VARIABLE ESTADÍSTICAS Ø Variable

Más detalles

x i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x

x i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas Datos no agrupados: x 1, x 2,...,x n x= x 1 +x 2 +... x n n n i=1 = n Ejemplo: dados los valores: X = 1, 4, 16, 11, 3, 6, su media es

Más detalles

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA Definición de Estadística: La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer

Más detalles

Estadística. Análisis de datos.

Estadística. Análisis de datos. Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un

Más detalles

Módulo de Estadística

Módulo de Estadística Módulo de Estadística Tema 1: Introducción a la Estadística Tema 1: Introdución 1 -ÍNDICE Introducción Estadística descriptiva Estadística descriptiva bivariante y regresión lineal. Probabilidad Módelos

Más detalles

SEMINARIO 2. Introducción a la presentación de resultados científicos

SEMINARIO 2. Introducción a la presentación de resultados científicos SEMINARIO 2 Introducción a la presentación de resultados científicos 1. Las variables de estudio 2. Estadística descriptiva 3. Gráficos descriptivos de las variables Histogramas Gráficos de caja-bigotes

Más detalles

Conceptos básicos de inferencia estadística (III): Inferencia no paramétrica: Contrastes de bondad de ajuste.

Conceptos básicos de inferencia estadística (III): Inferencia no paramétrica: Contrastes de bondad de ajuste. Conceptos básicos de inferencia estadística (III): Inferencia no paramétrica: Contrastes de bondad de ajuste. Tema 1 (III) Estadística 2 Curso 08/09 Tema 1 (III) (Estadística 2) Contrastes de bondad de

Más detalles

Estadísticos Descriptivos

Estadísticos Descriptivos ANÁLISIS EXPLORATORIO DE DATOS El análisis exploratorio tiene como objetivo identificar el modelo teórico más adecuado para representar la población de la cual proceden los datos muéstrales. Dicho análisis

Más detalles

2. DESCRIPCIÓN ESTADÍSTICA DE UNA VARIABLE. EJEMPLOS Y EJERCICIOS *.

2. DESCRIPCIÓN ESTADÍSTICA DE UNA VARIABLE. EJEMPLOS Y EJERCICIOS *. 2. DESCRIPCIÓN ESTADÍSTICA DE UNA VARIABLE. EJEMPLOS Y EJERCICIOS *. 2.1. Ejemplos. Ejemplo 2.1 Se ha medido el grupo sanguíneo de 40 individuos y se han observado las siguientes frecuencias absolutas

Más detalles

Estadística Descriptiva

Estadística Descriptiva M. en C. Juan Carlos Gutiérrez Matus Instituto Politécnico Nacional 2004 IPN UPIICSA c 2004 Juan C. Gutiérrez Matus Desde la segunda mitad del siglo anterior, el milagro industrial sucedido en Japón, hizo

Más detalles

Estadística para el análisis de los Mercados S2_A1.1_LECV1

Estadística para el análisis de los Mercados S2_A1.1_LECV1 5. Parámetros estadísticos. 5.1. Parámetros de centralización. Estos parámetros nos indican en torno a que puntos se encuentran los valores de la variable cuantitativa en estudio. Es la forma de representar

Más detalles

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN Lic. Esperanza García Cribilleros ANÁLISIS EXPLORATORIO DE DATOS Diagrama de tallo y hojas Diagrama de caja DESCRIPCIÓN N DE LOS DATOS Tablas

Más detalles

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico Formulario. Estadística Administrativa Módulo 1. Introducción al análisis estadístico Histogramas El número de intervalos de clase, k, se elige de tal forma que el valor 2 k sea menor (pero el valor más

Más detalles

ESTADÍSTICA SEMANA 2

ESTADÍSTICA SEMANA 2 ESTADÍSTICA SEMANA 2 ÍNDICE CUADROS DE DISTRIBUCIÓN DE FRECUENCIAS Y REPRESENTACIÓN GRÁFICA... 3 APRENDIZAJES ESPERADOS... 3 INTRODUCCIÓN... 3 REPRESENTACIÓN GRÁFICA... 3 MÉTODOS GRÁFICOS:... 3 DIAGRAMAS

Más detalles

Guía de Matemática Cuarto Medio

Guía de Matemática Cuarto Medio Guía de Matemática Cuarto Medio Aprendizaje Esperado: 1. Conocen distintas maneras de organizar y presentar información incluyendo el cálculo de algunos indicadores estadísticos, la elaboración de tablas

Más detalles

Fundamentos de Estadística y Simulación Básica

Fundamentos de Estadística y Simulación Básica Fundamentos de Estadística y Simulación Básica TEMA 2 Estadística Descriptiva Clasificación de Variables Escalas de Medición Gráficos Tabla de frecuencias Medidas de Tendencia Central Medidas de Dispersión

Más detalles

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos. La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta de las siguientes

Más detalles

MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMERICA) MEDIDAS DE TENDENCIA CENTRAL 20/05/2008 Ing. SEMS 2.1 INTRODUCCIÓN En el capítulo anterior estudiamos de qué manera los

Más detalles

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.

Más detalles

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS FACULTAD DE INGENIERÍA PROYECTO CURRICULAR DE INGENIERÍA DE SISTEMAS

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS FACULTAD DE INGENIERÍA PROYECTO CURRICULAR DE INGENIERÍA DE SISTEMAS I. IDENTIFICACIÓN DE LA ASIGNATURA ESTADÍSTICA I CÓDIGO DE LA ASIGNATURA 33102106 ÁREA CIENCIAS BASICAS DE INGENIERIA SEMESTRE SEGUNDO PLAN DE ESTUDIOS 1996 AJUSTE 2002 HORAS TOTALES POR SEMESTRE 64 HORAS

Más detalles

Datos cuantitativos. Método tabular

Datos cuantitativos. Método tabular Datos cuantitativos Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de

Más detalles

Ing. Eduardo Cruz Romero w w w. tics-tlapa. c o m

Ing. Eduardo Cruz Romero w w w. tics-tlapa. c o m Ing. Eduardo Cruz Romero eduar14_cr@hotmail.com w w w. tics-tlapa. c o m La estadística es tan vieja como la historia registrada. En la antigüedad los egipcios hacían censos de las personas y de los bienes

Más detalles

Estadísticas Elemental Medidas de dispersión 3.1-1

Estadísticas Elemental Medidas de dispersión 3.1-1 Estadísticas Elemental Medidas de dispersión 3.1-1 Medidas de dispersión La variación entre los valores de un conjunto de datos se conoce como dispersión. Cuando la dispersión es grande, los valores se

Más detalles

Introducción a la Estadística Aplicada en la Química

Introducción a la Estadística Aplicada en la Química Detalle de los Cursos de Postgrado y Especialización en Estadística propuestos para 2015 1/5 Introducción a la Estadística Aplicada en la Química FECHAS: 20/04 al 24/04 de 2015 HORARIO: Diario de 10:00

Más detalles

Estadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL

Estadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central nos proporcionan la descripción significativa de un conjunto de observaciones. Como su nombre lo indica, son datos de una variable que tienden

Más detalles

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo U.D.1: Análisis estadístico de una variable Consideraciones iniciales: - Población: Es el conjunto de todos los elementos que cumplen una determinada característica. Ej.: Alumnos del colegio. - Individuo:

Más detalles

Tema 2 Estadística Descriptiva

Tema 2 Estadística Descriptiva Estadística Descriptiva 1 Tipo de Variables 2 Tipo de variables La base de datos anterior contiene la información de 36 alumnos de un curso de Estadística de la Universidad de Talca. En esta base de datos

Más detalles

ANÁLISIS DESCRIPTIVO DE LOS DATOS DE VARIABLES CUANTITATIVAS

ANÁLISIS DESCRIPTIVO DE LOS DATOS DE VARIABLES CUANTITATIVAS ANÁLISIS DESCRIPTIVO DE LOS DATOS DE VARIABLES CUANTITATIVAS 3datos 2011 Variables CUANTITATIVAS Números con unidad de medida (con un instrumento, o procedimiento, de medición formal) Ej.: Tasa cardiaca;

Más detalles

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA 1. Conceptos Generales Población estadística.- Conjunto de todos los elementos sobre el que recaen las observaciones. Las poblaciones pueden ser: infinitas, p.e. extracciones con

Más detalles

UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO ESCUELA PREPARATORIA TEXCOCO

UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO ESCUELA PREPARATORIA TEXCOCO UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO ESCUELA PREPARATORIA TEXCOCO MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA DATOS NO AGRUPADOS MATERIAL DIDACTICO SOLO VISION ASIGNATURA QUE CORRESPONDE: ESTADISTICA

Más detalles

Universidad Nacional de Mar del Plata. Facultad de Ingeniería. Estadística Básica COMISIÓN 1. 1 Cuatrimestre 2016

Universidad Nacional de Mar del Plata. Facultad de Ingeniería. Estadística Básica COMISIÓN 1. 1 Cuatrimestre 2016 Universidad Nacional de Mar del Plata Facultad de Ingeniería Estadística Básica COMISIÓN 1 1 Cuatrimestre 2016 s. La palabra Estadística procede del vocablo Estado, pues era función principal de los Gobiernos

Más detalles

Distribuciones de muestreo fundamentales y descripciones de datos Muestreo aleatorio

Distribuciones de muestreo fundamentales y descripciones de datos Muestreo aleatorio Distribuciones de muestreo fundamentales y descripciones de datos Muestreo aleatorio En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población),

Más detalles

478 Índice alfabético

478 Índice alfabético Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión

Más detalles

ESTADÍSTICA CICLO 6 CAPACITACIÓN 2000

ESTADÍSTICA CICLO 6 CAPACITACIÓN 2000 INTRODUCCIÓN La estadística día a día esta ocupando un lugar importante en nuestra sociedad colaborando así al progreso humano y su bienestar. Aunque en sus comienzos era aplicada únicamente a asuntos

Más detalles

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud.

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud. 1. TABLAS Y GRÁFICOS ESTADÍSTICOS Estadística Es la ciencia que estudia conjunto de datos obtenidos de la realidad. Estos datos son interpretados mediante tablas, gráficas y otros parámetros tales como

Más detalles

Medidas de variabilidad (dispersión)

Medidas de variabilidad (dispersión) Medidas de posición Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando. Estas medidas permiten conocer diversas características de esta serie de datos. Las

Más detalles

Tema 6. Variables aleatorias continuas

Tema 6. Variables aleatorias continuas Tema 6. Variables aleatorias continuas Resumen del tema 6.1. Definición de variable aleatoria continua Identificación de una variable aleatoria continua X: es preciso conocer su función de densidad, f(x),

Más detalles

CM0244. Suficientable

CM0244. Suficientable IDENTIFICACIÓN NOMBRE ESCUELA ESCUELA DE CIENCIAS NOMBRE DEPARTAMENTO Ciencias Matemáticas ÁREA DE CONOCIMIENTO MATEMATICAS, ESTADISTICA Y AFINES NOMBRE ASIGNATURA EN ESPAÑOL ESTADÍSTICA GENERAL NOMBRE

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7) TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de

Más detalles

Análisis descriptivo y exploratorio de datos

Análisis descriptivo y exploratorio de datos TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD Análisis descriptivo y exploratorio de datos Francisco M. Ocaña Peinado @ocanapaco http://www.ugr.es/local/fmocan Departamento de Estadística e Investigación

Más detalles

Los estadísticos descriptivos clásicos (Robustez)

Los estadísticos descriptivos clásicos (Robustez) Los estadísticos descriptivos clásicos (Robustez) MUESTRA 0 0 4 6 8 9 MUESTRA 0 0 4 6 8 57 Nº CASOS Media Mediana Moda Desviación Simetría Curtosis MUESTRA,85 4,74 0, -0.688 MUESTRA 6,77 4.8.7.77 Ambas

Más detalles

Selección de fuentes de datos y calidad de datos

Selección de fuentes de datos y calidad de datos Selección de fuentes de datos y calidad de datos ESCUELA COMPLUTENSE DE VERANO 2014 MINERIA DE DATOS CON SAS E INTELIGENCIA DE NEGOCIO Juan F. Dorado José María Santiago . Valores atípicos. Valores faltantes.

Más detalles

Teoría de la decisión

Teoría de la decisión 1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia

Más detalles

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada. ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA Medidas de tendencia central y de dispersión Giorgina Piani Zuleika Ferre 1. Tendencia Central Son un conjunto de medidas estadísticas que determinan un único valor que define el

Más detalles

ANALISIS DE FRECUENCIA EN HIDROLOGIA

ANALISIS DE FRECUENCIA EN HIDROLOGIA ANALISIS DE FRECUENCIA EN HIDROLOGIA Luis F. Carvajal Julián D. Rojo Universidad Nacional de Colombia Facultad de Minas Escuela de Geociencias y Medio Ambiente Introducción 1. Los eventos hidrológicos

Más detalles

Bioestadística: Estadística Descriptiva

Bioestadística: Estadística Descriptiva Bioestadística: M. González Departamento de Matemáticas. Universidad de Extremadura Bioestadística 1 2 Bioestadística 1 2 Coneptos Básicos ESTADÍSTICA Ciencia que estudia el conjunto de métodos y procedimientos

Más detalles

INDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas

INDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas INDICE Prefacio XIII 1. Introducción 1.1. la imagen de la estadística 1 1.2. dos tipos de estadísticas 1.3. estadística descriptiva 2 1.4. estadística inferencial 1.5. naturaleza interdisciplinaria de

Más detalles

Construcción de Gráficas en forma manual y con programados

Construcción de Gráficas en forma manual y con programados Universidad de Puerto Rico en Aguadilla División de Educación Continua y Estudios Profesionales Proyecto CeCiMaT Segunda Generación Tercer Año Título II-B, Mathematics and Science Partnerships Construcción

Más detalles

TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION

TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION 1. Percentiles, cuartiles y deciies. 2. Estadígrafos de Posición. 3. Sesgo y curtosis o de pastel. Pictogramas. OBJETIVOS DE UNIDAD GENERALES. Que el futuro

Más detalles

Gobierno de La Rioja MATEMÁTICAS CONTENIDOS

Gobierno de La Rioja MATEMÁTICAS CONTENIDOS CONTENIDOS MATEMÁTICAS 1.- Números reales Distintas ampliaciones de los conjuntos numéricos: números enteros, números racionales y números reales. Representaciones de los números racionales. Forma fraccionaria.

Más detalles

Técnicas de Muestreo Métodos

Técnicas de Muestreo Métodos Muestreo aleatorio: Técnicas de Muestreo Métodos a) unidad muestral elemental: a.1) muestreo aleatorio simple a.2) muestreo (seudo)aleatorio sistemático a.3) muestreo aleatorio estratificado b) unidad

Más detalles

Puntuaciones Estándarizadas, Distribución Normal y Aplicaciones. Dra. Noemí L. Ruiz Limardo 2008 Derechos de Autor Reservados, Revisado 2010

Puntuaciones Estándarizadas, Distribución Normal y Aplicaciones. Dra. Noemí L. Ruiz Limardo 2008 Derechos de Autor Reservados, Revisado 2010 Puntuaciones Estándarizadas, Distribución Normal y Aplicaciones Dra. Noemí L. Ruiz Limardo 2008 Derechos de Autor Reservados, Revisado 2010 Objetivos de Lección Conocer características principales de una

Más detalles

MÉTODOS CUANTITATIVOS. Freddy Higuera Departamento de Ingeniería Industrial Universidad Católica del Norte

MÉTODOS CUANTITATIVOS. Freddy Higuera Departamento de Ingeniería Industrial Universidad Católica del Norte MÉTODOS CUANTITATIVOS Freddy Higuera Departamento de Ingeniería Industrial Universidad Católica del Norte Estadística La estadística tradicionalmente ha sido clasificada en dos tipos, la estadística descriptiva

Más detalles

1. La Distribución Normal

1. La Distribución Normal 1. La Distribución Normal Los espacios muestrales continuos y las variables aleatorias continuas se presentan siempre que se manejan cantidades que se miden en una escala continua; por ejemplo, cuando

Más detalles

TIPOS DE DATOS Y SU TABULACIÓN

TIPOS DE DATOS Y SU TABULACIÓN PreUnAB Clase # 24 Noviembre 2014 CONCEPTOS BÁSICOS DE ESTADÍSTICA Estadística: Ciencia que estudia los métodos y técnicas para obtener datos provenientes de fenómenos aleatorios, para organizarlos, presentarlos

Más detalles

INGENIERO EN COMPUTACION TEMA 1.2: PRESENTACIÓN GRÁFICA DE DATOS

INGENIERO EN COMPUTACION TEMA 1.2: PRESENTACIÓN GRÁFICA DE DATOS UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO CENTRO UNIVERSITARIO UAEM ZUMPANGO INGENIERO EN COMPUTACION TEMA 1.2: PRESENTACIÓN GRÁFICA DE DATOS ELABORÓ: M. EN C. LUIS ENRIQUE KU MOO FECHA: Agosto de 2016

Más detalles

UNIDAD 7 Medidas de dispersión

UNIDAD 7 Medidas de dispersión UNIDAD 7 Medidas de dispersión UNIDAD 7 MEDIDAS DE DISPERSIÓN Al calcular un promedio, por ejemplo la media aritmética no sabemos su representatividad para ese conjunto de datos. La información suministrada

Más detalles

Tema 9: Estadística en dos variables (bidimensional)

Tema 9: Estadística en dos variables (bidimensional) Tema 9: Estadística en dos variables (bidimensional) 1. Distribución de frecuencias bidimensional En el tema anterior se han estudiado las distribuciones unidimensionales obtenidas al observar sólo un

Más detalles

Unidad Temática 1 Estadística descriptiva y análisis de datos

Unidad Temática 1 Estadística descriptiva y análisis de datos Unidad Temática 1 Estadística descriptiva y análisis de datos Responda verdadero o falso. Coloque una letra V a la izquierda del número del ítem si acepta la afirmación enunciada, o una F si la rechaza.

Más detalles

Matemáticas. Selectividad ESTADISTICA COU

Matemáticas. Selectividad ESTADISTICA COU Matemáticas Selectividad ESTADISTICA COU 1. Un dentista observa el Nº de Caries en cada uno de los 100 niños de cierto colegio. La información obtenida aparece resumida en la siguiente tabla. Nº Caries

Más detalles

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA ESTADÍSTICA La estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comprobaciones y sacar conclusiones. Un estudio estadístico consta

Más detalles

Probabilidad y Estadística, EIC 311

Probabilidad y Estadística, EIC 311 Probabilidad y Estadística, EIC 311 Medida de resumen 1er Semestre 2016 1 / 105 , mediana y moda para datos no Una medida muy útil es la media aritmética de la muestra = Promedio. 2 / 105 , mediana y moda

Más detalles

Estadística descriptiva y métodos diagnósticos

Estadística descriptiva y métodos diagnósticos 2.2.1. Estadística descriptiva y métodos diagnósticos Dra. Ana Dorado Díaz Consejería de Sanidad Diplomado en Salud Pública Diplomado en Salud Pública - 2 Objetivos específicos 1. El alumno aprenderá a

Más detalles

Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa

Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa Materia: Estadística I Maestro: Dr. Francisco Javier Tapia Moreno Semestre: 2017-1 Introducción Una variable estadística

Más detalles

+ f 2. + f 3. p i. =h i 100. F i. = f i. H i. = h i. P i. = p i

+ f 2. + f 3. p i. =h i 100. F i. = f i. H i. = h i. P i. = p i OCIOES de ESTADÍSTICA En las tablas estadísticas se pueden tabular, entre otros, los siguientes aspectos: La frecuencia absoluta ( f i ), es decir, el número de veces que aparece un determinado valor en

Más detalles

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012 NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012 Matilde Ungerovich- mungerovich@fisica.edu.uy DEFINICIÓN PREVIA: Distribución: función que nos dice cuál es la probabilidad de que cada suceso

Más detalles

CAPÍTULO 6: VARIABLES ALEATORIAS

CAPÍTULO 6: VARIABLES ALEATORIAS Página 1 de 11 CAPÍTULO 6: VARIABLES ALEATORIAS En el capítulo 4, de estadística descriptiva, se estudiaron las distribuciones de frecuencias de conjuntos de datos y en el capítulo 5 se trataron los fundamentos

Más detalles

Nada en esta maravillosa vida es 100% seguro. En todo lo que hacemos, siempre estamos estimando los chances de resultados exitosos: en los negocios,

Nada en esta maravillosa vida es 100% seguro. En todo lo que hacemos, siempre estamos estimando los chances de resultados exitosos: en los negocios, Nada en esta maravillosa vida es 1% seguro. En todo lo que hacemos, siempre estamos estimando los chances de resultados exitosos: en los negocios, en la medicina, en el clima y principalmente en los juegos

Más detalles

La amplitud del intervalo ( ) se determina considerando un número dado de intervalos ( ) y el rango obtenido, esto es:

La amplitud del intervalo ( ) se determina considerando un número dado de intervalos ( ) y el rango obtenido, esto es: La estadística es una materia dedicada a la recopilación, organización, estudio y análisis de datos de un hecho en particular. La estadística descriptiva tabula, representa y describe una serie de datos

Más detalles

Curso de nivelación Estadística y Matemática

Curso de nivelación Estadística y Matemática Curso de nivelación Estadística y Matemática Primera clase: Estadística Descriptiva Programa Técnico en Riesgo, 2016 Agenda 1 Tipos de variables y niveles de medición 2 3 Tipos de variables Variables Cuantitativas

Más detalles

3. Correlación. Introducción. Diagrama de dispersión

3. Correlación. Introducción. Diagrama de dispersión 1 3. Correlación Introducción En los negocios, no todo es el producto, pueden existir factores relacionados o externos que modifiquen cómo se distribuye un producto. De igual manera, la estadística no

Más detalles

La desviación típica y otras medidas de dispersión

La desviación típica y otras medidas de dispersión La desviación típica y otras medidas de dispersión DISPERSIÓN O VARIACIÓN La dispersión o variación de los datos intenta dar una idea de cuan esparcidos se encuentran éstos. Hay varias medidas de tal dispersión,

Más detalles

TEMA 7 EL MODELO DE LA CURVA NORMAL. CONCEPTO Y APLICACIONES

TEMA 7 EL MODELO DE LA CURVA NORMAL. CONCEPTO Y APLICACIONES TEMA 7 EL MODELO DE LA CURVA NORMAL. CONCEPTO Y APLICACIONES 1. Puntuaciones diferenciales y puntuaciones típicas 2. La curva normal 3. Cálculo de áreas bajo la curva normal 3.1. Caso 1: Cálculo del número

Más detalles