Clase 1 Módulo: Minería de datos Docente: Gustavo Valencia Zapata
|
|
- Elvira Ojeda Aguirre
- hace 6 años
- Vistas:
Transcripción
1 v.1.0 Clase 1
2 Temas Clase 1: Conceptos Estadísticos para Minería de Datos Tipos de variables La distribución normal Conceptos básicos Estadística descriptiva Referencias
3 Conceptos básicos Conceptos básicos El principal objetivo de la estadística es producir información útil y de interés a partir de hechos numéricos. Para alcanzar este objetivo se recomienda prestar atención a básicamente tres cosas [7]: 1. Producir datos de calidad 2. Organizar y analizar estos datos 3. Obtener conclusiones a partir de estos datos Las conclusiones basadas en datos, sea que se obtengan de manera formal o informal, tienen una componente de incertidumbre ya que siempre habrá variabilidad en los datos.
4 Conceptos básicos Los datos varían. Fenómenos naturales, el Hombre, Los animales, las cosas, medidas repetidas hechas sobre un mismo ente varían. Si la variabilidad no existiera viviríamos en el mundo de lo constante, nada nos sorprendería ni el pasado o el futuro, todo sería igual y la estadística difícilmente sería la misma; que pensar de aquellas disciplinas modernas que dependen de la estadística como la minería de datos, visualización de información o la inteligencia de Negocios. La estadística propone métodos para enfrentar situaciones donde la variabilidad y la incertidumbre están presentes. Con estos métodos se puede analizar datos a fin de separar y evidenciar la presencia de patrones sistemáticos de la siempre presente variabilidad Antes de que los hechos numéricos se usen para bien o para mal se deben producir datos. Los datos pueden estar disponibles o se pueden obtener vía experimental o por observación.
5 Conceptos básicos Ejemplos: Disponible: Registros médicos de un Hospital Observación: Contar el número de vehículos que obvian un semáforo en rojo en una calle determinada. (Proceso pasivo) Experimental: Comparar la efectividad de dos o más medicamentos. (Proceso activo) Para realizar un estudio estadístico se requieren datos, que pueden comprender a toda la Población de referencia (Censo), o solo a una parte de ella (Muestra).
6 Conceptos básicos Población: Conjunto de todos los elementos que comparten un grupo común de características, y forman el universo para el propósito del problema de investigación. La población objetivo es la Población particular en que estamos interesados y sobre el cual se desea obtener algunas conclusiones por medio de métodos estadísticos Muestra: Es un subconjunto representativo de la población a partir del cual se pretende realizar inferencias respecto a la población de donde proceden. Es más práctico y ventajoso tomar muestras ya que optimiza los recursos disponibles. Unidad Estadística: Es el elemento o unidad base de la población o de la muestra. Cualquier miembro de la Población. Parámetro: Es cualquier valor característico de la población (valores verdadero), también llamados medidas numéricas que describen características esenciales en una población de interés. Variable: Es una característica de un individuo en la población o en la muestra cuya medida puede cambiar de valor.
7 Conceptos básicos Inferencia Estadística: Es una parte de la estadística cuya finalidad es obtener conclusiones respecto a la población a partir de datos observados en muestras. Ejemplo: El ministerio de transporte de un país, ha recibido continuas quejas de usuarios denunciando usurara en las tarifas del galón de combustible en estaciones de gasolina. A la fecha existen estaciones de gasolina en el país, por lo que el ministerio decide seleccionar al azar 200 estaciones y registrar el precio del galón de gasolina el mismo día para ser comparado con la tarifa oficial. Describa: Población, Variable, Muestra y proceso de Inferencia
8 Conceptos básicos Solución: Población: Las estaciones de gasolina es la Población de interés. Variable: El precio del galón de gasolina es la Variable de interés. Muestra: Las 200 estaciones auditadas son la muestra de la Población. Proceso de inferencia: La inferencia en este caso podría ser la generalización de la información de los precios en las estaciones de gasolina de la muestra. En particular el ministerio de transporte desea conocer la magnitud del problema de usura presente en la Población. Se propone calcular el promedio del valor galón y compararlo con la tarifa oficial.
9 Tipos de variables Tipos de Variables Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.
10 Tipos de variables Los datos que se recopilan como producto de un proceso de experimentación aleatoria pueden tener una amplia variedad de formas. Dependiendo del tipo de datos, la estadística proporciona una técnica adecuada para su estudio. Un conjunto de datos posee una serie de características de interés que pueden ser visualizadas ya sea en forma numérica o en forma gráfica. Las variables más comunes en estadística se dividen en Discretas, Continuas y Categóricas Discretas: Son aquellas variables cuyo rango de valores es finito o contable. Por ejemplo, el número de accidentes en una intersección en un determinado mes. El numero de hijos según los diferentes estratos socioeconómicos. Surgen de procesos que involucran conteos.
11 Tipos de variables Continuas: Son aquellas variables cuyo rango de valores es infinito. Es decir, que tiene tantos valores como puntos hay en un segmento rectilíneo. Por ejemplo, nivel de presión sanguínea, edad, peso, temperatura, etc. Surgen de procesos que involucran mediciones. Cualitativas(Categóricas): Sus valores consisten en una serie de clasificaciones. Por D Según la escala de medición, las más comunes son: Nominal: Los niveles no tienen un orden natural. Por ejemplo, afiliación religiosa (Católico, Testigo de Jehová, Protestante. No se puede determinar cual va primero). Género (Femenino, Masculino). Estado civil (Soltero, Casado, Unión libre). Color (Rojo, blanco, verde) Ordinal: Los niveles tienen algún orden, pero no es posible medir la distancia entre las categorías. Por ejemplo, Estrato socio económico, tamaño de un automóvil, Satisfacción (Poco, moderado, muy satisfecho)
12 Tipos de variables Intervalo: Tiene distancias numéricas entre dos niveles cualquiera de la escala. Por ejemplo, Ingreso (<200000, entre y , más de ). Se usa para mediciones de naturaleza cuantitativa que se hacen con escalas que tienen como base un valor de cero arbitrario. Por ejemplo un registro de 0 no indica la ausencia de temperatura. Razón: Se usa para mediciones de naturaleza cuantitativa que se hacen con escalas que tienen como base un valor de cero absoluto. Por ejemplo, longitud del brazo, estatura, tiempo de duración, número de artículos defectuosos en una línea de producción, presión sanguínea. Las variables continuas y discretas pertenecen a esta escala Si el peso de persona se mide en gramos, kilos o libras, esta constituye una medida cuantitativa, pero si se mide como bajo, medio o alto es cualitativa.
13 Estadística descriptiva La Estadística Descriptiva utiliza métodos numéricos y gráficos a fin de buscar patrones, resumir y presentar la información contenida en un conjunto de datos Medidas de Centralidad Medidas de Centralidad: Media Aritméticas para datos simples: Denota el promedio de un conjunto de datos. Se calcula dividiendo la suma del conjunto de datos entre el total de ellos.
14 Moda para datos simples: Es el valor de la variable que tiene mayor frecuencia absoluta, la que más se repite es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo. Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia siendo esta máxima. Mediana para datos simples: Es el valor que divide al conjunto de datos ordenados, en aproximadamente dos partes: 50% de valores son inferiores y otro 50% son superiores
15 Ejemplo: Considere los siguientes datos ordenados asociados a la edad de un club de lectura. 22, 33, 35, 44, 47, 49, 55, 56, 67, 68, 70, 75 Como es par, entonces la mediana es: Medidas de Dispersión La Varianza: Es una medida de dispersión de la información. Se obtiene como el promedio de los cuadrados de las desviaciones de los valores de la variable respecto de su media aritmética. Desviación Estándar: Conocida también como desviación típica, es una medida de dispersión que se obtiene como la raíz cuadrada de la varianza. Mide cuanto se separan los datos. Módulo: Visualización de Información
16 Ejemplo: Altura de perros Un club de amigos de los perros decidió medir la altura de sus mascotas (altura a la cruz), para identificar las diferencias entre cada raza en esta variable. Fuente: Gustavo Valencia Z. Notas de clase: Visualización de Información, 2012.
17 ALTURA DE PERROS ID Perro Altura_cruz (cm) P1 Gran Danés 76 P2 Bóxer 59 P3 Pinscher Alemán 49 P4 Bulldog Inglés 32 P5 Bull Terrier 30 P6 Schnauzer Miniatura 37 P7 Poodle 39 P8 Pinscher Miniatura 22
18 Es decir que la altura media a la cruz de los 8 perros es de 43 cm. Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.
19 Visualización de datos Para calcular la varianza, se debe identificar la diferencia con respecto a la media para cada perro. Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.
20 Visualización de datos La desviación estándar sería: Lo útil de la desviación estándar es que es más intuitiva. Se puede identificar que alturas están a una distancia menor que la desviación estándar de la media. Usando la desviación estándar tenemos una forma de saber lo normal referente a la altura. Podríamos concluir que el Galgo Inglés tiene una altura muy grande y el Pinscher Miniatura una muy pequeña, es decir, el Galgo Inglés y el Pinscher Miniatura no tienen una altura a la cruz estándar.
21 Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.
22 Tablas de frecuencia La distribución de frecuencia es un método para organizar y resumir grandes volúmenes de información. Suele ser útil para la VI al momento de construir graficas. El caso de variables Discretas y Nominales Ejemplo Quinto grado: El tutor de un grupo de quinto año escolar, desea visualizar la información de sus alumnos referida a la EDAD y GENERO. En total el grupo está conformado por 30 estudiantes entre los 8 y 11 años de edad.
23 Variable Discreta: EDAD Frecuencia Porcentaje Porcentaje válido Porcentaje acumulado Válidos ,0 10,0 10, ,3 43,3 53, ,0 40,0 93, ,7 6,7 100,0 Total ,0 100,0 Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.
24 Variable Nominal: GENERO Frecuenci a Porcentaje Porcentaje válido Porcentaje acumulado Válidos F 19 63,3 63,3 63,3 M 11 36,7 36,7 100,0 Total ,0 100,0 Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.
25 Se debe tener presente que para cualquier tipo de variare es fundamental que las contrario la tabla de frecuencia carecería de utilidad. El caso de variables Continuas En estos casos se recomienda agrupar los datos bajo el siguiente método: El número de clases se puede calcular con alguna de las siguientes formulas: La primera es llamada formula de Sturges.
26 Pasos: 1. Determinar el rango (diferencia entre el valor máximo y mínimo). 2. Valores extremos Si los datos son enteros, reste 0.5 al mínimo y súmele 0.5 al máximo Si los datos tienen una cifra decimal reste 0.05 al mínimo y súmele 0.05 al máximo 3. De esta manera de acuerdo al número de cifras decimales 4. Calcule nuevamente el rango (rango ampliado) 5. Calcule el número de clases con alguna de las formulas mencionadas 6. Calcule la amplitud de la siguiente forma:
27 6. Al nuevo mínimo se le suma la amplitud () para generar la primera clase (utilice intervalo semiabierto a derecha); luego al extremo superior de esa primera clase súmele la amplitud y de esta manera obtendrá la segunda clase. Repita este procedimiento hasta llegar a los grupos. 7. Ubique a cada individuo o elemento en las respectivas clases. Ejemplo Quinto grado: Sobre el mismo grupo de alumnos, el tutor quiere visualizar la información referida al PESO. Quinto Grado Peso en Kg
28 Tablas de frecuencia Procedimiento: Paso 1 Paso 2 y 3 Paso 4 Paso 5
29 Tablas de frecuencia Paso 6 Finalmente la tabla de frecuencia sería: Quinto Grado Peso en Kg. GRUPO_PESO ALUMNOS [20.55, 24.68) 4 [24.68, 28.81) 5 [28.81, 32.94) 3 [32.94, 37.07) 9 [37.07, 41.21) 5 [41.21, 45.34) 4
30 Tablas de frecuencia Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.
31 Tablas de contingencia (Cross Tables) Cuando en las unidades muéstrales se observan múltiples características registradas como variables cualitativas, la información puede resumirse usando una tabla de contingencia. Por ejemplo, una tabla 2X2 o de doble entrada luciría de la siguiente manera: Enfermedad Coronaria Fumador Si No Total Si No Total
32 Recordemos el caso relacionada al tipo de sangre estudiado en la actividad al inicio del modulo de VI. En este caso es una tabla 2X4 Tabla de contingencia GENERO * GRUPO_EDAD Recuento GRUPO_EDAD Total GENERO Hombre Mujer Total El uso de tablas de contingencias es el corazón del análisis estadístico de datos cualitativos [8] y es utilizado ampliamente en pruebas estadística son paramétricas [9]
33 Tablas de contingencia (Cross Tables) Cuando en las unidades muéstrales se observan múltiples características registradas como variables cualitativas, la información puede resumirse usando una tabla de contingencia. Por ejemplo, una tabla 2X2 o de doble entrada luciría de la siguiente manera: Enfermedad Coronaria Fumador Si No Total Si No Total
34 Distribución Normal Función de densidad de probabilidad Normal (continuos y discretos) Cuando en las unidades muéstrales se observan múltiples características registradas como variables cualitativas, la información puede resumirse usando una tabla de contingencia. Esta distribución juega un papel clave en el desarrollo de la inferencia estadística, pues muchas de las herramientas usadas en la toma de decisiones o en las pruebas de hipótesis, tienen su fundamento en esta distribución. Un gran número de estudios pueden ser aproximados usando una distribución normal. Algunas variables físicas, datos meteorológicos (temperatura, precipitaciones, presión atmosférica, etc.), mediciones en organismos vivos, notas o puntajes en pruebas de admisión o de aptitud, errores en instrumentación, proporciones de errores en diversos procesos, etc.
35 Esta distribución es absolutamente simétrica alrededor de su media. Variación de la distribución normal en función de la media Variación de la distribución normal en función de la desviación estándar Fuente: Portal Biomédico., 2010.
36 Retomando el ejemplo de los niños de quinto grado, nos podríamos pregunta si su distribución en relación a las variables peso y edad se comportan como una distribución normal. Un primer paso es construir un histograma para cada una de estas variables. Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.
37 Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, Podríamos decir que estas variables se distribuyen normalmente?
38 Retomando nuevamente la definición y conceptos teóricos de la función de densidad de probabilidad Normal, podríamos enunciar de una forma más formal: Sea X una variable aleatoria continua. Se dice que X se distribuye como una normal con parámetros y (estos parámetros determinan el centro y la dispersión de la distribución y la caracterizan completamente), lo cual se escribe, si X tiene función densidad de probabilidad dada por, Por medio del cálculo se puede probar que realmente esta función es función de densidad de probabilidad. Además, es simétrica alrededor de. Tiene forma acampanada, el área bajo la curva (considerando todo el dominio de la v.a) siempre es igual a 1.
39 Si X es una v.a. normal con parámetros y, la probabilidad de que se calcula así: Para calcular probabilidades relacionadas con la normal se hace necesario utilizar tablas estándar de normalidad. Esto es porque las integrales que surgen en este tipo de problemas son extremadamente difíciles de resolver. Afortunadamente, cualquier variable aleatoria normal se puede transformar en una normal con media = 0 y varianza = 1; esto se logra por medio de la siguiente transformación.
40 Suponga que X es una variable aleatoria normal con parámetros y. La variable aleatoria Z, se define como: Pero Es equivalente la probabilidad original a la obtenida con esta transformación? La respuesta es afirmativa, ya que, Una variable aleatoria X que se transforme de esta manera se dice que es una variable aleatoria estandarizada. Una vez una variable este estandarizada ya no es necesario resolver la integral ya que sus valores están tabulados.
41 Ejemplo: La resistencia a la comprensión de una serie de muestras de cemento puede modelarse por medio de una distribución normal con una resistencia media de 6000 kg y una desviación estándar de 100 kg por centímetro cuadrado Cuál es la probabilidad de que la resistencia de una muestra sea inferior a 6200 kg por centímetro cuadrado? Solución Sea X: Resistencia a la compresión de una muestra de cemento. Por la información del problema se sabe que. La probabilidad pedida es, Entonces, P X De esta forma se estandariza.
42 La distribución normal cumple la siguiente regla: El intervalo contiene aproximadamente el 68.2% de las mediciones. El intervalo 2 contiene aproximadamente el 95.4% de las mediciones. El intervalo 3 contiene algo más del 99.7% de las mediciones. Fuente: Juan C. Salazar. Elementos de probabilidad y estadística. Notas de clase. Universidad Nacional de Colombia. Sede Medellín, 2010.
43 El Diagrama Boxplot En 1977, John Tukey publicó un método eficiente para mostrar cinco números representativos o resumen de un conjunto de datos cuantitativos. La gráfica fue llamada Boxplot (Diagrama de caja y bigotes), la cual resume los siguientes elemento o medidas estadísticas. Mediana Percentiles de interés (25%, 50% y 75%) Máximo Mínimo Valores extremos El Boxplot representa la distribución de una variable continua, donde por medio de los cinco valores, se representan los conceptos de: Tendencia Central Dispersión Simetría Este gráfico es ideal para representar una desviación de la distribución normal.
44 Este gráfico es ideal para representar una desviación de la distribución normal. Mientras más grande es la caja y los bigotes, más dispersa es la distribución de los datos La distancia entre las medidas puede variar, pero no la cantidad de elementos, ya que entre una y la otra es aproximadamente la misma. La línea de la mediana indica la simetría. El Boxplot es también considerado un método gráfico para la detección de Outlier (valores extremos) y es muy utilizado en minería de datos en la etapa de exploración de datos para detectar valores que posiblemente sean influyentes para determinar la calidad de un modelo. Por otra parte existen técnicas estadísticas especializadas en la detección de estos registros influyentes, donde algunas emplean el análisis delos errores para dicho fin.
45 Los Outlier son valores extremos que se encuentran cerca de los límites del rango de datos o van en contra de la tendencia de los datos restantes. La identificación de valores atípicos es importante, ya que pueden obedecer a errores asociados al parámetro de calidad de los datos. Además, incluso si un Outlier es un valor valido, ciertos métodos estadísticos son sensibles a la presencia de valores atípicos y pueden ofrecer resultados inestables o disminuir en su poder predictivo. [10]
46 Boxplot para la variable Peso. Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.
47 Boxplot para la variable Edad. Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, 2012.
48 Boxplot y distribución normal Fuente:
49 Evaluación del supuesto de normalidad. Cuando se está en presencia de una muestra aleatoria, es ciertamente importante determinar si proviene o no de una población la cual se distribuye normalmente. Existen pruebas gráficas y estadísticas para determinar si un conjunto de n datos sobre una variable provienen o no de una distribución normal. Método gráfico: Q-Q Plot o gráfico de normalidad. Este método compara los valores empíricos (o muestrales) de los cuartiles con los valores reales (o teóricos) de los cuartiles de una normal. Si los datos provienen de una distribución normal, el gráfico de los cuartiles empíricos contra los reales lucirá como una línea recta. Si los datos se distribuyen normalmente los puntos en el gráfico caen de manera muy aproximada sobre una línea recta con intercepto µ y pendiente.
50 Fuente: Juan C. Salazar. Elementos de probabilidad y estadística. Notas de clase. Universidad Nacional de Colombia. Sede Medellín, 2010.
51 Prueba de Normalidad Shapiro-Wilk (No Paramétrica) Para probar normalidad univariada este test es el que más se recomienda. Es de resaltar que este test no pertenece a la familia de tests de Kolmogorov. Si solo se dispone de tablas para comparar este estadístico, se recomienda su uso cuando el tamaño maestral es menor o igual a 50 aunque los paquetes estadísticos actuales están en capacidad de calcularlo para muestras más grandes. El alcance de este curso no abordará el cálculo analítico de esta prueba de normalidad, sin embargo, en el texto de Conover de estadística No Paramétrica se encuentra en detalle el desarrollo analítico. Las hipótesis de esta prueba son: H0 (hipótesis nula): F(x) es una función de distribución normal, con media y varianza no especificadas. H1 (hipótesis alternativa): F(x) no es normal.
52 Fuente: Gustavo Valencia Z. Notas de clase: Minería de Datos, Para la variable EDAD rechazo H0 y para PESO no se puede rechazar H0
53 Desde R es posible calcular el estadístico y valor p dela prueba Shapiro Wilk. > EDAD=c(9,10,9,10,9,9,10,10,9,9,10,9,8,10,9,10,11, + 9,10,11,9,10,9,9,9,8,10,10,8,10) > shapiro.test(edad) Shapiro-Wilk normality test data: EDAD W = 0.86, p-value = > PESO=c(33.1,35.4,36.6,45.3,37.0,38.7,23.5,34.6,44.5, ,35.0,36.2,27.3,28.6,39.9,36.9,38.7,21.4,42.0,30.4,25.3) > shapiro.test(peso) Shapiro-Wilk normality test data: PESO W = , p-value =
54 Índice de Asimetría La asimetría de una distribución hace referencia al grado en que los datos se reparten por encima (derecha) y por debajo (izquierda) de la tendencia central Índice de Curtosis La Curtosis hace referencia al grado de apuntamiento de la distribución.
55 Podríamos mencionar que si el valor del índice de Asimetría es 0±0.5, se habla de una posible distribución normal aunque es indispensable apoyarse en otras verificaciones. Si el valor del índice de Curtosis es 0±0.5, se dice que los datos están muy bien distribuidos. Se pudiera pensar que si la media, mediana y moda de una variable presentaran valores muy similares, se dice que los datos se distribuyen normalmente.
56 Diagrama de Dispersión Tipo de Variable Cuantitativa Discretas Continuas Cualitativa Nominales Ordinales Muestra en un eje cartesiano (xy) la relación que existe entre dos variables. Utilizados para ilustrar y comparar valores numéricos, como datos científicos, estadísticos y de ingeniería, entre otros. Nos informa del grado de correlación entre las dos variables: Muestra si el incremento o disminución de los valores de una de las variables (independiente), representada normalmente en el eje x, altera de alguna manera los valores de la otra variable (dependiente), representada generalmente en el eje y. Visualmente se puede interpretar la correlación entre dos variables, según la forma de la nube de puntos Módulo: Visualización de Información
57 Correlación nula: No existe ninguna relación entre las variables. Se dice que ambas son independientes. Correlación no lineal: Existe una relación entre las variables pero no es lineal. Fuente: Instituto Nacional de Estadística. España,2012. Correlación lineal: Existe una relación lineal negativa si al aumentar los valores de la variable independiente disminuyen los valores de la variable dependiente y relación lineal positiva si al aumentar los valores de la variable independiente aumentan los valores de la variable dependiente.
58 Tipos de Gráficos Fuente: Gustavo Valencia Z. Notas de clase: Visualización de Información, Actividad: Volumen del huevo. Los diagramas de dispersión simple (bidimensionales) suelen ser muy útiles para identificar visualmente la calidad un modelo comparando el valor conocido con el valor estimado.
59 Tipos de Gráficos Las matrices de dispersión proporcionan un método simple de presentar las relaciones entre pares de variables. Consiste en una matriz donde cada entrada presenta un grafico de dispersión sencillo. Un inconveniente es que si tenemos muchas variables el tamaño de cada entrada se reduce demasiado impidiendo ver con claridad las relaciones entre los pares de variables. Normalmente es empleado en la etapa de exploración cuando se desea identificar el tipo de correlación existente entre variables de tipo cuantitativo. Suele ser un paso inicial obligatorio al momento de la construcción de un modelo de regresión lineal.
60 Tipos de Gráficos Fuente: Gustavo Valencia Z. Notas de clase: Visualización de Información, Actividad: Volumen del huevo.
61 Tipos de Gráficos Correlación Trata de establecer la relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional. Se mide de -1 a 1. Correlación de Pearson. Mide la fuerza (intensidad) y dirección de una asociación lineal entre dos variables x y y. Correlación de Spearman. Mide la fuerza (intensidad) y dirección de una asociación monótona entre x y y. Por asociación monótona se entiende un incremento en x lleva a un incremento (o decremento) en y, pero este no es necesariamente lineal [7].
62 Tipos de Gráficos Correlación Spearman es robusto a la presencia de outliers, mientras que Pearson no lo es. Spearman es apropiado para datos ordinales y para datos agrupados en intervalos que no satisfacen el supuesto de normalidad. Pearson es ideal para variables continuas normales. Fuente: Gustavo Valencia Z. Notas de clase: Visualización de Información, Actividad: Volumen del huevo.
63 Tipos de Gráficos Fuente: Gustavo Valencia Z. Notas de clase: Visualización de Información, Actividad: Volumen del huevo.
64 Tipos de Gráficos Graficos Q-Q y Boxplot para el Volumen del huevo predicho. Fuente: Gustavo Valencia Z. Notas de clase: Visualización de Información, Actividad: Volumen del huevo.
65 Tipos de Gráficos Tarea Consultar una aplicación de la minería de datos en la industrio o la investigación académica. La fuente de información debe poseer un carácter formal (investigativo), es decir, debe ser un artículo publicado en algún journal. 2. Realice un análisis de datos asociados a ventas de detergente. Utilice la herramienta que esté a su alcance y las técnicas que comúnmente emplea en situaciones similares (tablas, gráficos, entre otros). Encuentre más detalles de esta actividad en el archivo Tarea 001 Análisis exploratorio
66 Referencias [7] Juan C. Salazar., Elementos de probabilidad y estadística. Notas de clase. Universidad Nacional de Colombia. Sede Medellín. [8] Alan Agresti. Categorical Data. Universidad Nacional de Colombia. Wiley, [9] W. J. Conover. Practical Nonparametric Statistic. Wiley, [10] Daniel T. Larose, Discovering Knowledge in Data: An Introduction to Data Mining. John Wiley & Son, 2005
ÁREAS DE LA ESTADÍSTICA
QUÉ ES LA ESTADÍSTICA? Es el arte de realizar inferencias y sacar conclusiones a partir de datos imperfectos. ÁREAS DE LA ESTADÍSTICA Diseño: Planeamiento y desarrollo de investigaciones Descripción: Resumen
Más detallesAnálisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz
Análisis de datos y gestión n veterinaria Tema 1 Estadística descriptiva Prof. Dr. José Manuel Perea Muñoz Departamento de Producción Animal Facultad de Veterinaria Universidad de Córdoba Córdoba, de Septiembre
Más detallesPREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2
PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 Preg. 1. Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol en sangre de una serie de individuos, utilizamos
Más detallesEstadística Inferencial. Estadística Descriptiva
INTRODUCCIÓN Estadística: Ciencia que trata sobre la teoría y aplicación de métodos para coleccionar, representar, resumir y analizar datos, así como realizar inferencias a partir de ellos. Recogida y
Más detalles3 ANALISIS DESCRIPTIVO DE LOS DATOS
3 ANALISIS DESCRIPTIVO DE LOS DATOS 3.1 La tabulación de los datos 3.1.1 Tabla de distribución de frecuencias. 3.1.2 El histograma. 3.2 Medidas de tendencia central 3.2.1 La media. 3.2.2 La mediana. 3.2.3
Más detallesTema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1
Bioestadística Tema 2: Estadísticos Tema 2: Estadísticos 1 Parámetros y estadísticos Parámetro: Es una cantidad numérica calculada sobre una población La altura media de los individuos de un país La idea
Más detallesTema 1: Análisis de datos univariantes
Tema 1: Análisis de datos univariantes 1 En este tema: Conceptos fundamentales: muestra y población, variables estadísticas. Variables cualitativas o cuantitativas discretas: Distribución de frecuencias
Más detallesDr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental
Universidad de Puerto Rico Recinto de Aguadilla Programa CeCiMat Elemental Definición de conceptos fundamentales de la Estadística y la Probabilidad y su aportación al mundo moderno Dr. Richard Mercado
Más detallesESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua
ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:
Más detallesFase 2. Estudio de mercado: ESTADÍSTICA
1. CONCEPTO DE ESTADÍSTICA. ESTADÍSTICA DESCRIPTIVA 2. 3. TABLA DE FRECUENCIAS 4. REPRESENTACIONES GRÁFICAS 5. TIPOS DE MEDIDAS: A. MEDIDAS DE POSICIÓN B. MEDIDAS DE DISPERSIÓN C. MEDIDAS DE FORMA 1 1.
Más detallesTema 3: Estadística Descriptiva
Tema 3: Estadística Descriptiva Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 3: Estadística Descriptiva Curso 2008-2009 1 / 27 Índice
Más detallesDistribución normal estándar. Juan José Hernández Ocaña
Distribución normal estándar Juan José Hernández Ocaña Tipos de variables jujo386@hotmail.com Tipos de variables Cualitativas Son las variables que expresan distintas cualidades, características o modalidades.
Más detallesPROBABILIDAD. Unidad I Ordenamiento de la Información
1 PROBABILIDAD Unidad I Ordenamiento de la Información 2 Captura de datos muestrales Conceptos básicos de la estadística 3 Población (o universo): Totalidad de elementos o cosas bajo consideración Muestra:
Más detallesGLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.
GLOSARIO ESTADÍSTICO Fuente: Murray R. Spiegel, Estadística, McGraw Hill. CONCEPTOS Y DEFINICIONES ESPECIALES Es el estudio científico de los métodos para recoger, organizar, resumir y analizar los datos
Más detallesEstadística Descriptiva
Nociones de Probabilidades y Estadística Estadística Descriptiva Luis A. Salomón Departamento de Ciencias Matemáticas Escuela de Ciencias, EAFIT Luis A. Salomón (EAFIT) Inspira Crea Transforma Curso 2016
Más detallesEstadística Descriptiva
Estadística Descriptiva 1 Qué veremos 1. OBJECTIVOS DEL CURSO. DEFINICIONES IMPORTANTES 2. TIPOS DE VARIABLES 3 5 1. Estadísticos de tendencia central 2. Estadísticos de posición 3. Estadísticos de variabilidad/dispersión
Más detallesANÁLISIS DE DATOS. L.A. y M.C.E. Emma Linda Diez Knoth
ANÁLISIS DE DATOS 1 Tipos de Análisis en función de la Naturaleza de los Datos Datos cuantitativos Datos cualitativos Análisis cuantitativos Análisis cuantitativos de datos cuantitativos (Estadística)
Más detallesINDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica
INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables
Más detallesMódulo de Estadística
Módulo de Estadística Tema 2: Estadística descriptiva Tema 2: Estadísticos 1 Medidas La finalidad de las medidas de posición o tendencia central (centralización) es encontrar unos valores que sinteticen
Más detallesY accedemos al cuadro de diálogo Descriptivos
SPSS: DESCRIPTIVOS PROCEDIMIENTO DE ANÁLISIS INICIAL DE DATOS: DESCRIPTIVOS A diferencia con el procedimiento Frecuencias, que contiene opciones para describir tanto variables categóricas como cuantitativas
Más detallesFLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional
FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- Estadística variable unidimensional 1. Conceptos de Estadística 2. Distribución de frecuencias 2.1. Tablas de valores con variables continuas 3. Parámetros
Más detallesMétodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va
Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Jesús Fernández Fernández Carmen María Sordo García DEPARTAMENTO DE MATEMÁTICA APLICADA Y CIENCIAS DE LA COMPUTACIÓN UNIVERSIDAD DE CANTABRIA
Más detallesRepaso Estadística Descriptiva
Grado en Fisioterapia, 2010/11 Cátedra de Bioestadística Universidad de Extremadura 13 de octubre de 2010 Índice Descriptiva de una variable 1 Descriptiva de una variable 2 Índice Descriptiva de una variable
Más detallesNOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2011
NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2011 CÓMO CARACTERIZAR UNA SERIE DE DATOS? POSICIÓN- dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos CENTRALIZACIÓN-
Más detallesUnidad I: Descripción y gráficos estadísticos
Unidad I: Descripción y gráficos estadísticos A. Objetivo General: Proporcionar los conceptos y métodos necesarios de la Estadística para que el estudiante pueda organizar y resumir datos a partir de una
Más detallesESTADÍSTICA UNIDIMENSIONAL
ESTADÍSTICA UNIDIMENSIONAL DEFINICIÓN DE VARIABLE Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población. TIPOS DE VARIABLE ESTADÍSTICAS Ø Variable
Más detallesx i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x
MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas Datos no agrupados: x 1, x 2,...,x n x= x 1 +x 2 +... x n n n i=1 = n Ejemplo: dados los valores: X = 1, 4, 16, 11, 3, 6, su media es
Más detallesESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA Definición de Estadística: La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer
Más detallesEstadística. Análisis de datos.
Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un
Más detallesMódulo de Estadística
Módulo de Estadística Tema 1: Introducción a la Estadística Tema 1: Introdución 1 -ÍNDICE Introducción Estadística descriptiva Estadística descriptiva bivariante y regresión lineal. Probabilidad Módelos
Más detallesSEMINARIO 2. Introducción a la presentación de resultados científicos
SEMINARIO 2 Introducción a la presentación de resultados científicos 1. Las variables de estudio 2. Estadística descriptiva 3. Gráficos descriptivos de las variables Histogramas Gráficos de caja-bigotes
Más detallesConceptos básicos de inferencia estadística (III): Inferencia no paramétrica: Contrastes de bondad de ajuste.
Conceptos básicos de inferencia estadística (III): Inferencia no paramétrica: Contrastes de bondad de ajuste. Tema 1 (III) Estadística 2 Curso 08/09 Tema 1 (III) (Estadística 2) Contrastes de bondad de
Más detallesEstadísticos Descriptivos
ANÁLISIS EXPLORATORIO DE DATOS El análisis exploratorio tiene como objetivo identificar el modelo teórico más adecuado para representar la población de la cual proceden los datos muéstrales. Dicho análisis
Más detalles2. DESCRIPCIÓN ESTADÍSTICA DE UNA VARIABLE. EJEMPLOS Y EJERCICIOS *.
2. DESCRIPCIÓN ESTADÍSTICA DE UNA VARIABLE. EJEMPLOS Y EJERCICIOS *. 2.1. Ejemplos. Ejemplo 2.1 Se ha medido el grupo sanguíneo de 40 individuos y se han observado las siguientes frecuencias absolutas
Más detallesEstadística Descriptiva
M. en C. Juan Carlos Gutiérrez Matus Instituto Politécnico Nacional 2004 IPN UPIICSA c 2004 Juan C. Gutiérrez Matus Desde la segunda mitad del siglo anterior, el milagro industrial sucedido en Japón, hizo
Más detallesEstadística para el análisis de los Mercados S2_A1.1_LECV1
5. Parámetros estadísticos. 5.1. Parámetros de centralización. Estos parámetros nos indican en torno a que puntos se encuentran los valores de la variable cuantitativa en estudio. Es la forma de representar
Más detallesMEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros
MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN Lic. Esperanza García Cribilleros ANÁLISIS EXPLORATORIO DE DATOS Diagrama de tallo y hojas Diagrama de caja DESCRIPCIÓN N DE LOS DATOS Tablas
Más detallesFormulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico
Formulario. Estadística Administrativa Módulo 1. Introducción al análisis estadístico Histogramas El número de intervalos de clase, k, se elige de tal forma que el valor 2 k sea menor (pero el valor más
Más detallesESTADÍSTICA SEMANA 2
ESTADÍSTICA SEMANA 2 ÍNDICE CUADROS DE DISTRIBUCIÓN DE FRECUENCIAS Y REPRESENTACIÓN GRÁFICA... 3 APRENDIZAJES ESPERADOS... 3 INTRODUCCIÓN... 3 REPRESENTACIÓN GRÁFICA... 3 MÉTODOS GRÁFICOS:... 3 DIAGRAMAS
Más detallesGuía de Matemática Cuarto Medio
Guía de Matemática Cuarto Medio Aprendizaje Esperado: 1. Conocen distintas maneras de organizar y presentar información incluyendo el cálculo de algunos indicadores estadísticos, la elaboración de tablas
Más detallesFundamentos de Estadística y Simulación Básica
Fundamentos de Estadística y Simulación Básica TEMA 2 Estadística Descriptiva Clasificación de Variables Escalas de Medición Gráficos Tabla de frecuencias Medidas de Tendencia Central Medidas de Dispersión
Más detallesUn estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.
La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta de las siguientes
Más detallesMEDIDAS DE TENDENCIA CENTRAL
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMERICA) MEDIDAS DE TENDENCIA CENTRAL 20/05/2008 Ing. SEMS 2.1 INTRODUCCIÓN En el capítulo anterior estudiamos de qué manera los
Más detallesUniversidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.
Más detallesUNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS FACULTAD DE INGENIERÍA PROYECTO CURRICULAR DE INGENIERÍA DE SISTEMAS
I. IDENTIFICACIÓN DE LA ASIGNATURA ESTADÍSTICA I CÓDIGO DE LA ASIGNATURA 33102106 ÁREA CIENCIAS BASICAS DE INGENIERIA SEMESTRE SEGUNDO PLAN DE ESTUDIOS 1996 AJUSTE 2002 HORAS TOTALES POR SEMESTRE 64 HORAS
Más detallesDatos cuantitativos. Método tabular
Datos cuantitativos Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de
Más detallesIng. Eduardo Cruz Romero w w w. tics-tlapa. c o m
Ing. Eduardo Cruz Romero eduar14_cr@hotmail.com w w w. tics-tlapa. c o m La estadística es tan vieja como la historia registrada. En la antigüedad los egipcios hacían censos de las personas y de los bienes
Más detallesEstadísticas Elemental Medidas de dispersión 3.1-1
Estadísticas Elemental Medidas de dispersión 3.1-1 Medidas de dispersión La variación entre los valores de un conjunto de datos se conoce como dispersión. Cuando la dispersión es grande, los valores se
Más detallesIntroducción a la Estadística Aplicada en la Química
Detalle de los Cursos de Postgrado y Especialización en Estadística propuestos para 2015 1/5 Introducción a la Estadística Aplicada en la Química FECHAS: 20/04 al 24/04 de 2015 HORARIO: Diario de 10:00
Más detallesEstadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central nos proporcionan la descripción significativa de un conjunto de observaciones. Como su nombre lo indica, son datos de una variable que tienden
Más detallesU.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo
U.D.1: Análisis estadístico de una variable Consideraciones iniciales: - Población: Es el conjunto de todos los elementos que cumplen una determinada característica. Ej.: Alumnos del colegio. - Individuo:
Más detallesTema 2 Estadística Descriptiva
Estadística Descriptiva 1 Tipo de Variables 2 Tipo de variables La base de datos anterior contiene la información de 36 alumnos de un curso de Estadística de la Universidad de Talca. En esta base de datos
Más detallesANÁLISIS DESCRIPTIVO DE LOS DATOS DE VARIABLES CUANTITATIVAS
ANÁLISIS DESCRIPTIVO DE LOS DATOS DE VARIABLES CUANTITATIVAS 3datos 2011 Variables CUANTITATIVAS Números con unidad de medida (con un instrumento, o procedimiento, de medición formal) Ej.: Tasa cardiaca;
Más detallesviii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos
Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................
Más detallesESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA DESCRIPTIVA 1. Conceptos Generales Población estadística.- Conjunto de todos los elementos sobre el que recaen las observaciones. Las poblaciones pueden ser: infinitas, p.e. extracciones con
Más detallesUNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO ESCUELA PREPARATORIA TEXCOCO
UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO ESCUELA PREPARATORIA TEXCOCO MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA DATOS NO AGRUPADOS MATERIAL DIDACTICO SOLO VISION ASIGNATURA QUE CORRESPONDE: ESTADISTICA
Más detallesUniversidad Nacional de Mar del Plata. Facultad de Ingeniería. Estadística Básica COMISIÓN 1. 1 Cuatrimestre 2016
Universidad Nacional de Mar del Plata Facultad de Ingeniería Estadística Básica COMISIÓN 1 1 Cuatrimestre 2016 s. La palabra Estadística procede del vocablo Estado, pues era función principal de los Gobiernos
Más detallesDistribuciones de muestreo fundamentales y descripciones de datos Muestreo aleatorio
Distribuciones de muestreo fundamentales y descripciones de datos Muestreo aleatorio En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población),
Más detalles478 Índice alfabético
Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión
Más detallesESTADÍSTICA CICLO 6 CAPACITACIÓN 2000
INTRODUCCIÓN La estadística día a día esta ocupando un lugar importante en nuestra sociedad colaborando así al progreso humano y su bienestar. Aunque en sus comienzos era aplicada únicamente a asuntos
Más detallesTabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud.
1. TABLAS Y GRÁFICOS ESTADÍSTICOS Estadística Es la ciencia que estudia conjunto de datos obtenidos de la realidad. Estos datos son interpretados mediante tablas, gráficas y otros parámetros tales como
Más detallesMedidas de variabilidad (dispersión)
Medidas de posición Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando. Estas medidas permiten conocer diversas características de esta serie de datos. Las
Más detallesTema 6. Variables aleatorias continuas
Tema 6. Variables aleatorias continuas Resumen del tema 6.1. Definición de variable aleatoria continua Identificación de una variable aleatoria continua X: es preciso conocer su función de densidad, f(x),
Más detallesCM0244. Suficientable
IDENTIFICACIÓN NOMBRE ESCUELA ESCUELA DE CIENCIAS NOMBRE DEPARTAMENTO Ciencias Matemáticas ÁREA DE CONOCIMIENTO MATEMATICAS, ESTADISTICA Y AFINES NOMBRE ASIGNATURA EN ESPAÑOL ESTADÍSTICA GENERAL NOMBRE
Más detallesINTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)
TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de
Más detallesAnálisis descriptivo y exploratorio de datos
TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD Análisis descriptivo y exploratorio de datos Francisco M. Ocaña Peinado @ocanapaco http://www.ugr.es/local/fmocan Departamento de Estadística e Investigación
Más detallesLos estadísticos descriptivos clásicos (Robustez)
Los estadísticos descriptivos clásicos (Robustez) MUESTRA 0 0 4 6 8 9 MUESTRA 0 0 4 6 8 57 Nº CASOS Media Mediana Moda Desviación Simetría Curtosis MUESTRA,85 4,74 0, -0.688 MUESTRA 6,77 4.8.7.77 Ambas
Más detallesSelección de fuentes de datos y calidad de datos
Selección de fuentes de datos y calidad de datos ESCUELA COMPLUTENSE DE VERANO 2014 MINERIA DE DATOS CON SAS E INTELIGENCIA DE NEGOCIO Juan F. Dorado José María Santiago . Valores atípicos. Valores faltantes.
Más detallesTeoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Más detallesANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.
ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos
Más detallesESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA DESCRIPTIVA Medidas de tendencia central y de dispersión Giorgina Piani Zuleika Ferre 1. Tendencia Central Son un conjunto de medidas estadísticas que determinan un único valor que define el
Más detallesANALISIS DE FRECUENCIA EN HIDROLOGIA
ANALISIS DE FRECUENCIA EN HIDROLOGIA Luis F. Carvajal Julián D. Rojo Universidad Nacional de Colombia Facultad de Minas Escuela de Geociencias y Medio Ambiente Introducción 1. Los eventos hidrológicos
Más detallesBioestadística: Estadística Descriptiva
Bioestadística: M. González Departamento de Matemáticas. Universidad de Extremadura Bioestadística 1 2 Bioestadística 1 2 Coneptos Básicos ESTADÍSTICA Ciencia que estudia el conjunto de métodos y procedimientos
Más detallesINDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas
INDICE Prefacio XIII 1. Introducción 1.1. la imagen de la estadística 1 1.2. dos tipos de estadísticas 1.3. estadística descriptiva 2 1.4. estadística inferencial 1.5. naturaleza interdisciplinaria de
Más detallesConstrucción de Gráficas en forma manual y con programados
Universidad de Puerto Rico en Aguadilla División de Educación Continua y Estudios Profesionales Proyecto CeCiMaT Segunda Generación Tercer Año Título II-B, Mathematics and Science Partnerships Construcción
Más detallesTEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION
TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION 1. Percentiles, cuartiles y deciies. 2. Estadígrafos de Posición. 3. Sesgo y curtosis o de pastel. Pictogramas. OBJETIVOS DE UNIDAD GENERALES. Que el futuro
Más detallesGobierno de La Rioja MATEMÁTICAS CONTENIDOS
CONTENIDOS MATEMÁTICAS 1.- Números reales Distintas ampliaciones de los conjuntos numéricos: números enteros, números racionales y números reales. Representaciones de los números racionales. Forma fraccionaria.
Más detallesTécnicas de Muestreo Métodos
Muestreo aleatorio: Técnicas de Muestreo Métodos a) unidad muestral elemental: a.1) muestreo aleatorio simple a.2) muestreo (seudo)aleatorio sistemático a.3) muestreo aleatorio estratificado b) unidad
Más detallesPuntuaciones Estándarizadas, Distribución Normal y Aplicaciones. Dra. Noemí L. Ruiz Limardo 2008 Derechos de Autor Reservados, Revisado 2010
Puntuaciones Estándarizadas, Distribución Normal y Aplicaciones Dra. Noemí L. Ruiz Limardo 2008 Derechos de Autor Reservados, Revisado 2010 Objetivos de Lección Conocer características principales de una
Más detallesMÉTODOS CUANTITATIVOS. Freddy Higuera Departamento de Ingeniería Industrial Universidad Católica del Norte
MÉTODOS CUANTITATIVOS Freddy Higuera Departamento de Ingeniería Industrial Universidad Católica del Norte Estadística La estadística tradicionalmente ha sido clasificada en dos tipos, la estadística descriptiva
Más detalles1. La Distribución Normal
1. La Distribución Normal Los espacios muestrales continuos y las variables aleatorias continuas se presentan siempre que se manejan cantidades que se miden en una escala continua; por ejemplo, cuando
Más detallesTIPOS DE DATOS Y SU TABULACIÓN
PreUnAB Clase # 24 Noviembre 2014 CONCEPTOS BÁSICOS DE ESTADÍSTICA Estadística: Ciencia que estudia los métodos y técnicas para obtener datos provenientes de fenómenos aleatorios, para organizarlos, presentarlos
Más detallesINGENIERO EN COMPUTACION TEMA 1.2: PRESENTACIÓN GRÁFICA DE DATOS
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO CENTRO UNIVERSITARIO UAEM ZUMPANGO INGENIERO EN COMPUTACION TEMA 1.2: PRESENTACIÓN GRÁFICA DE DATOS ELABORÓ: M. EN C. LUIS ENRIQUE KU MOO FECHA: Agosto de 2016
Más detallesUNIDAD 7 Medidas de dispersión
UNIDAD 7 Medidas de dispersión UNIDAD 7 MEDIDAS DE DISPERSIÓN Al calcular un promedio, por ejemplo la media aritmética no sabemos su representatividad para ese conjunto de datos. La información suministrada
Más detallesTema 9: Estadística en dos variables (bidimensional)
Tema 9: Estadística en dos variables (bidimensional) 1. Distribución de frecuencias bidimensional En el tema anterior se han estudiado las distribuciones unidimensionales obtenidas al observar sólo un
Más detallesUnidad Temática 1 Estadística descriptiva y análisis de datos
Unidad Temática 1 Estadística descriptiva y análisis de datos Responda verdadero o falso. Coloque una letra V a la izquierda del número del ítem si acepta la afirmación enunciada, o una F si la rechaza.
Más detallesMatemáticas. Selectividad ESTADISTICA COU
Matemáticas Selectividad ESTADISTICA COU 1. Un dentista observa el Nº de Caries en cada uno de los 100 niños de cierto colegio. La información obtenida aparece resumida en la siguiente tabla. Nº Caries
Más detallesESTADISTICA Y PROBABILIDAD ESTADÍSTICA
ESTADÍSTICA La estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comprobaciones y sacar conclusiones. Un estudio estadístico consta
Más detallesProbabilidad y Estadística, EIC 311
Probabilidad y Estadística, EIC 311 Medida de resumen 1er Semestre 2016 1 / 105 , mediana y moda para datos no Una medida muy útil es la media aritmética de la muestra = Promedio. 2 / 105 , mediana y moda
Más detallesEstadística descriptiva y métodos diagnósticos
2.2.1. Estadística descriptiva y métodos diagnósticos Dra. Ana Dorado Díaz Consejería de Sanidad Diplomado en Salud Pública Diplomado en Salud Pública - 2 Objetivos específicos 1. El alumno aprenderá a
Más detallesUniversidad de Sonora Departamento de Matemáticas Área Económico Administrativa
Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa Materia: Estadística I Maestro: Dr. Francisco Javier Tapia Moreno Semestre: 2017-1 Introducción Una variable estadística
Más detalles+ f 2. + f 3. p i. =h i 100. F i. = f i. H i. = h i. P i. = p i
OCIOES de ESTADÍSTICA En las tablas estadísticas se pueden tabular, entre otros, los siguientes aspectos: La frecuencia absoluta ( f i ), es decir, el número de veces que aparece un determinado valor en
Más detallesNOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012
NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012 Matilde Ungerovich- mungerovich@fisica.edu.uy DEFINICIÓN PREVIA: Distribución: función que nos dice cuál es la probabilidad de que cada suceso
Más detallesCAPÍTULO 6: VARIABLES ALEATORIAS
Página 1 de 11 CAPÍTULO 6: VARIABLES ALEATORIAS En el capítulo 4, de estadística descriptiva, se estudiaron las distribuciones de frecuencias de conjuntos de datos y en el capítulo 5 se trataron los fundamentos
Más detallesNada en esta maravillosa vida es 100% seguro. En todo lo que hacemos, siempre estamos estimando los chances de resultados exitosos: en los negocios,
Nada en esta maravillosa vida es 1% seguro. En todo lo que hacemos, siempre estamos estimando los chances de resultados exitosos: en los negocios, en la medicina, en el clima y principalmente en los juegos
Más detallesLa amplitud del intervalo ( ) se determina considerando un número dado de intervalos ( ) y el rango obtenido, esto es:
La estadística es una materia dedicada a la recopilación, organización, estudio y análisis de datos de un hecho en particular. La estadística descriptiva tabula, representa y describe una serie de datos
Más detallesCurso de nivelación Estadística y Matemática
Curso de nivelación Estadística y Matemática Primera clase: Estadística Descriptiva Programa Técnico en Riesgo, 2016 Agenda 1 Tipos de variables y niveles de medición 2 3 Tipos de variables Variables Cuantitativas
Más detalles3. Correlación. Introducción. Diagrama de dispersión
1 3. Correlación Introducción En los negocios, no todo es el producto, pueden existir factores relacionados o externos que modifiquen cómo se distribuye un producto. De igual manera, la estadística no
Más detallesLa desviación típica y otras medidas de dispersión
La desviación típica y otras medidas de dispersión DISPERSIÓN O VARIACIÓN La dispersión o variación de los datos intenta dar una idea de cuan esparcidos se encuentran éstos. Hay varias medidas de tal dispersión,
Más detallesTEMA 7 EL MODELO DE LA CURVA NORMAL. CONCEPTO Y APLICACIONES
TEMA 7 EL MODELO DE LA CURVA NORMAL. CONCEPTO Y APLICACIONES 1. Puntuaciones diferenciales y puntuaciones típicas 2. La curva normal 3. Cálculo de áreas bajo la curva normal 3.1. Caso 1: Cálculo del número
Más detalles