Estadística Descriptiva
|
|
|
- Juan Manuel Ruiz Acuña
- hace 10 años
- Vistas:
Transcripción
1 Estadística Descriptiva Observamos datos provenientes de una o varias muestras de la población bajo estudio. El objetivo es obtener conclusiones sobre toda la población a partir de la muestra observada. Población: todos los individuos que poseen la(s) característica(s) de interés. Muestra: subconjunto de la población Población > Muestra < Inferencia Factores necesarios para un buen análisis estadístico: Diseño del Experimento o Investigación Calidad de los Datos
2 Examinaremos los datos en forma descriptiva para: Organizar la información Sintetizar la información Ver sus características más relevantes Presentar la información Métodos de Estadística de Inferencia: - Estimación Puntual - Estimación por Intervalos - Tests de Hipótesis Las técnicas del análisis exploratorio nos ayudan a organizar la información que nos dan los datos, de manera de detectar algún patrón de comportamiento así como también apartamientos importantes al modelo subyacente. Nos guían a la estructura subyacente en los datos de manera rápida y simple.
3 Qué observamos? Cualquier característica de un individuo u objeto que nos resulte de interés y la expresaremos numéricamente VARIABLE Variable > Dato sujeto Ejemplo: Sexo: Hombre (0) Mujer (1) Edad: Peso
4 Sexo es una variable categórica, mientras que Edad y Peso son cuantitativas. Comenzaremos por tratar las variables de tipo cuantitativas. Gráficos de Tallo y Hoja Nos dan una primera aproximación rápida a la distribución de los datos sin perder de vista las observaciones. 1. Separamos a cada observación en dos partes: tallo y hoja 2. Listamos en forma vertical y creciente los tallos y agregamos las hojas a la derecha del tallo correspondiente
5 Ejemplo: La siguiente tabla muestra los datos de la fuerza compresión de 45 muestras de aleación de Aluminio-Litio Ordenamos los datos Elegimos un número de dígitos: 2 en este caso 2. Separamos los dígitos de los restantes, nos quedan 8 tallos de 8 a Obtenemos las hojas
6 Ejemplo. Consideremos el segundo dato: 8 9 TALLO HOJA 4. Elegimos cuantos dígitos a la derecha de cada número que corresponderán a las hojas: 1 en este caso. 5. Separamos esos dígitos, que constituirán los tallos. En este caso obtendremos 8 tallos, de 8 a
7 Qué podemos ver en este diagrama? Forma de la distribución: simetría, asimetría a derecha, asimetría a izquierda Posición del centro de la distribución y concentración de los datos Desviaciones marcadas respecto al comportamiento general: outliers Ejemplo: Los siguientes datos corresponden a tiempos de falla de de cables Kevlar 49/epoxy sometidos a una presión del 90%: TIEMPOS DE FALLA El esquema de tallo y hoja que nos da R es:
8 kevlar<- read.table("c:\\users\\ana\\estadisticaq\\2012\\kevlar.txt",header=t) names(kevlar) [1] "per90" "per80" "per70" attach(kevlar) stem(per90) The decimal point is at the Se observa asimetría a derecha y un valor alejado del resto: 7.8
9 Ejemplo: Concentración de Inmunoglobulina en 298 niños sanos entre 6 meses y 6 años de edad. Veamos, como ejemplo, el esquema de tallo y hoja que construye el paquete SX * * * En este caso cada tallo ha sido dividido en 5 líneas.
10 Como lo hace R: inmuno<- read.table("c:\\users\\ana\\estadisticaq\\2012\\inmuno.txt",header=t) names(inmuno) [1] "IGM" attach(inmuno) stem(igm)
11 Hay reglas heurísticas para elegir el número de tallos. En general, estos van entre 8 y 20. Cuando el volumen de datos es muy grande conviene usar otro tipo de gráficos que también son de fácil interpretación. Otra forma de representación de los datos es la de los histogramas. Histogramas Dividimos el rango donde yacen los n datos en intervalos o clases, que no se superponen. Las clases deben ser excluyentes y exhaustivas. Contamos la cantidad de datos en cada intervalo o clase, es decir la frecuencia. También podemos usar para cada intervalo la frecuencia relativa fr i fi n Graficamos el histograma en un par de ejes coordenados representando en las abscisas los intervalos y sobre cada uno de ellos un rectángulo cuya área es proporcional a la frecuencia relativa de dicho intervalo.
12 Obs.: No existen criterios óptimos para elegir la cantidad de intervalos. En general, entre 8 y 15 intervalos deberían ser suficientes. Muchos o muy pocos intervalos puede ser poco informativo. Se busca un equilibrio entre un histograma muy irregular y uno demasiado suavizado. No es necesario que todos los intervalos tengan la misma longitud, pero es recomendable que así sea. Esto facilita la lectura. El histograma representa la frecuencia o la frecuencia relativa a través del área y no a través de la altura. Es recomendable tomar Altura del rectángulo = frecuencia relativa Long. del intervalo De esta manera el área es 1 y dos histogramas son fácilmente comparables independientemente de la cantidad de observaciones en las que se basa cada uno.
13 Ejemplo: Porcentajes de octanos para mezclas de naftas Clase Frecuenci a f i Frecuencia relativa fr i [84, 86] (86, 88] (88, 90] (90,92] (92,94] (94,96] (96,98] Total 42 1
14 Los comandos son hist(octanos.per,freq=t) hist(octanos.per,freq=f) (para graficar escala densidad) Histogramas para datos de OCTANOS Escala Densidad Escala Frecuencia octanos octanos
15 Ejemplo: Concentración de Inmunoglobulina En este ejemplo vemos cómo la elección del ancho de las clases afecta el gráfico. Longitud de Clase= 0.1 g/l Longitud de Clase= 0.2 g/l Longitud de Clase=1g/l
16 Qué podemos ver en un histograma? Rango de variación de los datos (Mínimo Máximo) Intervalos o intervalos más frecuentes Simetría o Asimetría Asimetría Un conjunto de datos que no se distribuye simétricamente, se llama asimétrico. La asimetría puede verse en el esquema de Tallo y Hoja o en el Histograma. También se puede apreciar a través de la posición relativa entre media y mediana. En un boxplot lo haremos a través de la posición relativa entre la mediana y los cuartiles. Un histograma tendería a tener las siguientes formas según cada caso: Asimétrica a derecha Simétrica Asimétrica a Izquierda
17 Medidas de Resumen Resumiremos la información de los datos mediante medidas de fácil interpretación que reflejen sus características más relevantes. La mediada a elegir dependerá de cada problema. Medidas de Posición o Centrado Cuál es el valor central o que mejor representa a los datos? Buscamos un valor típico que represente a los datos. Si la distribución es simétrica diferentes medidas darán resultados similares y hay un claro valor de centrado. Si es asimétrica no existe un centro evidente y diferentes criterios para resumir los datos pueden diferir considerablemente, en tanto tratan de captar diferentes aspectos de los mismos.
18 Promedio o Media Muestral Sumamos todas las observaciones y dividimos por el número total datos. x x x... x 1 2 n Promedio o Media Muestral n
19 Ejemplo: Fuerza de compresión de muestras de Aleación de Aluminio-Litio x 45 i 1 45 x i Es el punto de equilibrio del conjunto de datos. X s: 1, 2, 2, X s: 1, 2, 2, Es una medida muy sensible a la presencia de datos anómalos (outliers).
20 Mediana Muestral Es una medida del centro de los datos en tanto divide a la muestra ordenada en dos partes de igual tamaño. Deja la mitad de los datos a cada lado. Sean los estadísticos de orden muestrales: definamos como mediana x (1) x (2)... x (n) ~ x x ( k ) x ( k 1) 2 x ( k 1) si si n 2k 1 n 2k Si la distribución es simétrica la mediana y la media identifican al mismo punto. La mediana es resistente a la presencia de datos atípicos.
21 Si tenemos: X s: 1,2,2,3 2 x ~ x 2 X s: 1,2,2,7 3 x ~ x 2 Qué pasa si tenemos un 70 en lugar de 7? x ~ x 2 Si tenemos una muestra de salarios de una población dada, sería más adecuado tomar la media o la mediana muestral para representarlos?
22 Medias -Podadas Es un promedio calculado sobre los datos una vez que se han eliminado % de los datos más pequeños y un % de los datos más grandes. Formalmente podemos definirla como: x x ([ n ] 1)... x( n [ n ]) n 2[ n ] Ejemplo: Sea el siguiente conjunto de 10 observaciones, ya ordenadas X s: y calculemos la media 0.10-podada. Como el 10% de 10 es 1, debemos podar 1 dato en cada extremo y calcular el promedio de los 8 datos restantes, es decir x
23 La mediana puede ser vista como una 50% media podada. Es una medida intermedia entre la media y la mediana Es más resistente a datos atípicos que la media. Cómo elegimos? Depende de cuantos outliers se pretende excluir y de cuán robusta queremos que sea la medida de posición. Cuando seleccionamos = 0 tenemos la media, si elegimos el máximo valor posible para (lo más cercano posible a 0.5) tenemos la mediana. Cualquier poda intermedia representa un compromiso entre ambas. Una elección bastante común es = 0.10, que excluye un 20% de los datos.
24 Ejemplo: calculamos las tres medidas de posición. Los datos en la siguiente tabla corresponden al número de pulsaciones por minuto en pacientes con asma durante un espasmo: Ordenamos los datos: x ~ x 143 x
25 Medidas de Dispersión o Variabilidad: Cuán dispersos están los datos? Cuán cercanos son los datos al valor típico? Supongamos que tenemos datos x x,..., 1, 2 xn X s: Y s: X ~ X Y ~ Y 5 6 Cómo medir la diferencia que se observa entre ambas muestras?
26 Rango Muestral Se define como la diferencia entre el valor más grande y el pequeño de los datos: Rango = máx(x i ) mín(x i ) Ejemplo: en nuestros conjuntos de datos: Rango (X) = 10 Rango(Y)= 6 Esta medida es muy sensible a la presencia de outliers. Veamos otro ejemplo: X s: Y s: X Y ~ X ~ Y Rango( X ) Rango( Y )
27 Varianza Muestral Es una medida de la variabilidad de los datos alrededor de la media muestral. Varianza muestral : S 2 n i 1 ( x i x) n 1 2 Desvío estándar muestral : S 2 S Ejemplo: en los dos ejemplos anteriores obtenemos S 2 x= 20.5 S x = S 2 y= 12.5 S y = 3.536
28 El desvío estándar tiene las mismas unidades que los datos, mientras que la varianza no. Al basarse en promedios, estas medidas son sensibles a la presencia de datos atípicos. Por ejemplo, si en la muestra de los Y s cambiamos el 10 por un 15 obtenemos S 2 Y= 30 y S Y = 5.477, mientras que si lo cambiamos por un 20 obtenemos S 2 Y= 57.5 y S Y = Distancia Intercuartil Es una medida basada en el rango de los datos centrales de la muestra y más resistente que el desvío estándar. Comenzaremos por definir los percentiles. El percentil 100 % de la muestra es el valor por debajo del cual se encuentra el 100 % de los datos en la muestra ordenada. Para calcularlo: Ordenamos la muestra de menor a mayor Buscamos el dato que ocupa la posición ( n 1) en la muestra ordenada. Si este número no es entero se interpolan los dos adyacentes.
29 Ejemplo: Tenemos 19 datos que ordenados son Percentil Posición Valor 10% 0.10 (19+1) = % 0.25 (19+1) = 5 3 Cuartil Inferior 50% 0.50 (19+1) = 10 6 Mediana 75% 0.75(19+1) = 15 9 Cuartil Superior 95% 0.95(19+1) = Notemos que el percentil 50% (o segundo cuartil) coincide con la mediana. Llamaremos cuartil inferior (o primer cuartil) al percentil 25% y cuartil superior (o tercer cuartil) al percentil 75%. Los cuartiles y la mediana dividen a la muestra ordenada en cuatro partes igualmente pobladas (aproximadamente un 25 % de los datos en cada una de ellas). Entre los cuartiles se hallan aproximadamente el 50% central de los datos y el rango de éstos es: d I =distancia intercuartil= cuartil superior - cuartil inferior
30 Observación: Si en ejemplo cambiáramos el último dato por 110, la distancia intercuartil no cambiaría, mientras que el desvío pasaría de 3.2 a 24.13!!!! Cuartos y Distancia entre Cuartos Una medida muy cercana a los cuartiles inferior y superior son el cuarto inferior y el cuarto superior. Se calculan de la siguiente manera: Se ordena la muestra y se calcula la mediana de los datos. Dividimos a la muestra ordenada en dos partes: la primera corresponde a los datos más pequeños que la mediana y la segunda parte a la los datos más grandes que la mediana Si el tamaño de la muestra es par, el cuarto inferior es la mediana de la primera mitad, mientras que el cuarto superior es la mediana de la segunda mitad. Si el tamaño de la muestra es impar, a la primera y a la segunda parte se las expande agregándoseles a cada una de ellas la mediana de todos los datos. El cuarto inferior es la mediana de la primera parte expandida y el cuarto superior es la mediana de la segunda parte expandida. Es decir, en el caso impar, la mediana interviene en el cómputo de los dos cuartos. Definimos la distancia entre cuartos como: d C =distancia entre cuartos= cuarto superior-cuarto inferior
31 Ejemplo: Consideremos las siguientes muestras ordenadas Cuarto inferior=3 Cuarto inferior= Cuarto superior=8 Cuarto superior=7.5 Desvío Absoluto Mediano (Desviación absoluta respecto de la Mediana) MAD Es una versión robusta del desvío estándar basada en la mediana. Definimos la MAD como: MAD mediana x ~ x i
32 Cómo calculamos la MAD? Ordenamos los datos de menor a mayor. Calculamos la mediana. Calculamos la distancia de cada dato a la mediana. Despreciamos el signo de las distancias y las ordenamos de menor a mayor. Buscamos la mediana de las distancias sin signo. Observación: Si deseamos comparar la distancia intercuartil y la MAD con el desvío standard es conveniente dividirlas por constantes adecuadas. En ese caso se compara a S mediante 5 Números de Resumen MAD d I 1.35 Los 5 números de resumen de la distribución de un conjunto de datos consisten en: el mínimo, el cuartil inferior, la mediana, el cuartil superior y el máximo.
33 Ejemplo: Los siguientes datos corresponden a tiempos de CPU (en segundos) de 25 trabajos enviados a un server tomados al azar. CPU Calculamos los 5 números resumen y la media muestral para este conjunto de datos stem(cpu) CPU N = 25 Mediana = 1.38 Quartiles = 0.82, 2.16 Decimal point is at the colon 0 : : : : : 7
34 Boxplots Con las medidas anteriores podemos construir un gráfico de fácil realización y lectura. Cómo lo hacemos? Vamos a dar una versión, pero vale la pena advertir que hay variaciones de un programa a otro. 1. Representamos una escala vertical u horizontal 2. Dibujamos una caja cuyos extremos son los cuartiles y dentro de ella un segmento que corresponde a la mediana. 3. A partir de cada extremo dibujamos un segmento hasta el dato más alejado que está a lo sumo 1.5 d I del extremo de la caja. Estos segmentos se llaman bigotes. 4. Marcamos con * a aquellos datos que están entre 1.5 d I y 3 d I de cada extremo y con o a aquellos que están a más de 3 d I de cada extremo. Algunos paquetes indican a todos los outliers de la misma forma.
35 Observación: Muchos paquetes estadísticos realizan el boxplot usando los cuartos y la distancia entre cuartos en lugar de la distancia intercuartil. Como estas medidas son muy próximas, en general los resultados son análogos. Lo importante es que entre los cuartos o entre los cuartiles yace aproximadamente el 50% central de los datos. ESQUEMA de BOXPLOT
36 Ejemplo: El box-plot correspondiente a los tiempos de CPU es el siguiente CPU Es interesante observar que en el boxplot se indica a uno de los datos como outlier, mientras que en el análisis anterior esto no parecía evidente.
37 A partir de un box-plot podemos podemos apreciar los siguientes aspectos de la distribución de un conjunto de datos: * posición * dispersión * asimetría * longitud de las colas * puntos anómalos o outliers. Los box-plots son especialmente útiles para comparar varios conjuntos de datos, pues nos dan una rápida impresión visual de sus características. Outliers: Los métodos que hemos visto nos permiten identificar puntos atípicos, que pueden aparecer en una o más variables. Su detección es importante pues pueden determinar o influenciar fuertemente los resultados de un análisis estadístico clásico, pues muchas de las técnicas habitualmente usadas son muy sensibles a la presencia de datos atípicos.
38 Ejemplo: Supongamos que se dispone de otros 25 datos correspondientes a tiempos de CPU enviados a otro server. Si realizamos boxplots paralelos para ambos conjuntos de datos obtenemos el siguiente gráfico er. server 2do. server La simple comparación de los boxplots obtenidos revela que los trabajos enviados al segundo server son más largos. De hecho, el 75% de los trabajos muestreados en el segundo server tienen tiempos de CPU mayores que el cuartil superior de los trabajos muestreados en el primer server.
39 Ejemplo: Con el fin de estudiar las diferencias entre 4 laboratorios se miden 25 muestras con una concentración de analito de 50mg kg -1. Se analizan los datos correspondientes a 25 mediciones realizadas en 4 laboratorios. Veamos que da este análisis. LAB1 LAB2 LAB3 LAB4 N MEAN SD MINIMUM ST QUARTI MEDIAN RD QUARTI MAXIMUM MAD
40 boxplot(lab1,lab2,lab3,lab4) abline(h=50,col="red")
41 Ejemplo: Los siguientes boxplots corresponden a datos de concentración máxima diaria en partes por mil millones de dióxido de azufre en Bayonne, en el estado de Nueva Jersey, desde noviembre de 1969 hasta octubre de 1972 agrupados por meses. Hay 36 grupos de datos, cada uno de tamaño aproximadamente 30. Los boxplots muestran algunas características de estos datos en forma muy rápida. Hay una reducción general de la concentración de dióxido de azufre a lo largo del tiempo debida a la conversión gradual en la zona al uso de combustibles con baja concentración de azufre. Esta disminución es más fuerte para los cuartiles superiores. También se muestran concentraciones más elevadas para los meses de invierno debido al uso de calderas a petróleo. Claramente se ve un efecto cíclico y amortiguado. Los boxplots muestran una distribución asimétrica a derecha, con presencia de outliers en algunos meses, y que la dispersión de la distribución es mayor cuando el nivel general de la concentración es más alto.
42
43 QQ-plot El qq-plot es un gráfico que nos sirve para evaluar la cercanía a la distribución normal. Para realizarlo se consideran los estadísticos de orden x (1) x (2)... x (n) i 1/ 3 que se grafican versus el percentil n 1/ 3 toman variaciones de estos valores) i 1/3 de la normal, es decir 1 ( ) (algunos programas n 1/ 3 Si los datos provienen de una distribución normal esperamos que el gráfico sea parecido a una recta. El alejamiento de la normalidad se ve reflejado por la forma del gráfico.
44 qqnorm(octanos.per,ylab="octanos" ) qqline(octanos.per, col = 2)
45 qqnorm(per90,ylab="datos KEVLAR" ) qqline(per90, col = 2)
46 qqnorm(igm,ylab="datos de Inmunoglobulina" ) qqline(igm, col = 2)
47
48
Estadística Descriptiva o Análisis Exploratorio de Datos
Estadística Descriptiva o Análisis Exploratorio de Datos onos ayudan a organizar la información que nos dan los datos de manera de detectar algún patrón de comportamiento así como también apartamientos
Etapas de una investigación
Etapas de una investigación La Estadística nos permite realizar inferencias y sacar conclusiones a partir de los datos. Extrayendo la información contenida en los datos, podremos comprender mejor las situaciones
Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS
ANÁLISIS DE DATOS Hoy día vamos a hablar de algunas medidas de resumen de datos: cómo resumir cuando tenemos una serie de datos numéricos, generalmente en variables intervalares. Cuando nosotros tenemos
Parámetros y estadísticos
Parámetros y estadísticos «Parámetro»: Es una cantidad numérica calculada sobre una población y resume los valores que esta toma en algún atributo Intenta resumir toda la información que hay en la población
Otras medidas descriptivas usuales
Tema 7 Otras medidas descriptivas usuales Contenido 7.1. Introducción............................. 1 7.2. Medidas robustas.......................... 2 7.2.1. Media recortada....................... 2 7.2.2.
ANÁLISIS DESCRIPTIVO CON SPSS
ESCUELA SUPERIOR DE INFORMÁTICA Prácticas de Estadística ANÁLISIS DESCRIPTIVO CON SPSS 1.- INTRODUCCIÓN Existen dos procedimientos básicos que permiten describir las propiedades de las distribuciones:
Ejercicio de estadística para 3º de la ESO
Ejercicio de estadística para 3º de la ESO Unibelia La estadística es una disciplina técnica que se apoya en las matemáticas y que tiene como objetivo la interpretación de la realidad de una población
CUESTIONES DE AUTOEVALUACIÓN (TEMA 1)
CUESTIONES DE AUTOEVALUACIÓN (TEMA 1) Cuestiones de Verdadero/Falso 1. Un estadístico es una característica de una población. 2. Un parámetro es una característica de una población. 3. Las variables discretas
Anexo 4. Herramientas Estadísticas
Anexo 4 Herramientas Estadísticas La estadística descriptiva es utilizada como una herramienta para describir y analizar las características de un conjunto de datos, así como las relaciones que existen
Representaciones Gráficas
Representaciones Gráficas Gráficos para variables cualitativas Los gráficos más usuales para representar variables de tipo nominal son los siguientes: Diagramas de barras: Se representa en el eje de ordenadas
Probabilidad y Estadística Profesorados y Licenciatura en Computación Guía N 1: Estadística descriptiva
Probabilidad y Estadística Profesorados y Licenciatura en Computación Guía N 1: Estadística descriptiva Ejercicio 1: El histograma que presentamos a continuación muestra la distribución de notas finales
MATEMÁTICAS CON LA HOJA DE CÁLCULO
MATEMÁTICAS CON LA HOJA DE CÁLCULO Podemos dar a esta aplicación un uso práctico en el aula de Matemáticas en varios sentidos: Como potente calculadora: sucesiones, límites, tablas estadísticas, parámetros
Asignatura: Econometría. Conceptos MUY Básicos de Estadística
Asignatura: Econometría Conceptos MUY Básicos de Estadística Ejemplo: encuesta alumnos matriculados en la UMH Estudio: Estamos interesados en conocer el nivel de renta y otras características de los estudiantes
Tema 2 Estadística Descriptiva
Estadística Descriptiva 1 Tipo de Variables 2 Tipo de variables La base de datos anterior contiene la información de 2700 individuos con 8 variables. Los datos provienen de una encuesta nacional realizada
Clase 2: Estadística
Clase 2: Estadística Los datos Todo conjunto de datos tiene al menos dos características principales: CENTRO Y DISPERSIÓN Los gráficos de barra, histogramas, de puntos, entre otros, nos dan cierta idea
SENA: CENTRO BIOTECNOLOGIA INDUSTRIAL PROGRAMA DE FORMACIÓN: TECNOLOGO GESTION LOGISTICA
Por población o universo se entiende como un conjunto de medidas, cuando estas son aplicadas a una característica cuantitativa, o como el recuento de todas las unidades que presentan una característica
Estadística. Conceptos de Estadística. Un individuo o unidad estadística es cada uno de los elementos que componen la población.
Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta
Medidas de tendencia central o de posición: situación de los valores alrededor
Tema 10: Medidas de posición y dispersión Una vez agrupados los datos en distribuciones de frecuencias, se calculan unos valores que sintetizan la información. Estudiaremos dos grandes secciones: Medidas
ESTADÍSTICA SEMANA 4
ESTADÍSTICA SEMANA 4 ÍNDICE MEDIDAS DE DISPERSIÓN... 3 APRENDIZAJES ESPERADOS... 3 DEfinición de Medida de dispersión... 3 Rango o Recorrido... 3 Varianza Muestral (S 2 )... 3 CÁLCULO DE LA VARIANZA...
Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL
1. Introducción ESTADÍSTICA CO EXCEL La estadística es la rama de las matemáticas que se dedica al análisis e interpretación de series de datos, generando unos resultados que se utilizan básicamente en
HERRAMIENTAS DE APOYO PARA LA IMPLEMENTACIÓN DE LA GESTIÓN POR PROCESOS EN EL MARCO DE LA POLÍTICA NACIONAL DE MODERNIZACIÓN DE LA GESTIÓN PÚBLICA
HERRAMIENTAS DE APOYO PARA LA IMPLEMENTACIÓN DE LA GESTIÓN POR PROCESOS EN EL MARCO DE LA POLÍTICA NACIONAL DE MODERNIZACIÓN DE LA GESTIÓN PÚBLICA Documento elaborado por la de la Presidencia del Consejo
Criterios para decidir qué gráfico usar en cada trabajo estadístico
Criterios para decidir qué gráfico usar en cada trabajo estadístico No todos los tipos de gráficos son adecuados para un conjunto concreto de datos. Algunos de ellos sólo valen para un fin, y otros se
Análisis y cuantificación del Riesgo
Análisis y cuantificación del Riesgo 1 Qué es el análisis del Riesgo? 2. Métodos M de Análisis de riesgos 3. Método M de Montecarlo 4. Modelo de Análisis de Riesgos 5. Qué pasos de deben seguir para el
Tema 3. Medidas de tendencia central. 3.1. Introducción. Contenido
Tema 3 Medidas de tendencia central Contenido 31 Introducción 1 32 Media aritmética 2 33 Media ponderada 3 34 Media geométrica 4 35 Mediana 5 351 Cálculo de la mediana para datos agrupados 5 36 Moda 6
_ Antología de Física I. Unidad II Vectores. Elaboró: Ing. Víctor H. Alcalá-Octaviano
24 Unidad II Vectores 2.1 Magnitudes escalares y vectoriales Unidad II. VECTORES Para muchas magnitudes físicas basta con indicar su valor para que estén perfectamente definidas y estas son las denominadas
www.fundibeq.org Es de aplicación a aquellos estudios o situaciones en que es necesario priorizar entre un conjunto de elementos.
GRAÁFICOS DE GESTIÓON (LINEALES, BARRAS Y TARTAS) 1.- INTRODUCCIÓN Este documento introduce los Gráficos de Gestión de uso más común y de mayor utilidad: Gráficos Lineales, Gráficos de Barras y Gráficos
TASACION DE INMUEBLES URBANOS
TASACION DE INMUEBLES URBANOS Estadística para Tasadores A tener en cuenta Toda muestra de datos será incompleta Toda muestra es aleatoria Datos desordenados no sirven Calcular valores típicos Encontrar
1 Ejemplo de análisis descriptivo de un conjunto de datos
1 Ejemplo de análisis descriptivo de un conjunto de datos 1.1 Introducción En este ejemplo se analiza un conjunto de datos utilizando herramientas de estadística descriptiva. El objetivo es repasar algunos
Revisión del Universo de empresas para la Estimación de los Datos Del Mercado Español de Investigación de Mercados y Opinión.
Revisión del Universo de empresas para la Estimación de los Datos Del Mercado Español de Investigación de Mercados y Opinión. (Enrique Matesanz y Vicente Castellanos, Año 2011) Según la experiencia acumulada
Covarianza y coeficiente de correlación
Covarianza y coeficiente de correlación Cuando analizábamos las variables unidimensionales considerábamos, entre otras medidas importantes, la media y la varianza. Ahora hemos visto que estas medidas también
GRAFICOS DE CONTROL DATOS TIPO VARIABLES
GRAFICOS DE CONTROL DATOS TIPO VARIABLES PROCESO Maquinaria Métodos Materias Primas Proceso Producto Mano de Obra Condiciones Ambientales VARIACIÓN Fundamentalmente, las cinco fuentes más importantes de
MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL
MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL Las medias de tendencia central o posición nos indican donde se sitúa un dato dentro de una distribución de datos. Las medidas de dispersión, variabilidad o variación
Estadística: conceptos básicos y definiciones.
Estadística: conceptos básicos y definiciones. 1 Conceptos básicos 2 Conceptos básicos cont. 3 Conceptos básicos cont. 4 Conceptos básicos cont. 5 Conceptos básicos cont. 6 Definición de Estadística La
Lección 4: Suma y resta de números racionales
GUÍA DE MATEMÁTICAS II Lección : Suma y resta de números racionales En esta lección recordaremos cómo sumar y restar números racionales. Como los racionales pueden estar representados como fracción o decimal,
Construyendo gráficos estadísticos con ayuda de Microsoft Excel
Construyendo gráficos estadísticos con ayuda de Microsoft Excel Eduardo Aguilar Fernández Universidad Nacional Heredia, Costa Rica [email protected] Andrey Zamora Araya Universidad Nacional Heredia,
Una forma rápida de ordenar datos numéricos (Diagrama de Tallo y Hoja)
Una forma rápida de ordenar datos numéricos (Diagrama de Tallo y Hoja) Los siguientes datos corresponden a los precios de la libra de cobre en la Bolsa de Metales de Londres en Enero de 000. Día Precio
MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN
MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN Suponga que le pedimos a un grupo de estudiantes de la asignatura de estadística que registren su peso en kilogramos. Con los datos del peso de los estudiantes
1.1. Introducción y conceptos básicos
Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................
La ventana de Microsoft Excel
Actividad N 1 Conceptos básicos de Planilla de Cálculo La ventana del Microsoft Excel y sus partes. Movimiento del cursor. Tipos de datos. Metodología de trabajo con planillas. La ventana de Microsoft
PRÁCTICAS DE GESTIÓN GANADERA:
PRÁCTICAS DE GESTIÓN GANADERA: MANEJO DE HOJA DE CÁCULO (EXCEL) 1. INTRODUCCIÓN AL MANEJO DE EXCEL La pantalla del programa consta de una barra de herramientas principal y de una amplia cuadrícula compuesta
1. LA ESTADÍSTICA DESCRIPTIVA
1. LA ESTADÍSTICA DESCRIPTIVA Objetivo Aprender cómo resumir las características más importantes de una muestra de datos. Bibliografia recomendada Peña y Romo (1997), Capítulos 1 5. Newbold (1997) Capítulos
CAPITULO II CARACTERISTICAS DE LOS INSTRUMENTOS DE MEDICION
CAPITULO II CARACTERISTICAS DE LOS INSTRUMENTOS DE MEDICION Como hemos dicho anteriormente, los instrumentos de medición hacen posible la observación de los fenómenos eléctricos y su cuantificación. Ahora
I. Estadística Descriptiva de una variable
I. Estadística Descriptiva de una variable Objetivo: Organizar un conjunto de datos para extraer el máximo posible de información Herramientas: A. Estadísticos: Media, Varianza, moda, etc B. Representaciones
1. MEDIDAS DE TENDENCIA CENTRAL
1. MEDIDAS DE TENDENCIA CENTRAL Lo importante en una tendencia central es calcular un valor central que actúe como resumen numérico para representar al conjunto de datos. Estos valores son las medidas
Aplicaciones de Estadística Descriptiva
Aplicaciones de Estadística Descriptiva Contenidos de la presentación Funciones estadísticas en Excel. Gráficos. El módulo de análisis de datos y las tablas dinámicas de Excel. Información Intentaremos
Temas de electricidad II
Temas de electricidad II CAMBIANDO MATERIALES Ahora volvemos al circuito patrón ya usado. Tal como se indica en la figura, conecte un hilo de cobre y luego uno de níquel-cromo. Qué ocurre con el brillo
Qué requisitos deben cumplir los albaranes o notas de entrega?
Qué requisitos deben cumplir los albaranes o notas de entrega? Los albaranes o notas de entrega, pese a su frecuente uso práctico, suelen ser documentos bastante desconocidos por parte de la mayoría de
CASO PRÁCTICO DISTRIBUCIÓN DE COSTES
CASO PRÁCTICO DISTRIBUCIÓN DE COSTES Nuestra empresa tiene centros de distribución en tres ciudades europeas: Zaragoza, Milán y Burdeos. Hemos solicitado a los responsables de cada uno de los centros que
MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas
Universidad de Cádiz Departamento de Matemáticas MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas Tema 4 La recta en el plano Elaborado por la Profesora Doctora María Teresa
Clase 2: Estadística
Clase 2: Estadística Los datos Todo conjunto de datos tiene al menos dos características principales: CENTRO Y DISPERSIÓN Los gráficos de barra, histogramas, de puntos, entre otros, nos dan cierta idea
ANALISIS MULTIVARIANTE
ANALISIS MULTIVARIANTE Es un conjunto de técnicas que se utilizan cuando se trabaja sobre colecciones de datos en las cuáles hay muchas variables implicadas. Los principales problemas, en este contexto,
Enunciado unidades fraccionarias fracción fracciones equivalentes comparar operaciones aritméticas fracciones propias Qué hacer deslizador vertical
Enunciado Si la unidad la dividimos en varias partes iguales, podemos tomar como nueva unidad de medida una de estas partes más pequeñas. Las unidades fraccionarias son necesarias cuando lo que queremos
15 PARÁMETROS ESTADÍSTICOS
EJERCICIOS PROPUESTOS 1.1 El número de libros leídos por los miembros de un círculo de lectores en un mes se resume en esta tabla. N. o de libros leídos x i N. o de personas f i 1 1 3 18 11 7 7 1 Halla
La calidad de los datos ha mejorado, se ha avanzado en la construcción de reglas de integridad.
MINERIA DE DATOS PREPROCESAMIENTO: LIMPIEZA Y TRANSFORMACIÓN El éxito de un proceso de minería de datos depende no sólo de tener todos los datos necesarios (una buena recopilación) sino de que éstos estén
Control Estadístico de Procesos
Control Estadístico de Procesos Gráficos de Control Los gráficos de control o cartas de control son una importante herramienta utilizada en control de calidad de procesos. Básicamente, una Carta de Control
Estadística Descriptiva
Estadística Descriptiva 1. El porcentaje de algodón en una tela utilizada para elaborar camisas para hombre se presenta en la siguiente tabla. Calcular los estadísticos más importantes y realícese el histograma
Comparaciones de pobreza y desigualdad
Comparaciones de pobreza y desigualdad El problema de la pobreza en una sociedad puede ser evaluado desde tres perspectivas complementarias entre sí : Las medidas de incidencia. Informan acerca de la extensión
Los estados financieros proporcionan a sus usuarios información útil para la toma de decisiones
El ABC de los estados financieros Importancia de los estados financieros: Aunque no lo creas, existen muchas personas relacionadas con tu empresa que necesitan de esta información para tomar decisiones
Para aquellos que tengan conocimientos de Access es lo más parecido a una consulta de referencias cruzadas, pero con más interactividad.
Las tablas dinámicas Crear una tabla dinámica Una tabla dinámica consiste en el resumen de un conjunto de datos, atendiendo a varios criterios de agrupación, representado como una tabla de doble entrada
Población, muestra y variable estadística
Población, muestra y variable estadística La estadística es la parte de las Matemáticas que estudia cómo recopilar y resumir gran cantidad de información para extraer conclusiones. La población de un estudio
Capítulo 10. Gráficos y diagramas
Capítulo 10. Gráficos y diagramas 1. Introducción Los gráficos y diagramas que se acostumbran a ver en libros e informes para visualizar datos estadísticos también se utilizan con propósitos cartográficos,
Planilla de cálculo. Módulo II - OpenOffice.org Calc
Planilla de cálculo Módulo II - OpenOffice.org Calc 1 OpenOffice.org Calc Índice de contenidos Introducción Fórmulas Operadores matemáticos Autorrellenar Una función especial: Autosuma Algunas funciones
Selectividad Septiembre 2009 SEPTIEMBRE 2009. Opción A
SEPTIEMBRE 2009 Opción A 1.- Como cada año, el inicio del curso académico, una tienda de material escolar prepara una oferta de 600 cuadernos, 500 carpetas y 400 bolígrafos para los alumnos de un IES,
Tema 2. Análisis gráfico Ejercicios resueltos 1
Tema 2. Análisis gráfico Ejercicios resueltos 1 Ejercicio resuelto 2.1 En una tienda han anotado los precios de los artículos que han vendido en una hora. Los datos son: 9,95, 19,95, 19,95, 14,95, 29,95,
Índice Introducción Números Polinomios Funciones y su Representación. Curso 0: Matemáticas y sus Aplicaciones Tema 1. Números, Polinomios y Funciones
Curso 0: Matemáticas y sus Aplicaciones Tema 1. Números, Polinomios y Funciones Leandro Marín Dpto. de Matemática Aplicada Universidad de Murcia 2012 1 Números 2 Polinomios 3 Funciones y su Representación
Los números racionales
Los números racionales Los números racionales Los números fraccionarios o fracciones permiten representar aquellas situaciones en las que se obtiene o se debe una parte de un objeto. Todas las fracciones
Artículo V522. Introducción a Google Analytics
Artículo V522. Introducción a Google Analytics Actividad 1 Seleccione el apartado correspondiente al sitio web de Hipertext.net en la cuenta de Analytics del Máster y busque en los informes datos que a
INSTITUCION EDUCATIVA LUIS PATRON ROSANO DOCUMENTO PARA ESTUDIAR LOGROS PENDIENTES DE ESTADISTICA DE 10º
INSTITUCION EDUCATIVA LUIS PATRON ROSANO DOCUMENTO PARA ESTUDIAR LOGROS PENDIENTES DE ESTADISTICA DE 10º DEFINICIÓN DE PARÁMETRO ESTADÍSTICO Un parámetro estadístico es un número que se obtiene a partir
LABORATORIO Nº 2 GUÍA PARA REALIZAR FORMULAS EN EXCEL
OBJETIVO Mejorar el nivel de comprensión y el manejo de las destrezas del estudiante para utilizar formulas en Microsoft Excel 2010. 1) DEFINICIÓN Una fórmula de Excel es un código especial que introducimos
UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL
UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL Objetivo terminal: Calcular e interpretar medidas de tendencia central para un conjunto de datos estadísticos. Objetivos específicos: 1. Mencionar las características
Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos.
Apéndice C. Glosario A Actividades de coordinación entre grupos. Son dinámicas y canales de comunicación cuyo objetivo es facilitar el trabajo entre los distintos equipos del proyecto. Actividades integradas
Fracción másica y fracción molar. Definiciones y conversión
Fracción másica y fracción ar. Definiciones y conversión Apellidos, nombre Atarés Huerta, Lorena ([email protected]) Departamento Centro Departamento de Tecnología de Alimentos ETSIAMN (Universidad Politécnica
Continuidad y ramas infinitas. El aumento A producido por cierta lupa viene dado por la siguiente ecuación: A = 2. lm í
Unidad. Límites de funciones. Continuidad y ramas infinitas Resuelve Página 7 A través de una lupa AUMENTO DISTANCIA (dm) El aumento A producido por cierta lupa viene dado por la siguiente ecuación: A
El concepto de asociación estadística. Tema 6 Estadística aplicada Por Tevni Grajales G.
El concepto de asociación estadística Tema 6 Estadística aplicada Por Tevni Grajales G. En gran medida la investigación científica asume como una de sus primera tareas, identificar las cosas (características
DIAGRAMAS DE CAJA. Apuntes de Métodos Estadísticos I Prof. Gudberto J. León R. I- 79
Apuntes de Métodos Estadísticos I Prof. Gudberto J. León R. I- 79 DIAGRAMAS DE CAJA El diagrama de tallo y hoja y el histograma proporcionan una impresión visual general del conjunto de datos, mientras
Unidad 3 Direccionamiento IP (Subnetting)
Unidad 3 Direccionamiento IP (Subnetting) Las direcciones denominadas IPv4 se expresan por combinaciones de números de hasta 32 bits que permiten hasta 2 32 posibilidades (4.294.967.296 en total). Los
Uso del programa CALC
Uso del programa CALC 1. Introducción. Podemos considerar una hoja de cálculo como una tabla en la que tenemos texto, números y fórmulas relacionadas entre si. La ventaja de usar dicho programa radica
1 Estática Básica Prohibida su reproducción sin autorización. CONCEPTOS DE FISICA MECANICA. Conceptos de Física Mecánica
1 CONCEPTOS DE FISICA MECANICA Introducción La parte de la física mecánica se puede dividir en tres grandes ramas de acuerdo a lo que estudia cada una de ellas. Así, podemos clasificarlas según lo siguiente:
1. Análisis de variables cuantitativas (2 a parte)
Práctica 3: Análisis descriptivo de variables. Parte II. 1. Análisis de variables cuantitativas (2 a parte) Realizaremos un estudio descriptivo completo de variables cuantitativas. Ilustraremos los conceptos
Administración de Empresas. 11 Métodos dinámicos de evaluación de inversiones 11.1
Administración de Empresas. 11 Métodos dinámicos de evaluación de inversiones 11.1 TEMA 11: MÉTODOS DINÁMICOS DE SELECCIÓN DE INVERSIONES ESQUEMA DEL TEMA: 11.1. Valor actualizado neto. 11.2. Tasa interna
Análisis de propuestas de evaluación en las aulas de América Latina
Este trabajo de evaluación tiene como objetivo la caracterización de figuras del espacio. Para ello el alumno debe establecer la correspondencia entre la representación de la figura y algunas de sus propiedades.
MATEMÁTICAS 3º CURSO DE ESO INFORMACIÓN PARA LOS ALUMNOS
I.E.S. Dr. FLEMING (OVIEDO) DEPARTAMENTO DE MATEMÁTICAS MATEMÁTICAS 3º CURSO DE ESO INFORMACIÓN PARA LOS ALUMNOS Estas hojas son un resumen de la Programación Didáctica que está a disposición de los alumnos
Teóricas de Análisis Matemático (28) - Práctica 4 - Límite de funciones. 1. Límites en el infinito - Asíntotas horizontales
Práctica 4 - Parte Límite de funciones En lo que sigue, veremos cómo la noción de límite introducida para sucesiones se etiende al caso de funciones reales. Esto nos permitirá estudiar el comportamiento
FUNDAMENTOS TEÓRICOS BÁSICOS EN LA SONORIZACION PROFESIONAL.
FUNDAMENTOS TEÓRICOS BÁSICOS EN LA SONORIZACION PROFESIONAL. 1.- EFECTOS DEL SONIDO DIRECTO Y EL SONIDO DIFUSO SOBRE LA INTELIGIBILIDAD DE LA PALABRA. 2.-CALCULO DEL NIVEL DE SONIDO DIRECTO Y SONIDO DIFUSO.
Capítulo 3. Estimación de elasticidades
1 Capítulo 3. Estimación de elasticidades Lo que se busca comprobar en esta investigación a través la estimación econométrica es que, conforme a lo que predice la teoría y lo que ha sido observado en gran
ESTADISTICA GENERAL INTRODUCCIÓN CONCEPTOS BASICOS ORGANIZACIÓN DE DE DATOS
ESTADISTICA GENERAL INTRODUCCIÓN CONCEPTOS BASICOS ORGANIZACIÓN DE DE DATOS Profesor del del curso: curso: Ing. Ing. Celso Celso Gonzales INTRODUCCION OBJETIVOS Comprender qué es y porqué se estudia la
Lección 24: Lenguaje algebraico y sustituciones
LECCIÓN Lección : Lenguaje algebraico y sustituciones En lecciones anteriores usted ya trabajó con ecuaciones. Las ecuaciones expresan una igualdad entre ciertas relaciones numéricas en las que se desconoce
Funciones más usuales 1
Funciones más usuales 1 1. La función constante Funciones más usuales La función constante Consideremos la función más sencilla, por ejemplo. La imagen de cualquier número es siempre 2. Si hacemos una
CAPÍTULO VI PREPARACIÓN DEL MODELO EN ALGOR. En este capítulo, se hablará acerca de los pasos a seguir para poder realizar el análisis de
CAPÍTULO VI PREPARACIÓN DEL MODELO EN ALGOR. En este capítulo, se hablará acerca de los pasos a seguir para poder realizar el análisis de cualquier modelo en el software Algor. La preparación de un modelo,
CALIDAD página: 1 JOSÉ MANUEL DOMENECH ROLDÁN PROFESOR DE ECONOMÍA Y ADMINISTRACIÓN DE EMPRESA
CALIDAD página: 1 HISTOGRAMA QUÉ ES EL HISTOGRAMA? El histograma es una herramienta útil para resumir y analizar datos. Por su naturaleza gráfica, puede ayudar a identificar e interpretar pautas que son
EXTRACTO Descripción del uso y manejo de SIRAIS 1.2
Manual de usuario EXTRACTO Descripción del uso y manejo de ELABORADO POR Dr. Javier Rodríguez Suárez Director General de Difusión e Investigación Ing. José Joel Lucero Morales Jefe de Enseñanza de la Dirección
Ejercicio Nº 3: Realizar aumentos en una Tabla de Sueldos
SESION5: BASE DE DATOS PLANILLAS Ejercicio Nº : Realizar aumentos en una Tabla de Sueldos Veamos pues. En la hoja de calculo se tiene la Tabla de Sueldos de varios empleados (aquí ahora vemos solo empleados,
1. Fundamento teórico
1 1. Fundamento teórico Los métodos espectroscópicos atómicos y moleculares figuran entre los métodos analíticos instrumentales más utilizados. La espectroscopia molecular basada en la radiación ultravioleta,
MANUAL DE AYUDA HERRAMIENTA DE APROVISIONAMIENTO
MANUAL DE AYUDA HERRAMIENTA DE APROVISIONAMIENTO Fecha última revisión: Marzo 2016 INDICE DE CONTENIDOS HERRAMIENTA DE APROVISIONAMIENTO... 2 1. QUÉ ES LA HERRAMIENTA DE APROVISIONAMIENTO... 2 HERRAMIENTA
Apuntes de Matemática Discreta 1. Conjuntos y Subconjuntos
Apuntes de Matemática Discreta 1. Conjuntos y Subconjuntos Francisco José González Gutiérrez Cádiz, Octubre de 2004 Universidad de Cádiz Departamento de Matemáticas ii Lección 1 Conjuntos y Subconjuntos
DISTRIBUCIÓN DE FRECUENCIAS
UNIVERSIDAD DE COSTA RICA ESCUELA DE ESTADÍSTICA Prof. Olman Ramírez Moreira DISTRIBUCIÓN DE FRECUENCIAS FUENTE: Gómez, Elementos de Estadística Descriptiva Levin & Rubin. Estadística para Administradores
TEMA 3: EN QUÉ CONSISTE?
Módulo 7 Sesión 3 5/16 TEMA 3: EN QUÉ CONSISTE? La metodología seguida para aplicar correctamente la técnica de RGT se basa en cuatro fases (Figura 1). En la primera de ellas, se seleccionan los elementos
Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos
Capítulo 10 Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos Al analizar datos, lo primero que conviene hacer con una variable es, generalmente, formarse una idea lo más exacta posible
2) PRÁCTICAS DE BIOLOGÍA (2º de Bachillerato) IDENTIFICACIÓN DE CROMOSOMAS HUMANOS Y REALIZACIÓN DE UN IDEOGRAMA DE UN CARIOTIPO
2) PRÁCTICAS DE BIOLOGÍA (2º de Bachillerato) IDENTIFICACIÓN DE CROMOSOMAS HUMANOS Y REALIZACIÓN DE UN IDEOGRAMA DE UN CARIOTIPO OBJETIVO El objetivo de esta práctica es aprender a reconocer los cromosomas
