Parámetros y estadísticos



Documentos relacionados
Otras medidas descriptivas usuales

ANÁLISIS DESCRIPTIVO CON SPSS

Clase 2: Estadística

Estadística: conceptos básicos y definiciones.

Clase 2: Estadística

Medidas de tendencia central o de posición: situación de los valores alrededor

ESTADÍSTICA SEMANA 4

MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

Ejercicio de estadística para 3º de la ESO

Práctica 2 ESTADÍSTICA DESCRIPTIVA

Estadística. Conceptos de Estadística. Un individuo o unidad estadística es cada uno de los elementos que componen la población.

Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos

Socioestadística I Análisis estadístico en Sociología

Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS

1. MEDIDAS DE TENDENCIA CENTRAL

Tema 2 Estadística Descriptiva

Covarianza y coeficiente de correlación

LECCION 1ª Introducción a la Estadística Descriptiva

Tema 3. Medidas de tendencia central Introducción. Contenido

UNIDAD III MEDIDAS DE TENDENCIA CENTRAL

Media vs mediana vs moda Cual medida de tendencia central es mas adecuada? MEDIA conveniencias:

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

DIAGRAMAS DE CAJA. Apuntes de Métodos Estadísticos I Prof. Gudberto J. León R. I- 79

Estadística. Tema 2: Estadísticos. Dagoberto Salgado Horta Tema 2: Estadísticos 1

I1.1 Estudios observacionales IISESIÓN DISEÑO O DE ESTUDIOS EN INVESTIGACIÓN N MÉDICA DESCRIPTIVA CURSO DE. 1.2 Estudios experimentales

Asignatura: Econometría. Conceptos MUY Básicos de Estadística

CUESTIONES DE AUTOEVALUACIÓN (TEMA 1)

PRÁCTICA No. 1 ESTADÍSTICA DESCRIPTIVA PARTE I

Síntesis Numérica de una Variable

1.1. Introducción y conceptos básicos

Aplicaciones de Estadística Descriptiva

GRADO TURISMO TEMA 2: ANÁLISIS DE DATOS TURÍSTICOS UNIDIMENSIONALES

INSTITUCION EDUCATIVA LUIS PATRON ROSANO DOCUMENTO PARA ESTUDIAR LOGROS PENDIENTES DE ESTADISTICA DE 10º

ESTADÍSTICA DESCRIPTIVA

Módulo de Estadística

Estadística Aplicada. Tema 2: Estadísticos. Universidad Autónoma de Cd. Juarez Tema 2: Estadísticos 1

Estadística Descriptiva. Tema 1: Estadísticos 1

Capítulo 7: Distribuciones muestrales

Medidas de tendencia Central

ESTADÍSTICA DESCRIPTIVA CON SPSS

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

TASACION DE INMUEBLES URBANOS

1. Análisis de variables cuantitativas (2 a parte)

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Medidas de Tendencia Central y Dispersión

Gráficas de caja. El borde derecho de la caja es el tercer cuartil, Q 3, que es la mediana de los valores que están por encima de la mediana.

Capítulo 9. La distribución de las ganancias

Tema 9 Estadística Matemáticas B 4º E.S.O. 1 TABLAS DE FRECUENCIAS Y REPRESENTACIONES GRÁFICAS EN VARIABLES DISCRETAS

LEYES DE CONSERVACIÓN: ENERGÍA Y MOMENTO

15 PARÁMETROS ESTADÍSTICOS

USAC FACULTAD DE INGENIERÍA ÁREA DE ESTADÍSTICA Coordinación

UNIDAD II MEDIDAS DE TENDENCIA CENTRAL. Otras Medidas de tendencia central

Medidas de la tendencia central y las gráficas de caja

ESTIMACIÓN. puntual y por intervalo

Estadística Descriptiva

Tema 7: Estadística y probabilidad

Anexo 4. Herramientas Estadísticas

Una forma rápida de ordenar datos numéricos (Diagrama de Tallo y Hoja)

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.

13Soluciones a los ejercicios y problemas

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

Distribución de frecuencias gráficas y tablas

Hay diferencias en la media del HOMA entre los diabéticos y los no diabéticos? Resumen del procesamiento de los casos

CORRELACIÓN Y PREDICIÓN

Tests de hipótesis estadísticas

Estadística Descriptiva

HUMANIDADES Y CIENCIAS SOCIALES BLOQUE III ESTADÍSTICA Y PROBABILIDAD

Estadística descriptiva con Excel (Cálculo de medidas)

I. Estadística Descriptiva de una variable

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson

Características de una distribución de frecuencias: tendencia central, dispersión y forma. La distribución normal.

Instrucciones sobre cómo presentar la estadística en un trabajo científico

Haciendo estadística con SPAC-FL y Minitab

Introducción al SPSS/PC. 1. El editor de datos. Taller de Estadística

Examen de la asignatura "Estadística aplicada a las ciencias sociales" Profesor Josu Mezo. 9 de junio de 2008.

Procesamiento de información para la investigación utilizando el programado Excel recopilados. Los participantes rán en

ESTADISTICA GENERAL INTRODUCCIÓN CONCEPTOS BASICOS ORGANIZACIÓN DE DE DATOS

Práctica 2. Estadística Descriptiva

1 Ejemplo de análisis descriptivo de un conjunto de datos

Trabajo de Matemáticas y Estadística Aplicadas

UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL MANUAL DE SPSS

TEMA 7: Análisis de la Capacidad del Proceso

Imagen de Rosaura Ochoa con licencia Creative Commons

Métodos, Diseño y Técnicas de Investigación en Psicología

Población, muestra y variable estadística

CURSO DIPLOMATURA EN CIENCIAS EMPRESARIALES Primer curso. Primer semestre. ANALISIS DESCRIPTIVO DE DATOS ECONOMICOS PROGRAMA:

CONCEPTOS DE LA FUERZA

todas especialidades Soluciones de las hojas de problemas

ESTADÍSTICA DESCRIPTIVA CON MINITAB

Tema 1: Test de Distribuciones de Probabilidad

Manual de Bioestadística

Tema 9: Estadística Descriptiva. Distribuciones estadísticas. Representaciones

Análisis estadístico con Microsoft Excel

Consideraciones al precio de un warrant. El precio del warrant: la prima. Factores que afectan al precio de un warrant

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

Intervalo para la media (caso general)

Transcripción:

Parámetros y estadísticos «Parámetro»: Es una cantidad numérica calculada sobre una población y resume los valores que esta toma en algún atributo Intenta resumir toda la información que hay en la población en unos pocos números (parámetros). La altura media de los sujetos «Estadístico»: Es una cantidad numérica calculada sobre una muestra que resume su información sobre algún aspecto Si un estadístico se usa para aproximar un parámetro también se le suele llamar «estimador» Normalmente nos interesa conocer un parámetro, pero por la dificultad que conlleva estudiar a *TODA* la población, calculamos un estimador sobre una muestra y confiamos en que sean próximos. Tipos de estadísticos «Posición» Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. Entre ellos cabe destacar: Cuantiles, percentiles, cuartiles, deciles,... «Centralización» Indican valores con respecto a los que los datos parecen agruparse. Entre ellos cabe destacar: Media, mediana y moda «Dispersión» Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Entre ellos : Desviación típica, coeficiente de variación, rango, varianza «Forma» Dan una idea de cómo se distribuyen los datos Entre ellos: Asimetría, Apuntamiento o curtosis

Estadísticos de posición Se define el «cuantil» de orden a como un valor de la variable por debajo del cual se encuentra una frecuencia acumulada a. Casos particulares son los percentiles, cuartiles, deciles, quintiles,...

Percentiles y cuantiles «Percentil» de orden k = cuantil de orden k/100. La mediana se corresponde con el percentil 50 El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85% «Cuartiles»: Dividen a la muestra en 4 grupos con frecuencias similares. «Primer cuartil» = Percentil 25 = Cuantil 0,25 «Segundo cuartil» = Percentil 50 = Cuantil 0,5= mediana «Tercer cuartil» = Percentil 75 = Cuantil 0,75 Ejemplos El 5% de los recién nacidos tiene un peso demasiado bajo. Qué peso se considera demasiado bajo? Percentil 5 o cuantil 0,05 Qué peso es superado sólo por el 25% de los individuos? Percentil 75 o cuantil 0,75 El colesterol se distribuye simétricamente en la población. Se considera patológico los valores extremos. El 90% de los individuos son normales Entre qué valores se encuentran los individuos normales? Entre el percentil 5 y el 95

Qué peso no llega a alcanzar el 25% de los individuos? Primer cuartil = Percentil 25= 60 Kg Qué peso es superado por el 25% de los individuos? Tercer cuartil = Percentil 75 = 80 Kg Entre qué valores se encuentra el 50% de los individuos con un peso más normal? Entre el primer y tercer cuartil = entre 60 y 80 kg. Este intervalo coincide con los individuos que ocupan la parte central de la muestra. Los diagramas de caja sintetizan esta información. Estadísticos 100 90 80 70 60 PESO Percentiles 25 50 75 60,00 70,00 80,00 50 40 Ejemplos 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Total Número de años de escolarización Porcentaje Frecuencia Porcentaje acumulado 5,3,3 5,3,7 6,4 1,1 12,8 1,9 25 1,7 3,5 68 4,5 8,0 56 3,7 11,7 73 4,8 16,6 85 5,6 22,2 461 30,6 52,8 130 8,6 61,4 175 11,6 73,0 73 4,8 77,9 194 12,9 90,7 43 2,9 93,6 45 3,0 96,6 22 1,5 98,0 30 2,0 100,0 1508 100,0 20%? 90%? Estadísticos Número de años de escolarización N Válidos Perdidos Media Mediana Moda Percentiles 10 20 25 30 40 50 60 70 75 80 90 1508 0 12,90 12,00 12 9,00 11,00 12,00 12,00 12,00 12,00 13,00 14,00 15,00 16,00 16,00

Medidas de centralización «Media» ( Mean ) Es la media aritmética (promedio) de los valores de una variable. Suma de los valores dividido por el tamaño muestral. La media es un promedio aritmético: de 2,2,3,7 es (2+2+3+7)/4=3,5 Conveniente cuando los datos se concentran simétricamente con respecto a ese valor. Muy sensible a valores extremos. Se puede considerar como el centro de gravedad de los datos «Mediana» ( median ) Es un valor que divide a las observaciones en dos grupos con el mismo número de individuos (percentil 50). Si el número de datos es par, se elige la media de los dos datos centrales. Mediana de 1,2,4,5,6,6,8 es 5 Es conveniente cuando los datos son asimétricos. No es sensible a valores extremos. Ejemplo: Mediana de 1,2,4,5,6,6,800 es 5. La media es 117,7! «Moda» ( mode ) Es el/los valor/es donde la distribución de frecuencia alcanza su máximo. Las formulas «Media» (Para datos sin agrupar: x 1, x 2,..., x n ) x i i x = n «Media» (Para agrupados u organizados en tablas) Variable fr. fr. ac. L 0 L 1 x 1 n 1 N 1 L 1 L 2... x 2 n 2 N 2 x n i i i x = = n n N i L k-1 L k x k n k N k n «Cuartil de orden α» (Para agrupados u organizados en tablas) Siendo i es el menor intervalo que tiene frecuencia acumulada superior a α n α n Ni 1 C ( ) α = Li 1 + Li Li 1 n i

Altura mediana Ejemplo con variables agrupadas La media, en teste caso, se desplaza hacia los valores extremos. No coincide con la mediana. Es un punto donde el histograma estaría en equilibrio si tuviese masa. Peso 40 50 50 60 60 70 70-80 80-90 90-100 100 130 Total Marca 45 55 65 75 85 95 115 Nº 5 10 21 11 5 3 3 58 Σ% 5 15 36 47 52 55 58 Para calcular la media es necesario elegir un punto representante del intervalo: «La marca de clase».

C α n N i 1 α = Li 1 + i i ni ( L L ) 1 Peso Marca Nº Σ% 40 50 45 5 5 50 60 55 10 15 60 70 65 21 36 70-80 75 11 47 80-90 85 5 52 90-100 95 3 55 100 130 115 3 58 58 0,5 58 Ni Mediana C0,5 = Li 1 + ni 0,5 58 15 ) = 60+ (70 60) = 66,6 21 C 0,5 ( L L 1 = i i 1 0,5 58 15 ) = 60+ (70 60) = 66,6 21 ) Variabilidad o Dispersión La variabilidad de en los valores de un cualquier atributo que evaluemos está presente siempre en la naturaleza y en cualquier fenómeno social, su origen en ciencias sociales, es siempre múltiple. EJEMPLO: Los estudiantes de Sociología reciben diferentes calificaciones en la asignatura (variabilidad). A qué puede deberse? Diferencias individuales en el conocimiento de la materia. Podría haber otras razones (fuentes de variabilidad)?. Supongamos que todos los alumnos poseen el mismo nivel de conocimiento. Las notas serían las mismas en todos? Seguramente No. Dormir poco el día del examen, el croissant estaba envenenado... Diferencias individuales en la habilidad para hacer un examen. El examen no es una medida perfecta del conocimiento. «Variabilidad por error de medida.» En alguna pregunta difícil, se duda entre varias opciones, y al azar se elige la mala. «Variabilidad por azar, aleatoriedad.»

Medidas de Dispersión Miden el grado de dispersión (variabilidad) de los datos, independientemente de su causa. «Amplitud o Rango» ( range ): Es la diferencia entre las observaciónes extremas. Es muy sensible a valores extremos. EJEMPLO: 2,1,4,3,8,4. El rango es 8-1=7. «Rango intercuartílico» ( interquartile range ): Es la distancia entre el primer y tercer cuartil. Parecida al rango, pero elimina las observaciones más extremas inferiores y superiores, haciéndose menos sensible a valores extremos. Rango intercuartílico = P75 - P25 25% 25% 25% Variabilidad o Dispersión «Varianza S 2» ( Variance ): Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media. S 2 = 1 n i ( x i x) Es sensible a valores extremos (alejados de la media). 2 Sus unidades son el cuadrado de las de la variable. El llamado «coeficiente de inercia» (mayor o menor dispersión de los valores) influye en sus valores. Como la razón física de porqué un patinador gira a diferente velocidad cuando extiende o recoge sus brazos Por estos inconvenientes se utiliza la «Desviación típica»

Desviación típica «Desviación típica» ( standard deviation ). Es la raíz cuadrada de la varianza x 2 σ x + 2σ S = S 2 50 x σ x +σ Tiene las misma dimensionalidad (unidades) que la variable. La distribución (normal o gaussiana) viene determinada por la media y la desviación típica. A una distancia de una desv. típica de la media tendremos 68% observaciones. A una distancia de dos desv. típica de la media tendremos 95% observaciones. 40 30 20 10 0 3.300 2.900 2.500 2.100 1.700 1.300 900 500 Peso recién nacidos en partos gemelares Desv. típ. = 568,43 Media = 2023 N = 407,00 Centrado en la media y a una desviación típica de distancia tenemos más de la mitad de las observaciones A dos desviaciones típicas las tenemos a casi todas

Coeficiente de variación Es la razón entre la desviación típica y la media. Mide la desviación típica en forma de «qué tamaño tiene con respecto a la media» o «desviación por unidad de media» CV = S x También se la denomina «Variabilidad relativa» Es frecuente mostrarla en porcentajes. EJEMPLO: Si la media es 80 y la desviación típica 20 entonces CV=20/80=0,25=25% (variabilidad relativa) Es una cantidad adimensional. Interesante para comparar la variabilidad de diferentes variables. EJEMPLO: Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más dispersión en peso que en altura. No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente Asimetría o sesgo Una distribución es simétrica si la mitad izquierda de su distribución es la imagen especular de su mitad derecha. En las distribuciones simétricas media y mediana coinciden. Si sólo hay una moda también coincide La asimetría es positiva o negativa en función de a qué lado se encuentra la cola de la distribución La media tiende a desplazarse hacia las valores extremos (colas). Discrepancias entre las medidas de centralización indican la asimetría.

Estadísticos de Asimetría Basados en diferencia entre estadísticos de tendencia central, se utilizan: Por diferencias intercuartílicas 1º y 2º cuartiles y 2º y 3º. Basados en desviaciones con signo respecto a la media. En este se basa SPSS. En función del signo del estadístico diremos que la asimetría es positiva o negativa. Distribución simétrica la que tiene asimetría nula. Apuntamiento o curtosis La curtosis nos indica el grado de apuntamiento (aplastamiento) de una distribución con respecto a la distribución normal o gaussiana, que es adimensional. Las series que representan los siguientes gráficos poseen la misma media y desviación típica, pero con diferente grado de apuntamiento. 160 400 300 140 300 120 200 100 200 Frecuencia 80 60 40 Frecuencia 100 0 3 27 37 47 57 67 77 87 97 108 Frecuencia 100 0 27 37 45 53 61 69 77 85 93 45 48 51 54 57 60 63 66 69 72 75 78 81 84 16 32 42 52 62 72 82 92 102 138 32 41 49 57 65 73 81 89 99 Platicúrtica Se denomina: Leptocúrtica «Platicúrtica»: curtosis < 0 «Mesocúrtica»: curtosis = 0 «Leptocúrtica»: curtosis > 0 Mesocúrtica

Salida de Estadísticos del SPSS El SPSS nos permite sacar todos estos estadísticos en una sola orden: En el menú «Analizar» «Estadísticos descriptivos» «Descriptivos» y con todas las opciones activas nos muestra la tabla siguiente: Descriptivos para Número de hijos Media Intervalo de confianza para la media al 95% Media recortada al 5% Mediana Varianza Desv. típ. Mínimo Máximo Rango Amplitud intercuartil Asimetría Curtosis Límite inferior Límite superior Estadístico Error típ. 1,90,045 1,81 1,99 1,75 2,00 3,114 1,765 0 8 8 3,00 1,034,063 1,060,126 Los diagramas de caja resumen gran parte de esta información