Histograma del puntaje de vocabulario y la aproximación por una curva gaussiana.

Documentos relacionados
FCEN-UBA. 3. MEDIDAS RESUMEN: Numéricas y Gráficas. 3.1 Introducción

ÁREAS DE LA ESTADÍSTICA

5. DISTRIBUCIOES COTIUAS DE PROBABILIDAD

ESTADÍSTICA (Q) Resolución del Trabajo Práctico N 1

Tema 6. Variables aleatorias continuas

1. Distribución normal

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

Parámetros Estadísticos básicos, Resumen y Presentación de datos. Jhon Jairo Padilla, PhD.

3 ANALISIS DESCRIPTIVO DE LOS DATOS

TEMA 5 Estadística descriptiva. Análisis de datos

Estadística I Tema 2: Análisis de datos univariantes

Exploración de datos

Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación COMP. RESUELTO. Parámetros y complementos

6.3. Distribuciones continuas

Capítulo. Distribución de probabilidad normal. Pearson Prentice Hall. All rights reserved

Técnicas Cuantitativas para el Management y los Negocios

En todo proceso de investigación se generan datos y es la Estadística la disciplina encargada de :

Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial

MEDIDAS DE POSICIÓN CUANTILES CUARTILES DECILES CARLOS DARIO RESTREPO

Distribuciones Continuas

Estadística Descriptiva 2da parte

1 - TEORIA DE ERRORES : distribución de frecuencias

Estadística Descriptiva Métodos descriptivos visuales y medidas resumen

CAPÍTULO 7: PROPORCIONES Y PORCENTAJES

Fundamentos de la investigación en psicología

LECTURA 01: LA DISTRIBUCIÓN NORMAL GENERAL. LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I). TEMA 1: LA DISTRIBUCION NORMAL GENERAL.

2 ANÁLISIS EXPLORATORIO DE DATOS

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS

CONTROL DE CALIDAD UNIDAD IV TEORÍA DE DIMENSIÓN ESTADÍSTICA

D I S T R I B U C I Ó N N O R M A L

Medidas Descriptivas Numéricas

Biometría. Distribuciones de probabilidad para variables aleatorias continuas

El modelo de la curva normal. Concepto y aplicaciones

ESTADÍSTICA. 1. Introducción. 2. Frecuencias

ESTADÍSTICA DESCRIPTIVA TEMA 2: MEDIDAS NUMÉRICAS

Cuando la distribución viene dada por una tabla: 2. DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA.

Tema 04: Medición y error. M. en C. Edgardo Adrián Franco Martínez edgardoadrianfrancom

DISTRIBUCIONES CONTINUAS INFERENCIA ESTADISTICA LIC. MIGUEL CANO.

UNIVERSIDAD DE SONORA

VARIABLES ALEATORIAS CONTINUAS 1º Bto. CC.SS.

ESTADISTICA GENERAL. PRINCIPALES DISTRIBUCIONES CONTINUAS Profesor: Celso Celso Gonzales

Clase 2. Tema 2. Medidas de posición

PREGUNTAS TIPO EXAMEN. 1. Cuál de las siguientes medidas es una medida de Centralización?

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

( x) Distribución normal

En todo proceso de investigación se generan datos y es la Estadística la disciplina encargada de :

Datos cuantitativos. Método tabular

Algunas distribuciones teóricas continuas

Estadística Descriptiva

Tema 3: Estadística Descriptiva

Tema 4: Probabilidad y Teoría de Muestras

Variables aleatorias continuas

Distribuciones de probabilidad II

Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana.

CAPÍTULO 6: VARIABLES ALEATORIAS

DISTRIBUCIÓN NORMAL. Modelo matemático: f ( x ) = σ 2 π

Puntuaciones Estándarizadas, Distribución Normal y Aplicaciones. Dra. Noemí L. Ruiz Limardo 2008 Derechos de Autor Reservados, Revisado 2010

Número de árboles Crecimiento (m)

GEOESTADÍSTICA APLICADA

Estadística Inferencial. Estadística Descriptiva

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias.

DISTRIBUCION NORMAL ESTANDAR

1. La Distribución Normal

ANÁLISIS DESCRIPTIVO DE LOS DATOS DE VARIABLES CUANTITATIVAS

Estadística Descriptiva o Análisis Exploratorio de Datos

OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN

Variables aleatorias: El caso continuo. Random variables: The continuous case. Rincón de la Bioestadística

Estadística Descriptiva en SPSS

Comparación de dos Muestras - SnapStat

Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación COMP. Parámetros y complementos

Estadística Descriptiva

INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Estadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL

Medidas de Tendencia central Medidas de Dispersión Medidas de Asimetría

La Distribución Normal. La Distribución Normal. Características de la distribución de probabilidad normal

DISTRIBUCIONES DE FRECUENCIAS

PROBABILIDAD E INFERENCIA ESTADÍSTICA TEMA 3: DISTRUBUCIONES DE PROBABILIDAD CONTINUA

Capítulo 5: Probabilidad e inferencia

Recopilación: Camerina Laura Ramírez G. ESTADÍSTICA. Recopilación: Camerina Laura Ramírez G.

Tema 4: Variables Aleatorias

Identificación de valores atípicos.

Medidas de Tendencia Central.

Tablas de contingencia Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez.

ESTADÍSTICA DESCRIPTIVA

Para tomar decisiones se requiere INFORMACIÓN disponible, esperanzadamente confiable y útil.

ESTADISTICA APLICADA A LA EDUCACIÒN CODIGO: HOC220 EJERCICIOS SOBRE MEDIDAS DE TENDENCIA CENTRAL, POSICIONAL Y DE DISPERSIÓN

Bioestadística: Estadística Descriptiva

Julio Deride Silva. 18 de agosto de 2010

DESCRIPCIÓN DE DATOS. Medidas Numéricas

VARIABLES ALEATORIAS CONTINUAS

Algunas nociones básicas sobre Estadística

Módulo de Estadística

TH. DE CHEBYSHEV DISTRIB. NORMAL.

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

Transcripción:

35 Curvas de densidad Existe alguna manera de describir una distribución completa mediante una única expresión? un diagrama tallo-hoja no es práctico pues se trata de demasiados datos un histograma elimina los detalles y depende de la elección de las clases la mediana y los percentiles registran algunos aspectos específicos de los datos. Si queremos tener una descripción de la forma global de la distribución, omitiendo valores atípicos y otras desviaciones del patrón general, la respuesta es sí. Histograma del puntaje de vocabulario y la aproximación por una curva gaussiana. Aproximamos al histograma por una curva suave que muestre la forma de la distribución sin las irregularidades del histograma. Como la frecuencia relativa de todas las observaciones es 1, requerimos que el área total bajo la curva sea 1. El área bajo la curva y sobre un intervalo, correspondiente a cualquier rango de valores de la variable, es la proporción de observaciones que caen en ese rango. La curva describe la forma de la distribución y el

36 área bajo la curva = frecuencia relativa. Es llamada curva de densidad de la distribución. El eje vertical mide la frecuencia relativa/(longitud del intervalo de clase). Una curva de densidad con la forma apropiada suele ser una descripción adecuada del patrón global de una distribución. Los datos atípicos, que son desviaciones del patrón global, no están descriptos por la curva. Media y mediana en una curva de densidad simétrica Media y mediana en una curva de densidad asimétrica a derecha Las medidas de posición y dispersión también se aplican al caso de curvas de densidad. El p-ésimo percentil, x p, en una curva de densidad es el punto que deja a su izquierda un p % del área bajo la curva y el (100 - p) % restante, a la derecha. p % del área (100 - p) % del área x p

37 En particular la mediana es el punto de áreas iguales, es decir, el punto que deja áreas iguales de cada lado. Si pensamos a las observaciones como pesos en una vara delgada la media es el punto en que la vara quedaría equilibrada al poner un fiel justo debajo de él. Esta interpretación se extiende a la curva de densidad.. La media es un punto de equilibrio de una curva de densidad. Las curvas de densidad simétricas son perfectamente simétricas a pesar que los datos reales rara vez mostrarán simetría perfecta. Debemos distinguir los parámetros poblacionales, la media = µ y el desvío = σ, de una curva de densidad de los números x y DS calculados a partir de las observaciones. Distribuciones Normales o Gaussianas. Todas las distribuciones gaussianas tienen la misma forma. Vemos dos curvas normales con µ= 1 y µ=5 y σ=1.

38 Dos curvas normales con diferente σ. Podemos localizar σ a ojo en una curva normal. A medida que nos movemos en ambas direcciones desde el centro µ de la curva, ésta aumenta su pendiente hasta un punto (punto de inflexión) en que la pendiente empieza a disminuir Los dos puntos en los cuales ocurre este cambio de curvatura están localizados a una distancia σ a cada lado del centro µ. Recuerde que µ y σ sólos no determinan la forma de una distribución en general. Éstas son propiedades de las distribuciones gaussianas. Existen otras distribuciones no gaussianas con forma de campana.

39 Las curvas de densidad normal están descriptas por la siguiente ecuación x µ 2 1 ( ) y e σ (2) = σ 2π Observación: la ecuación (2) de la curva queda completamente especificada cuando se conocen los valores de µ y σ. Las distribuciones normales proveen buenos modelos para puntajes de pruebas tomadas en poblaciones grandes (pruebas habilidades escolares y muchas pruebas psicológicas), mediciones cuidadosamente replicadas y de la misma calidad (datos de Newcomb tabla 2.1 sin outliers), caracteristicas de una población biológicamente homogénea (longitudes de las cucarachas, rendimiento de la soja y pérdida de humedad en carne de pollo envasada). Las distribuciones de las siguientes variables, en cambio, son generalmente asimétricas: variables económicas (ingreso personal, ventas en firmas comerciales), tiempos de sobrevida (de pacientes de cáncer luego de realizado un tratamiento), tiempo de vida (de componentes mecánicos o electrónicas). A pesar que la experiencia puede sugerir si un modelo gaussiano es o no factible en un caso particular, es muy riesgoso suponer la normalidad de los datos sin inspeccionarlos. Superposición de una curva normal a un histograma: 1 grafique una curva simétrica de altura = y puntos de inflexión en x D DS 2π ± S. la escala en el eje vertical es la frecuencia relativa, siempre que la longitud de la base de los rectángulos de clase sea 1. En cualquier otro caso, en el eje vertical se grafica (la frecuencia relativa de cada clase) / (longitud de la clase) de manera que el área de un rectángulo = (longitud de la base)*(altura del rectángulo)= frecuencia relativa

40 Verifiquemos este procedimiento para la superposición que muestra la figura sabiendo que la media del puntaje es 6.9156, el desvío es 1.6305 y 1 DS 2π = 0.2447