Transformaciones de variables

Documentos relacionados
Estadística I Tema 2: Análisis de datos univariantes

2 Descripción estadística de una variable. Ejemplos y ejercicios.

2. DESCRIPCIÓN ESTADÍSTICA DE UNA VARIABLE. EJEMPLOS Y EJERCICIOS *.

Temas 2 y 3. Análisis Exploratorio de Datos Grado en Estadística y Empresa 2012/2013

1 Resolución de algunos ejemplos y ejercicios del tema 1.

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016)

Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos

Técnicas Cuantitativas para el Management y los Negocios

INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados

Prueba de evaluación continua Grupo D

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Información de contacto. Tema 1 Análisis exploratorio de datos. Ejemplo de introducción: contaminación por mercurio en el pescado.

TEMA 5 Estadística descriptiva. Análisis de datos

Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias.

Tema 6 - Introducción. Tema 5. Probabilidad Conceptos básicos. Interpretación y propiedades básicas Probabilidad condicional y reglas de cálculo.

Part I. Momentos de una variable aleatoria. Esperanza y varianza. Modelos de Probabilidad. Mario Francisco. Esperanza de una variable aleatoria

Estadística aplicada al Periodismo

MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud.

Medidas de Tendencia central Medidas de Dispersión Medidas de Asimetría

Solución a los ejercicios de autocomprobación - Tema La información que nos dan es la siguiente:

Julio Deride Silva. 18 de agosto de 2010

Tema 1: Análisis de datos univariantes

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

Las técnicas para resumir la información ió contenida en un conjunto de datos x 1, x 2,,x n son: Tablas de frecuencias: por columnas, disponemos los

Procedimiento "Explorar..."

Libro de ejercicios de refuerzo de matemáticas. María de la Rosa Sánchez

= 134, 5 Tercer cuartil: Q 3 = Pueden considerarse normales. =2 P 10 = 118 horas. f(x) =

Estadística Descriptiva

Curso de Estadística Aplicada a las Ciencias Sociales

Tema 6. Variables aleatorias continuas

ANÁLISIS DE DATOS UNIDIMENSIONALES

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

Exploración de datos

ESTADÍSTICA. 1. Introducción. 2. Frecuencias

CLASE 2 INTRODUCCION A LA ESTADISTICA

Fase 2. Estudio de mercado: ESTADÍSTICA

Part I. Variables aleatorias unidimensionales. Estadística I. Mario Francisco. Definición de variable aleatoria. Variables aleatorias discretas

Diplomatura en Ciencias Empresariales

ESTADISTICA APLICADA A LA EDUCACIÒN CODIGO: HOC220 EJERCICIOS SOBRE MEDIDAS DE TENDENCIA CENTRAL, POSICIONAL Y DE DISPERSIÓN

Medidas Descriptivas Numéricas

Estadística I Examen Extraordinario, 24 Junio Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER.

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 6) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

Análisis Exploratorio de Datos Resumen gráfico y numérico

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k

Estadística unidimensional

EJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas:

Fundamentos de la investigación en psicología

PRÁCTICA: ESTADÍSTICA DESCRIPTIVA CON SPSS 1

Estadística Descriptiva en SPSS

Capítulo. Distribución de probabilidad normal. Pearson Prentice Hall. All rights reserved

Tema 3: Estadística Descriptiva

ESTADÍSTICA Hoja 1

1. ESTADÍSTICA DESCRIPTIVA. Informática. Universidad Carlos III de Madrid 1

UNIDAD 8. ESTADÍSTICA

ESTADÍSTICA. Rincón del Maestro:

Estadística ESTADÍSTICA

Estadística Descriptiva y Probabilidad FORMULARIO

Tablas de contingencia Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez.

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

RELACIÓN 1. DESCRIPTIVA

Tema 7. Otras medidas descriptivas usuales Ejercicios resueltos 1

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74

Tema 12. Estadística

Medidas de dispersión. Rango o recorrido. Desviación media. Medidas de dispersión

TEMA: 9 ESTADÍSTICA 4º ESO

Módulo de Estadística

Apuntes de Estadística

Medidas Descriptivas Numéricas

Dispone de 1 hora para resolver las siguientes cuestiones planteadas.

1. Caracteres estadísticos

Experimento de lanzar 3 monedas al aire. Denominando por (C) a Cara y (X) a Cruz, el espacio muestral será: Ω={CCC,CCX,CXC,XCC,CXX,XCX,XXC,XXX}

Capítulo 2. Medidas Estadísticas Básicas Medidas estadísticas poblacionales

1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado.

Instrumentos y matriz de datos

ESTADÍSTICA. A su vez, las variables pueden ser :

2.2: Resumen numérico

TEMA: 13 y 14 ESTADÍSTICA 3º ESO

CAPÍTULO 7: PROPORCIONES Y PORCENTAJES

Estadística Básica 1er Cuatrimestre 2012

Estadística I Examen extraordinario, 25 de Junio Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER.

Estadística aplicada al Periodismo

Transcripción:

Transformaciones de variables Introducción La tipificación de variables resulta muy útil para eliminar su dependencia respecto a las unidades de medida empleadas. En realidad, una tipificación equivale a una transformación lineal Z = X x = 1 σ σ X x σ siendo Z = ax + b donde a = 1 y b = x. σ σ La variable tipificada expresa el número de desviaciones típicas que dista de la media cada observación. Por ello, se puede comparar la posición relativa de los datos de diferentes distribuciones. Otra situación habitual se presenta cuando se hace un cambio de unidades de medida. A pesar de las buenas propiedades de las transformaciones lineales, éstas no son suficientes para modificar rasgos más complejos de una distribución como por ejemplo la asimetría. Para hacer más simétrica una distribución se deben hacer transformaciones no lineales. Transformaciones no lineales Supongamos que se trata de estudiar el crecimiento del consumo de energía en diferentes países. Una opción consiste en en estudiar las diferencias de consumo entre dos instantes de tiempos C t C t 1, pero en general resulta más conveniente considerar las diferencias relativas: (C t C t 1 )/C t 1 obien(c t C t 1 )/C t. Una medida más adecuada consiste en tomar logaritmos ln C t ln C t 1 =ln C µ t =ln 1+ C t C t 1 C t C t 1 C t 1 C t 1 C t 1 (ya que ln(1 + x) x, para valores de x pequeños). 1

Así, si se expresa la variable en logaritmos, su crecimiento en dicha escala es una buena medida del crecimiento relativo. Por otro lado, dado que C t C t 1, entonces C t C t 1 C t ln C t C t 1 C t C t 1 C t 1 de modo que las diferencias de las variables transformadas por un logaritmo, son una medida promedio de las dos formas posibles de medir el crecimiento relativo. Como regla general, se trata de escoger una transformación que conduzca a una distribución simétrica, y más cercana a la distribución normal. De este modo, se pueden aplicar numerosas técnicas de inferencia estadística. En una distribución simétrica unimodal, la media, moda y mediana coinciden; además, el coeficiente de asimetría es cero (así como todos los momentos de orden impar). Transformaciones no lineales más frecuentes Cuando se tienen distribuciones de frecuencias con asimetría negativa (frecuencias altas hacia el lado derecho de la distribución), es conveniente aplicar la transformación y = x 2. Esta transformación comprime la escala para valores pequeños y la expande para valores altos. Para distribuciones asimétricas positivas se usan las transformaciones x, ln(x) y 1/x, que comprimen los valores altos y expanden los pequeños. El efecto de estas transformaciones está en orden creciente: menos efecto x,másln(x) ymásaún1/x. 2

La transformación más utilizada es la del logaritmo. Muchas distribuciones de datos económicos, o de consumos se convierten en simétricas al tomar la transformación logaritmo. Las medidas basadas en el orden de los datos, como la mediana o los cuartiles se mantienen iguales cuando se hace una transformación monótona, h, del estilo de las previamente citadas: x 1 >x 2 h(x 1 ) >h(x 2 ). El resto de estadísticos cambia. Ejemplo: Se consideran los siguientes datos, correspondientes a la tasa de incrementos de precios al consumo, en 1985, para 25 paises de la OCDE: 3

X =(2.2, 7.6, 2.9, 4.6, 4.1, 3.9, 7.4, 3.2, 5.1, 5.3, 20.1, 2.3, 5.5, 32.7, 9.1, 1.7, 3.2, 5.8, 16.3, 15.9, 5.9, 6.7, 3.4, 40.5). Si se dibuja el histograma, se observa que la distribución es muy asimétrica: la mayor parte de los países tienen un incremento menor que 10 y unos pocos un incremento mucho mayor. Si se toma la transformación logaritmo, se obtiene una distribución simétrica de los datos. Histograma de la variable x frecuencias 0 2 4 6 8 10 0 10 20 30 40 x Histograma de la variable ln(x) frecuencias 0 2 4 6 1 2 3 4 ln(x) Respectivamente, si se dibuja el diagrama de cajas, se obtienen numerosos datos atípicos con los datos originales. Si se considera la transformación logaritmo, los atípicos desaparecen. 4

x ln(x) 10 20 30 40 0.5 1.0 1.5 2.0 2.5 3.0 3.5 Si en vez del conjunto de observaciones originales, se tiene sólo la distribución de frecuencias en una tabla, se puede realizar la transformación modificando los extremos de las clases mediante la función elegida. En general, esto hace que cambien las longitudes de las clases. Si a continuación se dibuja el histograma con las nuevas clases, hay que recalcular las alturas, ya que los histogramas representan las frecuencias mediante áreas. 5