Notas Docentes. Estadística para Economistas. Carlos Casacuberta. Nota Docente No. 08



Documentos relacionados
Trata de describir y analizar algunos caracteres de los individuos de un grupo dado, sin extraer conclusiones para un grupo mayor.

ORGANIZACIÓN DE LOS DATOS.

ESTADISTICA UNIDIMENSIONAL

Preguntas más Frecuentes: Tema 2

Series Numéricas. Una forma de definir e es a través de la suma: ! + 1 1! + 1 2! + 1 3! + 1 4! n. cuyo límite es e, es decir:

CAPÍTULO I. Conceptos Básicos de Estadística

UNIDAD 9. PROBABILIDAD Matemáticas II. Ies do Barral.Curso 2017/ Experimentos aleatorios

Slide 1. Slide 2. Slide 3. Universidad Diego Portales Facultad de Economía y Negocios. Capítulo 4 Introducción a la Probabilidad.

Qué es la estadística?

Guía 1 Matemática: Estadística NM 4

Probabilidad FENÓMENOS ALEATORIOS

Estimadores Puntuales: Propiedades de estimadores Sebastián Court

Teorema del límite central

SEMANA 01. CLASE 01. MARTES 04/10/16

Probabilidad. Departamento de Análisis Matemático Universidad de La Laguna. 1. Introducción 1

2 FUNDAMENTOS DE PROBABILIDAD

) se obtiene un valor específico del estimador que recibe el nombre de estimación del parámetro poblacional θ y lo notaremos por = g ( x 1

2 Conceptos básicos y planteamiento

Slide 1. Slide 2. Slide 3. Universidad Diego Portales Facultad de Economía y Negocios. Capítulo 4 Introducción a la Probabilidad.

MEDIDAS DE TENDENCIA CENTRAL

Medidas de Tendencia Central

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA.

Capítulo VARIABLES ALEATORIAS

Slide 1. Slide 2. Slide 3. Universidad Diego Portales Facultad de Economía y Negocios. Capítulo 3 Estadística Descriptiva: Métodos Numéricos

ESTADÍSTICA UNIDIMENSIONAL

Estadística Aplicada a las ciencias Sociales Examen Febrero de 2008 segunda semana

La ley de los grandes números

Importancia de las medidas de tendencia central.

MATEMÁTICA LIC. Y PROF. EN CS. BIOLÓGICAS

Análisis de datos en los estudios epidemiológicos II

Sucesiones I Introducción

Profr. Efraín Soto Apolinar. Área bajo una curva

Pre-PAES 2016 Media aritmética, moda y mediana.

2.2. Estadísticos de tendencia central

Sumatoria, Progresiones y Teorema del Binomio

Tema 10 Cálculo de probabilidades Matemáticas CCSSII 2º Bachillerato 1

Trabajo Especial Estadística

IntroducciónalaInferencia Estadística

Combinatoria y definiciones básicas de probabilidad

Repaso...Último Contenidos NM 4

Prueba Integral Lapso / Área de Matemática Fecha: MODELO DE RESPUESTA (Objetivos del 01 al 11)

Desigualdad de Tchebyshev

Estadística Descriptiva

Número de personas que se forman en una fila en 1 hora Número de águilas que se obtienen al lanzar una moneda 5 veces.

4. Sucesiones de números reales

PROBLEMA DEL USO DE FERTILIZANTE EN GRANJAS DE PRODUCCIÓN DE TOMATES.

Tema 2. Medidas descriptivas de los datos

4 - DESIGUALDAD DE CHEBYSHEV- LEY DE LOS GRANDES NUMEROS

LAS SUCESIONES Y SU TENDENCIA AL INFINITO

ESTADÍSTICA DESCRIPTIVA

Ejercicios y Talleres. puedes enviarlos a

INTRODUCCIÓN A LA PROBABILIDAD

Identificación de Sistemas

Algoritmos y Estructuras de Datos II, Segundo del Grado de Ingeniería Informática, Test de Análisis de Algoritmos, marzo Test jueves.

MINITAB y MODELOS DE REGRESIÓN

Cód. Carrera: Área de Matemática Fecha: MODELO DE RESPUESTAS Objetivos 1 al 11.

EJERCICIOS DE SERIES DE FUNCIONES

Límite y Continuidad de Funciones.

INFERENCIA ESTADÍSTICA CONCEPTOS BÁSICOS

Tema 3: Introducción a la probabilidad. Tema 3: Introducción a la probabilidad. Tema 3: Introducción a la probabilidad. 3.

DISTRIBUCIONES DE PROBABILIDAD.- DISTRIBUCIÓN BINOMIAL (BERNOULLI) DISTRIBUCIÓN NORMAL (GAUSS)

Frecuencia y probabilidad. Leyes del azar. Espacio probabilístico

R. Urbán Introducción a los métodos cuantitativos. Notas de clase Sucesiones y series.

Medida de Probabilidad

Una sucesión es un conjunto infinito de números ordenados de tal forma que se puede decir cuál es el primero, cuál el segundo, el tercero, etc.

NOTAS SOBRE INFERENCIA ESTADÍSTICA BAYESIANA. José G. Ríos Alejandro. Abril del 2011.

MEDIDAS DE TENDENCIA CENTRAL. _ xi

DETERMINACION DEL COSTO POR ALUMNO EGRESADO DE EDUCACION PRIMARIA

Técnicas Cuantitativas II Muestra y Estadísticos Muestrales. TC II Muestra y Estadísticos Muestrales 1 / 20

SOLUCIÓN EXAMEN I PARTE II

ESTADÍSTICA DESCRIPTIVA

Medidas de tendencia central

CI2612: Algoritmos y Estructuras de Datos II. Espacio de probabilidad. Objetivos. Blai Bonet

Tema 14: Inferencia estadística

PROBABILIDAD. El espacio muestral de un experimento aleatorio es el conjunto de todos los resultados posibles que pueden producirse.

1. QUÉ ES LA ESTADÍSTICA?

Sucesiones de números reales Sucesiones convergentes: límite de una sucesión

Rudimentos 5: Teorema del Binomio Profesor Ricardo Santander

EJERCICIO 1. , a partir de las frecuencias observadas, nij. , que se dan en la tabla del ejercicio.

Ingeniería Industrial. Curso Departamento de Matemática Aplicada II. Universidad de Sevilla. Lección 5. Series.

Unidad N 2. Medidas de dispersión

Sucesiones. Se denomina sucesión a una función cuyo dominio es el conjunto de los números naturales.

En el tema anterior se estudió que muchas decisiones se toman a partir de resultados muestrales. Por ejemplo:

una sucesión de funciones de A. Formemos una nueva sucesión de funciones {S n } n=1 de A de la forma siguiente:

Introducción a la Inferencia Estadística. Material Preparado por Olga Susana Filippini y Hugo Delfino

MEDIDAS DE DISPERSIÓN.

Ejemplos y ejercicios de. Análisis Exploratorio de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

Problemas de Estimación de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Esradística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Ejercicios y Talleres. puedes enviarlos a

Marco Teórico n = i = 2. Deducción: Si la serie se suma dos veces de la siguiente forma:

ESTADÍSTICA DESCRIPTIVA: UNA VARIABLE Julián de la Horra Departamento de Matemáticas U.A.M.

Objetivos. 1. Inferencia Estadística. INFERENCIA ESTADÍSTICA Tema 3.1: Muestreo. M. Iniesta Universidad de Murcia

CONCEPTOS BÁSICOS DE PROBABILIDAD Y ESTADÍSTICA

2 Algunos conceptos de convergencia de sucesiones de variables aleatorias

Matemáticas 1 1 EJERCICIOS RESUELTOS: Funciones de una variable. Elena Álvarez Sáiz. Dpto. Matemática Aplicada y C. Computación

Introducción a las medidas de dispersión.

Polinomio de una sola variable. , llamaremos polinomio de la variable x a toda expresión algebraica entera de la forma:

Evaluación NOMBRE APELLIDOS CURSO Y GRUPO FECHA CALIFICACIÓN. 9. Límite y continuidad

Transcripción:

Notas Docetes Estadística para Ecoomistas Carlos Casacuberta Nota Docete No. 08

Diploma e Ecoomía 004 Departameto de Ecoomía Facultad de Ciecias Sociales Estadística Notas de clase. Itroducció La estadística y su viculació co la ecoomía La Estadística ue dos campos de estudio:. El estudio sistemático de datos uméricos, el resume y el aálisis de la iformació coteida e ellos;. La teoría del azar y de la icertidumbre, o e otros térmios, la teoría de la probabilidad. Ambos so complemetarios, auque claramete distiguibles. E geeral los datos describe atributos de iterés e u cojuto de objetos de estudio. Podemos cosiderar dichos datos e sí mismos, y buscar maximizar el uso de la iformació que os brida. Si embargo, la teoría probabilística va más allá, e implica la utilizació de modelos, lo que lleva a ver los datos como realizació de ua ley más geeral. A partir de la iteracció del aálisis de datos y la teoría probabilística surge u tercer campo de estudio, que comprede la prueba de hipótesis a partir de datos muestrales, o iferecia estadística. Dado que este curso está destiado a ecoomistas, destacamos los siguietes elemetos de la viculació de la estadística co el aálisis ecoómico. E primer térmio podemos costatar que la metodología estadística iterviee e la geeració de los datos ecoómicos. Es el caso cuado es imposible observar los actos ecoómicos de la totalidad de los milloes de agetes que iteractúa e ua ecoomía y se debe obteer la iformació correspodiete por muestreo y realizar iferecias sobre las implicacias de cierta hipótesis a ivel de la població completa. La estadística proporcioa herramietas teóricas para abordar este problema. E segudo lugar, la estadística es el fudameto de la ecoometría, que puede defiirse e forma amplia como el estudio sistemático de los feómeos ecoómicos utilizado datos observados. Para ello iterviee la metodología estadística y la teoría ecoómica. Ua primera zoa de iteracció está dada porque e los propios modelos teóricos de la ecoomía se utiliza la estadística a fi de repr3esetar situacioes de icertidumbre e forma probabilística. La teoría ecoómica produce descripcioes de los feómeos ecoómicos e forma de modelos, formulados e forma matemática, que icorpora u cojuto de variables y establece relacioes etre las mismas buscado explicar y predecir. E los modelos

ecoómicos las relacioes etre las variables o siempre puede supoerse razoablemete como de aturaleza exacta o determiística. Dichos modelos icorpora etoces la existecia de icertidumbre sobre los resultados de las accioes de los agetes ecoómicos. Por ejemplo, ua empresa que determia su producció, lo hace e codicioes de icertidumbre respecto al ivel de precios agregado o su variació (iflació). Muchas veces importa para los agetes los valores esperados de variables futuras, debiedo hacer el mejor uso posible de la iformació presete para elimiar al meos ua parte de la icertidumbre sobre los períodos siguietes. La estadística es la base de los distitos efoques utilizados para modelar las expectativas de los agetes ecoómicos sobre hechos futuros. U segudo ámbito de iteracció etre la estadística y la ecoomía está dado por el aálisis ecoométrico propiamete dicho. Idealmete, los modelos ecoómicos está costruidos buscado explicar feómeos observados, por lo que debería compreder u cojuto de hipótesis o afirmacioes sobre la forma e que se geera esos datos y sus relacioes. Por tato, utilizado datos será posible realizar pruebas acerca de las cosecuecias de las afirmacioes teóricas e el campo de los datos observables, estudiado así e qué medida la evidecia observable es cosistete o o co determiada afirmació respecto al feómeo que se estudia. El marco e que se realiza esta evaluació es el de cosiderarla como ua decisió e codicioes de icertidumbre, y por lo tato sujeta a la posibilidad de error. La teoría probabilística iteta uir a ua medida de dicho error (precisió) ua calificació adicioal e térmios de cofiaza, subrayado el compromiso que surge etre ambas, de maera que sólo resulta posible aumetar ua a costa de reducir la otra. E ciertos casos será posible experimetar, tratado de estudiar, e forma cotrolada, las decisioes ecoómicas de los agetes ate cambios e el etoro, tratado de aislar sus efectos. Si embargo, la ecoomía es ua ciecia e que la experimetació es e la imesa mayoría de los casos imposible ya que o se puede reproducir las codicioes de la vida ecoómica de maera artificial. E ambos casos, la teoría probabilística proporcioa u marco para coceptualizar los procesos de geeració de los datos y su utilizació para la compresió de los feómeos ecoómicos. E el curso se explora brevemete la estadística descriptiva. A cotiuació se aaliza ocioes de probabilidad. Se itroduce los coceptos de variable y vector aleatorio, y se preseta u cojuto de distribucioes de probabilidad de iterés. Fialmete, se revisa las ocioes de iferecia estadística, a través de ejemplos e la estimació putual y por itervalos y la prueba de hipótesis. Para este curso solamete se requiere elemetos básicos de cálculo. E el apédice se desarrolla alguas herramietas matemáticas adicioales.. Estadística descriptiva El primer tema que cosideraremos es el de las técicas para el resume de la iformació coteida e u cojuto de datos acerca de atributos o características de u objeto de estudio. De allí el ombre de estadística descriptiva.

El aálisis de datos comieza co ua colecció de objetos para aalizar. Hay distitas formas de aproximarse a este cojuto. Si embargo, para la exposició que sigue se supoe que el cojuto observado os iteresa por sí mismo y o como represetativo de u cojuto más amplio de objetos. Geeralmete esta o suele ser la situació, debido a que el úmero de objetos de iterés suele ser muy grade, tal que o es posible examiar cada uo de ellos idividualmete, como por ejemplo los estudiates de la Uiversidad, los hogares de ua ciudad de Motevideo, las empresas productoras de ciertos biees o servicios. Este cojuto de objetos recibe el ombre de població. Solamete a veces es posible estudiar directamete a la població e su cojuto, como e el caso por ejemplo del Ceso Nacioal de Població y Vivieda. E otros casos, se realiza solamete u muestreo de los hogares del país, como es el caso por ejemplo de la Ecuesta Cotiua de Hogares. De allí surge la ecesidad de la iferecia desde u cojuto reducido de objetos (muestra) al total de la població que o ha sido observada, que se estudiará más adelate. Si embargo, abordar los datos e sí mismos permitirá descubrir métodos que será de utilidad e esta tarea. Cosideramos ua població compuesta por N elemetos. Cada objeto o elemeto e este cojuto está idetificado por el ídice i, u úmero etre y N. E cada elemeto de la població observaremos u atributo que será u úmero y que deotamos x, co u subídice para desigar el elemeto de la població al que hacemos referecia. La població está represetada por el cojuto {x, x, x 3,..., x N } o {x i, i =,,..., N}. Medidas de posició o tedecia cetral Ua vez que se tiee el cojuto de los datos, toda la iformació está coteida e la lista de los N úmeros, y resulta evidete la dificultad de maejaros cuado N es grade. Podemos represetar gráficamete estos úmeros e la recta real y tedremos ua idea de cómo se agrupa los datos y dóde se ecuetra. Si deseáramos describir este cojuto, ua forma razoable de empezar sería itetar e qué porció del cojuto de los reales se ecuetra. Podríamos ordear las observacioes de meor a mayor, y etiquetarlas como x, x, x 3,... x N, de maera que x x x 3... x N. De esta maera sabemos que e el itervalo compredido etre el máximo y el míimo de los datos [x, x N ] está toda la iformació de iterés. No obstate, a meos que la distribució de los datos sea muy uiforme al iterior del itervalo, el máximo y el míimo puede ser valores atípicos, muy poco frecuetes e los datos observados. Surge etoces la preguta de si es posible obteer ua medida igualmete cocisa de la posició de las observacioes que

) esté cerca de los datos y ) e su costrucció se utilice la iformació del cojuto de éstos. Presetamos dos formas de realizar esto. La media (aritmética) se defie como x = x + x + x3 + N L + x N = N i = xi N Se trata de ua suma poderada, e la que todas las observacioes cotribuye a la suma y tiee el mismo poderador /N. El cocepto de promedio es ua idea familiar, como valor represetativo de ua colecció de úmeros, y su característica pricipal cosiste e que, e algú setido, "está cerca" del cojuto de úmeros e la població. Ello se puede ver de la siguiete maera: supogamos que hay u úmero K tal que la suma de las diferecias x i K, elevadas al cuadrado, sea míima. Si sumamos las diferecias y os plateamos las codicioes de primer orde para u míimo obteemos: N i = ( x K ) i K = N i = ( x K ) i = 0 K = N i = N x i Si teemos las observacioes ordeadas de meor a mayor, la mediaa se defie como Mediaa X = x (N+)/ si N es impar; ½ (x N/ + x (N/)+ ) si N es par. Si se tiee u úmero de observacioes par la mediaa es el promedio de las observacioes cetrales. Si el úmero de datos es impar la mediaa es la observació cetral. De modo que el 50% de los datos so meores o iguales que la mediaa y 50% de los datos so mayores o iguales que la mediaa. La media y la mediaa difiere e la forma e que sus valores so afectados por observacioes ubicadas relativamete lejos de la media (outliers, del iglés "caer fuera"). Icluir dichas observacioes afectará e geeral más a la media que a la mediaa, como se muestra e la figura siguiete.

mediaa media 0 0 0 30 40 50 60 70 Medidas de dispersió Ua vez que hemos dado ua idicació acerca de la posició de los datos, os iteresa coocer si los datos se ecuetra agrupados e u etoro vecio de la media o si por el cotrario se halla dispersos y alejados etre sí. Ua serie de medidas de dispersió se basa e las distacias a la media, o desviacioes de las observacioes. Como la suma de las desviacioes es cero, las elevamos al cuadrado ates de promediarlas, co lo que se obtiee siempre resultados positivos (efatizado tambié la cotribució a la suma de las desviacioes mayores e valor absoluto). La media de las desviacioes de la media elevadas al cuadrado es la variaza s. s N i = = ( x x) i N Hay ua forma abreviada coveiete para calcular la variaza, que se obtiee desarrollado el cuadrado de la expresió aterior. s ( x x) i = N N ( + ) = + N xi xi x x xi x xi N x = i N i = = N N = N N i = i = N i = x i x La variaza es igual a la media de los cuadrados meos el cuadrado de la media. Al tomar la raíz cuadrada de la variaza obteemos la desviació stadard s, que tiee las mismas uidades de media que la media y que las observacioes. Stadard quiere decir que este valor es algo co lo que se compara, es u patró o uidad de mediada de las dispersió de las observacioes co respecto a la media. Si cosideramos uevamete a los datos ordeados e forma ascedete, podemos defiir las medidas de dispersió asociadas a la mediaa, que so las siguietes:

El rago, que se defie como: Rago = x N x y el recorrido itercuartil, que se defie como el itervalo etre el tercer y el primer cuartil. Para defiir los cuartiles, supogamos que N+ es divisible etre 4. Defiimos etoces los cuartiles C, C, C 3, como C = x (N+)/4 C = mediaa X El recorrido itercuartil queda defiido como C 3 = x 3(N+)/4 recorrido itercuartil = C 3 C y correspode al rago e que está coteidas el 50% de las observacioes cetrales. Datos agrupados Es frecuete que e ua població los atributos que observamos tome u úmero reducido de valores posibles, co muchos elemetos de la població tomado u mismo valor. Es el caso, por ejemplo del úmero de miembros como atributo de u hogar, que típicamete será u úmero etre y 6, co ua pequeña proporció de casos por ecima. Dichos datos recibe el ombre de discretos. E lugar de eumerar la població, la forma más coveiete de presetar los datos es la de ua tabla de frecuecias. Para cada valor de los posibles, registramos cuatos casos e la població toma dicho valor. Si N+ o es divisible etre 4 etoces los valores de los cuartiles debe iterpolarse. Para ello defiimos la parte etera de u úmero como el etero más cercao meor que u úmero dado y escribimos [N] = parte etera de N. E este caso los valores de los cuartiles se defie como: C = x [(N+)/4] + (x [(N+)/4] + - x [(N+)/4] ) ((N+)/4 - [(N+)/4]) C = x [(N+)/] + (x [(N+)/] + - x [(N+)/] ) ((N+)/ - [(N+)/]) C 3 = x [3(N+)/4] + (x [3(N+)/4] + - x [3(N+)/4] ) (3(N+)/4 - [3(N+)/4]) Recordemos que los datos está umerados e forma ascedete y que el subídice os idica el lugar del dato (por eso se toma la parte etera). Ua vez tomada la parte etera de (N + )/4 se ubica el dato y se corrige por u factor igual a la diferecia etre este dato y el siguiete multiplicada por la fracció etre (N + )/4 y su parte etera.

Supogamos que existe k posibles valores diferetes: m, m,...,m k. Deotamos f, f,...,f k a la frecuecia absoluta de cada valor (el úmero de veces que aparece). Toda la iformació que ecesitamos está e los k pares de úmeros (m i, f i ). La misma se puede represetar e el siguiete diagrama de barras: f i 3 4... Otra forma que toma los datos agrupados es cuado o se iforma los valores exactos de los datos, sio se preseta u cojuto de itervalos o clases y la iformació de cuátos datos cae e cada uo de ellos. Ello puede obedecer a que e ua ecuesta o se preguta el valor exacto sio solamete la perteecia a cierto itervalo, o a que el úmero de valores diferetes sea ta grade que sea impracticable presetar ua tabla. U ejemplo típico so los datos sobre igresos de las persoas. Los pares so ahora de la forma: {f i, [L i, U i )} dode L i es la cota iferior del itervalo y U i la superior, y la otació [, ) idica que el itervalo icluye la cota iferior pero o la superior. Estos datos puede represetarse e u histograma: f i /(U i L i ) 0 0 0 30 40 60 x E este caso las frecuecias está represetadas por las áreas y o por las alturas de los rectágulos cuya base igual a la amplitud de cada uo de los itervalos o clases. Podemos defiir las medidas de posició y de dispersió para datos agrupados:

Media: x = N k i = f i m i Notamos que otra vez se trata de ua suma poderada, o de las observacioes, sio de los valores posibles. El poderador es f i /N o la frecuecia relativa. Si embargo puede mostrarse que es exactamete igual a la media para datos o agrupados, ya que e la suma hay para cada valor xi, f i sumados iguales, cada uo co u poderador igual a /N. Desviació stadard: La fórmula de la desviació stadard para datos agrupados segú los valores es la siguiete: s = N k i = f i ( m x) i Cuado los datos so discretos, los m i so valores de los datos, pero cuado los datos está agrupados por itervalos, debe elegirse algú valor que represete a los valores observados. Suele tomarse los putos medios del itervalo: m i = (L i + U i )/ Ello lleva implícita la suposició de que los valores se distribuye de maera uiforme detro de cada itervalo o clase. E este caso perdemos la iformació sobre qué sucede al iterior de cada itervalo, y la media ya o es igual a la que se obtedría si se dispusiera de las observacioes idividuales si agrupar. Co datos discretos, obteer la mediaa o los cuartiles o preseta dificultades, ya que puede fácilmete determiarse cuál es el valor hasta el que se acumula el porcetaje deseado de las observacioes, sumado las frecuecias relativas. Para obteer la mediaa y las cuartiles e el caso de datos agrupados debemos proceder por iterpolació. Modo Ua medida de posició adicioal es el modo, que es el valor más frecuete e el caso de datos si agrupar, y la clase co la frecuecia más alta (itervalo o clase modal) e el caso de datos agrupados.

Otras características de la distribució de los datos: Asimetría La idea de asimetría surge de la relació etre el "cuerpo" de la distribució (o aquella zoa cercaa a la media) y las "colas", o valores alejados de la media, dode e geeral teemos u úmero meor de observacioes. Ello implica de algú modo la oció de que las distribucioes tiee ua clase modal. E el caso de las distribucioes bimodales, existe relativamete pocos datos e la vecidad de la media. f i /(U i L i ) Distribució bimodal x El cocepto de simetría se aplica e el caso de ua distribució uimodal. E el caso de ua distribució uimodal. La simetría idica que o hay ua tedecia de los valores lejaos a la media a agruparse e ua direcció e particular. f i /(U i L i ) Distribució simétrica x

Por el cotrario la idea de asimetría se refiere a la tedecia de los valores extremos a agruparse e ua direcció particular. f i /(U i L i ) f i /(U i L i ) Asimetría a la derecha x Asimetría a la izquierda x La medida de asimetría está dada por la expresió siguiete: Coef. Asimetría = N N i = ( x x) s 3 i 3 Aquí tomamos como e el caso de la variaza u promedio de las desviacioes, pero elevadas al cubo e vez de al cuadrado, lo que produce que ) los valores alejados de la media cotribuye a la suma e mayor medida, y ) las desviacioes coserva su sigo origial, Si las desviacioes egativas pesa más que las positivas, el coeficiete de asimetría tedrá sigo egativo (distribució asimétrica a la izquierda), mietras que valores positivos implica asimetría a la derecha (ua distribució simétrica tiee u coeficiete de 0). La divisió etre la desviació stadard elevada al cubo determia que el coeficiete de asimetría o depeda de las uidades de medida empleadas. Kurtosis La kurtosis describe la relació que existe etre el cuerpo de ua distribució y las colas. La expresió para el coeficiete de kurtosis es la siguiete: Kurtosis = N N i = ( x x) s 4 i 4 Valores reducidos implica que las colas de la distribució pesa poco co respecto al cuerpo (leptokurtica). Por el cotrario, cuado los valores so altos la distribució tiee ua forma más "achatada": las colas tiee u peso importate co respecto al cuerpo de la distribució

(platikúrtica). Por este motivo a veces se mecioa el coeficite de kurtosis como coeficiete de aputamieto. f i /(U i L i ) f i /(U i L i ) Leptokúrtica x Platikúrtica x Nubes de putos y correlació Cosideremos el caso e que ua població geera pares de observacioes, como por ejemplo el cosumo y el igreso mesual de los hogares de Motevideo medido e pesos. El problema que os plateamos es ver si ambos atributos, que llamaremos X e Y, está relacioadas de algua maera y e qué forma. Ua de las formas de represetar los datos que sugiere la relació etre ambos atributos es el gráfico de ube de putos, e el que hemos represetado las medias muestrales de X e Y. y y x x

E el ejemplo imagiario del gráfico es evidete la existecia de algú tipo de relació (a valores altos de X correspode valores altos de Y y viceversa). Esto se puede ver más claro si movemos los ejes del gráfico a los putos de las medias muestrales de las observacioes. E el siguiete diagrama hemos restado el valor de la media a cada observació de X e Y, es decir las hemos expresado e forma de desviacioes. Todos los putos e que X e Y excede la media está e el cuadrate II (ambos positivos); e el cuadrate IV ambas desviacioes so egativas. E los cuadrates I y III las desviacioes de ua y otra variable tiee diferete sigo. I y y II x x IV II I Resulta claro aquí que hay más putos e los cuadrates II y IV que los que hay e los cuadrates I y III. E este caso decimos que hay ua correlació positiva etre X e Y: valores altos de X está asociados co valores altos de Y y viceversa. Si o hubiera relació algua etre X e Y podríamos esperar que los putos estuviera dispersos alrededor de la media de maera que hubiera más o meos el mismo úmero de putos e cada cuadrate. Ello sugiere ua medida de asociació etre ambos atributos, llamada covariaza: N s XY = ( x x)( y y) N i = La covariaza es tambié u promedio, es la media de los productos de las desviacioes. Los putos e los cuadrates II y IV cotribuye a la suma co sumados positivos, mietras que los putos e los cuadrates I y III lo hace co sumados egativos. La covariaza puede ser positiva y egativa y o está acotada, depediedo de las uidades de medida de X y de Y que o tiee porqué ser las mismas. Es más coveiete etoes teer u idicador que o depeda de las uidades de medida empleadas, y para ello se utiliza el coeficiete de correlació, que está defiido como el cociete etre la covariaza y el producto de las desviacioes stadard de X y de Y. r XY = i s s x XY s y i

El coeficiete de correlació siempre está compredido etre y (o lo demostraremos). Cuado el coeficiete de correlació es cercao a cero etoces hay baja o ula correlació etre las variables, e cambio valores cercaos a y a implica alta correlació, positiva y egativa respectivamete. La correlació idica ua asociació de tipo lieal etre ambos atributos. Si la relació fuera exactamete lieal tedríamos r XY igual a o a. 3. Probabilidad Efoques de la probabilidad Ituitivamete asociamos probabilidad co el grado de verosimilitud o certeza que asigamos a cierto suceso. Al decir "es improbable que Jua vega hoy", o "probablemete mañaa llueva", usamos la expresió para referiros a u suceso que puede ocurrir o o y que os parece más o meos esperable. Para precisar la defiició comezamos co ua breve discusió de u cojuto de diferetes efoques acerca de qué es la probabilidad. El primero que se preseta es el llamado efoque clásico (o a priori) defie la probabilidad de la siguiete maera: Si u experimeto aleatorio (defiido iformalmete como u suceso cuyo resultado se descooce co aterioridad a que ocurra) puede producir resultados igualmete verosímiles y mutuamete excluyetes, de los cuales A posee el atributo A, etoces la probabilidad de que ocurra A es igual a la fracció A / (casos favorables/casos posibles). Ejemplo: Supogamos que alguie quiere calcular la probabilidad de obteer dos "caras" si lazamos ua moeda dos veces. Los resultados excluyetes e igualmete verosímiles so cuatro: {(C,C), (C,N), (N,C), (N,N)}. Cotado, vemos que úicamete e uo de ellos obteemos dos caras co lo que deducimos que la probabilidad de dicho suceso es igual a /4. U primer problema de esta defiició es que implica restrigirse a evetos que tiee u úmero fiito de resultados. Sólo cuado está defiido el cojuto de los resultados igualmete verosímiles podemos cotar aquellos e que ecotramos el atributo A. El segudo problema que surge es que esta defiició ecesita que los resultados posibles sea "igualmete verosímiles". Esto vuelve a la defiició circular, y o os permite determiar probabilidades cuado o sabemos a priori si los resultados so igualmete verosímiles. A diferecia del efoque clásico, el efoque frecuecista (o a posteriori) propoe ua idea de

probabilidad ítimamete relacioada co la posibilidad de repetir determiado experimeto y observar el resultado e u úmero, arbitrariamete grade, de realizacioes. Es crucial que esto pueda hacerse e las mismas codicioes cada vez, auque cada resultado idividual siga siedo impredecible. Postulamos que existe u úmero P(A) que es la probabilidad del suceso A, y lo aproximamos por la frecuecia relativa de su ocurrecia e u úmero grade de casos. P (A) = lim A Esta defiició permite que la probabilidad o quede restrigida a experimetos co u cojuto de resultados equiprobables, pero requiere que sea posible ua larga serie de pruebas repetidas. La probabilidad surge de la estabilidad observable de las frecuecias relativas. La preguta e este caso es si se puede hablar de la probabilidad de evetos que o cae detro de la clase de los repetibles e codicioes aproximadamete similares. Cual es la probabilidad que u comado suicida secuestre al profesor cuado abadoe el saló de clase? Cual es la probabilidad de que se descubra la cura para el SIDA ates del año 00? Estas pregutas puede legítimamete icluirse detro de u marco probabilístico detro del efoque subjetivo de la probabilidad. La defiició e este caso es que la probabilidad P(A) represeta el grado subjetivo de certeza sobre la ocurrecia del suceso A e u experimeto futuro. Ua ilustració sobre cómo puede revelarse esta asigació subjetiva de probabilidades cosiste e cosiderar la preguta "cuáto me tiee que pagar para que yo acepte apostar u peso si el eveto A sucede". Para evaluar la apuesta usamos el criterio de la gaacia esperada, defiida iformalmete como la suma poderada de los motos que gao y pierdo e cada caso, cada uo multiplicado por la probabilidad de que ocurra ua y otra cosa. U criterio para decidir aceptar la apuesta podría ser "ua apuesta es justa si la gaacia esperada es al meos 0", es decir o hay razoes para esperar perder diero. Partimos de ua probabilidad descoocida que llamamos p, y la disposició subjetiva a aceptar cierta apuesta "revela" esta probabilidad. Por ejemplo, el suceso A podría ser "Peñarol vece a Nacioal e el siguiete clásico". Si, por ejemplo, estuviera dispuesto a aceptar,5 pesos por cada peso apostado, mis gaacias esperadas equivale a lo que gao (,5 cetésimos) multiplicado por la probabilidad de gaar (que llamamos p) meos la apuesta ( peso) multiplicada por la probabilidad de perder ( p). La apuesta parecerá justa si mi gaacia esperada es positiva. Gaacia esperada =,5p ( p) =,5p 0 p /,5 = 0,44 Por lo tato mi aceptació de la apuesta estaría revelado que yo asigo ua probabilidad subjetiva al eveto mayor que el 44%. E qué me baso? Puedo haber examiado los registros históricos y calculado la frecuecia relativa de las victorias, pero tambié puedo modificar mi apreciació de acuerdo a las codicioes del clima, las declaracioes de los directores

técicos, el hecho de que cierto jugador esté o o lesioado, etc. Esto muestra que difícilmete puede cocebirse ua probabilidad subjetiva que o tega e cueta experiecia aterior e codicioes aproximadamete similares. Tambié es útil distiguir etre la total igoracia y el cosiderar a los evetos posibles como equiprobables. La igoracia total se idetifica más bie co la imposibilidad de asigar probabilidades, mietras que la equiprobabilidad tiee que ver co que o hay igua razó para cosiderar algú resultado como más probable que otro. Para el tratamieto matemático de la probabilidad, se comieza por defiir u cojuto de axiomas, desarrollado e forma deductiva el cojuto de proposicioes y teoremas utilizado la lógica matemática. Lo iteresate es que la defiició matemática de probabilidad o requiere e sí misma de igua iterpretació sobre lo que la probabilidad "es" (clásica, frecuecista o subjetiva), sio que las comprede a las tres y permite e cada caso el cálculo de las probabilidades correspodietes. Experimeto aleatorio Los axiomas de la probabilidad que desarrollaremos más adelate so ua descripció idealizada de u mecaismo aleatorio. El puto de partida es la oció de u experimeto aleatorio. Def.: U experimeto aleatorio, deotado por,ع es u experimeto que satisface las siguietes codicioes: i) todos los posibles resultados so coocidos a priori ii) e ua realizació particular el resultado o es coocido a priori iii) el experimeto puede ser repetido bajo idéticas codicioes. Espacio muestral y evetos aleatorios Podemos defiir ahora dos térmios eseciales e probabilidad, espacio muestral y eveto aleatorio. Ambos se defie e térmios de cojutos. El espacio muestral es el cojuto de todos los resultados posibles de u experimeto aleatorio, y lo deotamos S. U eveto aleatorio es cualquier subcojuto del espacio muestral S. Los evetos aleatorios se defie e térmios de los elemetos de S. Si deomiamos A a u cojuto de elemetos de S, decimos "el eveto A ha ocurrido" si el resultado del experimeto aleatorio fue uo de los resultados coteido e A. El cojuto de los evetos, o espacio de los evetos, lo deotamos por I. Los elemetos de S recibe el ombre de "evetos elemetales". Por ejemplo, e el caso del

clásico el cojuto de resultados elemetales es: S = {"gaa Peñarol", "gaa Nacioal", "empate"} No siempre e el cojuto S hay u úmero fiito de evetos elemetales. Por ejemplo, el experimeto aleatorio "tirar ua moeda hasta que salga cara" tiee como resultados posibles ua serie de -uplas de la forma: S = {(C), (NC), (NNC), (NNNC), (NNNNC)...} que costituye u cojuto de ifiitos elemetos. Los evetos elemetales geera a su vez uevos evetos, a través de las operacioes usuales etre cojutos (la uió y la itersecció). Por ejemplo, el eveto "Nacioal o pierde" está formado por la uió de los evetos "gaa Nacioal" y "empate". Si A es u eveto aleatorio, A c es el eveto "A o ocurre". El espacio muestral S, que cotiee todos los resultados del experimeto, se puede pesar como u eveto, el eveto "el experimeto tiee u resultado". E este setido, dado que S ocurre siempre, se puede decir que S es el "eveto seguro". El cojuto vacío,, está coteido e el cojuto de los evetos, como el eveto "el experimeto o tiee u resultado". De este modo, el eveto es el "eveto imposible". De la misma maera, A B represeta el eveto "A o B ha ocurrido", y A B represeta el eveto "ambos A y B ha ocurrido". Se puede asimismo defiir la idea de evetos excluyetes, que so dos evetos A y B tales que A B =, lo que puede leerse "si ocurre A etoces B o puede ocurrir y viceversa". Recordado la defiició de partició, ua colecció de evetos es ua partició si "uo y sólo uo de ellos puede ocurrir". σ álgebra La teoría impoe cierta estructura al cojuto I de los evetos. Esta estructura cosiste e que I sea u σ álgebra asociado a S. U cojuto I (o vacío) de subcojutos de S es u σ álgebra si cumple co : i) Si A I etoces A c I ii) Si A i I, i =,,... etoces U i= A i I De ello se deriva que, para uestro cojuto I de los evetos se cumple que:

i) S I ii) I Ejemplo. Cosideremos el experimeto de tirar dos moedas. El espacio de resultados está dado por el cojuto S = {(CC), (CN), (NC), (NN)}. U σ álgebra asociado puede defiirse como: I = {{S}, { }, {(CC)}, {(CN), (NC), (NN)}}. No hay u úico σ álgebra asociado a cada experimeto, y su coformació depede de los evetos de iterés. Por ejemplo, e el marco del mismo experimeto puede defiirse otro σ álgebra I de la siguiete maera (comprobar como ejercicio que ambos cojutos so σ álgebra): I = {{S}, { }, {(CC), (NN)}, {(CN), (NC)}}. E geeral, partiremos del cojuto S de resultados posibles. Defiidos los evetos de iterés detro del experimeto, procederemos a completar la clase I co las uioes y complemetos correspodietes. Axiomas de la probabilidad La probabilidad es ua fució que asocia a cada eveto A perteeciete a I u úmero que deotamos P(A), "la probabilidad de que A ocurra". Dicha fució queda defiida mediate los siguietes axiomas: Def. : Probabilidad es ua fució P ( ): I [0, ] (defiida e I y que toma valores e el itervalo cerrado [0, ] de los úmeros reales), que cumple co los siguietes axiomas: ) para cualquier A I, P (A) 0. ) P (S) = 3) Si { } es ua secuecia de evetos mutuamete exclusivos e I, etoces A i i= ( A ) = P( ) P U i= i A i i= La tera (S, P, I) recibe el ombre de espacio de probabilidad. De los axiomas básicos se deduce u cojuto de reglas: a) A y A c so por defiició disjutos, y además A A c = S, de maera que

P(A) + P(A c ) = P (S) =. Esto os da la regla P(A c ) = P(A) b) P( ) = P(S) = 0 c) B se puede escribir como la uió de dos cojutos disjutos: B = (B A) (B A c ) de modo que P(B) = P (B A) + P (B A c ) Al mismo tiempo, P (A B) = P(A) + P (B A c ) de modo que usado la relació aterior teemos que P (A B) = P(A) + P(B) P (A B). Probabilidad codicioal Cosideremos ahora el caso e que la iformació que teemos acerca de la ocurrecia de cierto eveto se modifica y adquirimos algú coocimieto parcial acerca del mismo. No coocemos si el eveto ha ocurrido -si lo supiéramos o tedría setido hablar de probabilidad- pero teemos iformació de que algú otro eveto ha ocurrido. cómo so afectadas las probabilidades que asigamos a la ocurrecia del primer eveto? Por ejemplo, supogamos que queremos adiviar cuál es ua carta extraída al azar de u mazo de 48 cartas. Si uestra adiviaza fuera, digamos, que la carta es el rey de espadas y llamamos a ese eveto A, la probabilidad que asigaríamos a dicho eveto, si coocer otra iformació, sería P(A) = /48. Supogamos ahora que os dice que "el palo es espadas" y llamamos a este eveto B. Esto modifica la probabilidad que asigamos a uestro eveto origial e dos setidos. Por ua parte, sabemos que, termiatemete, igua de las cartas que o so espadas puede salir. Esto reduce uestro espacio muestral a las espadas. E segudo lugar, el rey de espadas sigue siedo posible, y dado que ua de las doce espadas es el eveto que os iteresa, podemos obteer la probabilidad de A codicioal a que el eveto B ha ocurrido: P(A/B) = / o tambié "probabilidad de A dado B". E el caso particular de uestro ejemplo P(A/B c ) = 0.

Para calcular probabilidades codicioales se utiliza la regla: P P(A/B) = ( A B ) P( B) Las probabilidades relevates para cualquier eveto A pasa a ser ahora las probabilidades del eveto (A B). El hecho que B ha ocurrido reduce el espacio muestral al eveto B, y la divisió por P(B) itroduce este escalamieto. E uestro ejemplo, P(rey de espadas /espadas) = P(rey de espadas espadas)/p(espadas)= (/48)/(/4) = /. Idepedecia A partir del cocepto de probabilidad codicioal, podemos ver que o siempre saber que ocurre B os va a llevar a modificar uestra evaluació de las probabilidades que le asigamos a A. Por ejemplo, cosideremos al eveto A "sacar u as de u mazo de cartas", y al eveto B "la carta extraída es ua espada". Sabemos que P(A) = 4/48 = / y os iteresa determiar si coocer la ocurrecia de B modifica la evaluació de la probabilidad de que A ocurra. Calculado la probabilidad codicioal obteemos que P(A/B) = P(A B) / P(B) = (/48)/(/48) = / E este caso coocer la ocurrecia de B o modifica la probabilidad de que ocurra A. Def. Dados dos evetos A y B, si se cumple que P(A/B) = P(A) ambos evetos so estadísticamete idepedietes. Aplicado la defiició de probabilidad codicioal obteemos que, si dos evetos A y B so idepedietes, P ( A B) P( B) = P(A) de dode deducimos la regla de la multiplicació para evetos idepedietes: Si A y B so evetos idepedietes, etoces P(A B) = P(A) P(B) Por último, uestro ejemplo muestra que idepedecia o es lo mismo que exclusió mutua. Los evetos del ejemplo puede ocurrir ambos a la vez, (la carta puede ser ua espada y ser

u as) y so idepedietes etre sí. Si dos evetos A y B, o vacíos, so mutuamete excluyetes o disjutos, es decir su itersecció es vacía, etoces P(A/B) y P(B/A) so siempre iguales a cero, por lo que o sería idepedietes. E tal caso, coocer la ocurrecia de A modifica la evaluació de la probabilidad de que B ocurra, hasta el puto de implicar que B es imposible. Coviee aclarar si embargo que cuado se cosidera más de dos sucesos a la vez, para que sea todos ellos idepedietes etre sí o basta co que sea idepedietes dos a dos. Regla de Bayes Así como teíamos tambié se cumple que y por lo tato P P(A/B) = ( A B ) P( B) P P(B/A) = ( A B ) P( A) de lo cual obteemos la expresió P(A B) = P(A/B) P(B) = P(B/A) P(A) P P (B/A) = ( A/ B ) P( A) P(B) coocida como la Regla de Bayes. Puede etederse como ua regla para revisar probabilidades a la luz de la icorporació de ueva iformació. Partimos de u eveto B que o ha sido observado pero al que se asiga ua probabilidad. Llamamos a esta probabilidad P(B) a priori. Si de algua maera sabemos que A ha ocurrido, si coocemos las probabilidades codicioales P(A/B) y P(A/B c ), podemos revisar uestra evaluació de P(B) y llegar a P(B/A) o probabilidad posterior. Co P(A/B) y P(A/B c ) recostruimos P(A) utilizado el hecho que P(A) = P(A B) + P(A B c ) = P(A/B)P(B) + P(A/B c )P(B c ). Por ejemplo, tomemos el experimeto cosistete e etrevistar a los itegrates activos laboralmete de u hogar y pregutarles su codició de jefe de hogar o o y su codició de ocupado o desocupado. Tomemos el eveto "el idividuo está desempleado" y los evetos "el idividuo es jefe del hogar" y "el idividuo o es jefe de hogar". Supogamos que, observado al cojuto de los desocupados se pueda decir que las probabilidades so: P(jefe de hogar/ desempleado) = 0,5 P(jefe de hogar/ o desempleado) = 0,85

Supogamos que uestra probabilidad a priori de que u idividuo esté desempleado, si observar su codició de jefe de hogar es de 0,0. Notamos que la probabilidad de "jefe de hogar" es igual a 0,78 = (0,5) (0,0) + (0,85) (0,90), dado que los evetos desempleado y o desempleado costituye ua partició de S. La regla de Bayes da las probabilidades a posteriori de estar desempleado dado que el idividuo es jefe de su hogar como P(desempleado/ jefe de hogar) = (0,5) (0,0)/(0,78) = 0,0 Si cosideramos u cojuto de r evetos B, B,..., B r tales que costituye ua partició de S, todos co probabilidades distitas de cero, etoces cualquier eveto A coteido e S ocurre a través de la ocurrecia de alguo de los B i. A su vez las iterseccioes de A co cada uo de los B i so disjutas dos a dos, de modo que podemos escribir: P (A) = P r i= r ( A Bi ) = P( A Bi ) P( B i i= / ) Para el caso de evetos B, B,..., B r que costituye ua partició de S, todos co probabilidades distitas de cero, etoces la regla de Bayes es: P ( B / A) i = r i= P P ( A/ B ) ( B ) P( A/ B ) i i i 4. Variables aleatorias Defiicioes Se itroduce a cotiuació el cocepto de variable aleatoria, si duda el más importate e el cotexto de este curso. Nos servirá para redefiir uestro espacio de probabilidad, haciédolo más flexible, y adaptarlo al cojuto de situacioes e que el resultado de u experimeto aleatorio es o puede represetarse por u úmero. Los experimetos aleatorios de iterés para la ecoomía suele casi siempre geerar resultados uméricos (por ejemplo, el PBI, la tasa de iflació, tasa de desempleo, etc.). Cuado o es así, la variable aleatoria tambié permite asigar úmeros a resultados cualitativos, haciedo más maejable uestro espacio de probabilidad si cambiar su estructura básica. El espacio (S, P, I) de probabilidad estudiado hasta aquí preseta el problema de que el domiio de la fució P es u σ álgebra de evetos, lo que hace su maipulació complicada. Para calcular las probabilidades de evetos se debe derivar los elemetos de I, lo cual puede ser ua tarea difícil cuado se trata de cojutos co muchos o ifiitos elemetos. Cosideremos ahora ua fució que asiga a cada elemeto del espacio muestral S uo y sólo u elemeto del cojuto de los úmeros reales: X( ) : S R

Co esto se establece la base para obteer u mapa que va de los evetos a los úmeros reales. Usamos la variable aleatoria para describir evetos, de modo que la ocurrecia de cierto eveto ahora estará represetada por la fució X tomado valores e u itervalo determiado de los reales. No cualquier fució, si embargo, preservará la estructura de probabilidad de uestro espacio origial. Como las probabilidades está defiidas para evetos, ecesitamos, para cualquier itervalo de la recta real, que las preimágees de la fució e dicho itervalo sea evetos, es decir, perteezca a I. Por preimágees etedemos aquellos elemetos de S tales que la fució X les asocia ua image e ese itervalo de R. La defiició precisa del cojuto de itervalos que se toma e cueta hace uso de u cocepto uevo, el de la clase de Borel, que es u cojuto de subcojutos de R que cumple las codicioes de ser u σ álgebra de itervalos y que icluye los evetos que geeralmete será de iterés. Si embargo, o vamos a estudiar e detalle las clase de Borel y os vamos a limitar a establecer ua codició ecesaria para que la fució X represete adecuadamete evetos. Si las preimágees de todos los itervalos abiertos por la izquierda, del tipo (, x], so evetos, etoces las preimágees de todos los cojutos de la clase de Borel será evetos. Por lo tato se pide la siguiete codició adicioal para ua variable aleatoria: cosideremos u úmero real cualquiera x, y observemos el cojuto de resultados del experimeto (los que deotamos co la s miúscula) tales que los valores que la fució X asiga so meores o iguales que x. Lo escribimos como el cojuto A x : A x = {s S: X (s) x} La codició idica que el cojuto de los resultados s tal que X(s) x I, es decir, debe perteecer a la clase de evetos asociada al experimeto. Def. Dado u espacio de probabilidad (S, I, P), ua variable aleatoria es ua fució que asocia a cada elemeto del espacio de resultados S u úmero real, tal que para todo x R, A x = {s : X(s) x } I. Ua variable aleatoria, etoces, sólo tiee setido e relació a u determiado σ álgebra de evetos. Por ejemplo, cosideremos el experimeto de arrojar dos moedas cosecutivas, y defiamos la fució X = úmero de caras obteidas. Para determiar si uestra fució es ua variable aleatoria, euciamos uestro espacio muestral, que está dado por: S= {NN, NC, CN, CC}, e el cual X está defiida como: X (NN) = 0, X (CN) =, X (NC) = y X (CC) =. U posible σ álgebra asociado a este espacio muestral es: I ={ S,, {(CC)}, {(NN)}, {(CN), (NC)}, {(CN), (NC), (NN)}, {(CN), (NC), (CC)}, {(CC), (NN)}} costruido co los cojutos de resultados que da 0,, o caras, sus uioes y sus iterseccioes (verificar que es u σ álgebra). Para verificar que X es ua variable aleatoria,

cosideremos los cojutos de tipo X(s) x para distitos valores de x. Debemos recorrer toda la recta real, pero esta tarea se ve facilitada debido a que la fució X toma valores e u úmero reducido de putos. Así, costruimos la tabla de los posibles itervalos semiabiertos (, x] y de sus preimágees e S: (, x] tal que s: X(s) x x < 0 0 x < {(NN)} x < {(NN), (CN), (NC)} x S Como vemos que para cada uo de los itervalos posibles cosiderados, el cojuto de preimágees perteece a la clase de los evetos, podemos cocluir que X es ua variable aleatoria. La relació de la variable aleatoria co el espacio de probabilidad origial está dada porque podemos cosiderar si la variable aleatoria toma valores e u itervalo (, x] y calcular la probabilidad asociada de la siguiete maera: P(X(s) x) = P {s: X(s) x} Podemos hacerlo porque siempre el cojuto de los elemetos del espacio de resultados a los que la fució X asiga u valor meor o igual que x so evetos, para cualquier x real. E alguos de los ejemplos vistos e la discusió de probabilidad, los resultados de los experimetos aleatorios era de por sí uméricos, como e el caso del dado. E geeral e ecoomía será este el caso. Cosideremos por ejemplo el experimeto aleatorio cosistete e "tomar u año dado y observar a las empresas residetes e u territorio dado sumado el total del valor de la producció de biees y servicios del año a precios corrietes si icluir los isumos itermedios". El resultado de dicho experimeto podría ser cualquier úmero real, y para describirlo empleamos la variable aleatoria PBI t, dode el subídice t deota que está referida a u período de tiempo determiado. Obviamete, esto es así ates de que la producció ocurra y se efectúe la medició. Cuado ésto ya se ha realizado, y teemos por ejemplo el PBI de 995, éste ya o tiee ada de aleatorio. Además, o podemos - defiitivamete- volver a repetir el experimeto. E experimetos que arroje resultados de tipo cualitativo, éstos se puede expresar uméricamete, de la misma maera que etiquetábamos los resultados de arrojar ua moeda como "cara" = 0 y "úmero" =. Fucioes de cuatía, desidad y distribució Al defiir las variables aleatorias asociamos probabilidades a los itervalos abiertos de forma (, x]. El siguiete paso que daremos es describir dichas probabilidades mediate el uso de

ua fució defiida e los úmeros reales, la fució de distribució. Def. Sea X ua variable aleatoria defiida e el espacio de probabilidad (S, I, P ( )). La fució F: R [0, ] defiida por: F (x) = P(X(s) x) = P[{s: X(s) x}] se deomia fució de distribució de la variable aleatoria X. La fució de distribució de ua variable X cumple las siguietes propiedades: ) es o decreciete: para a < b siempre F(a) F(b) ) es cotiua por la derecha: 3) 4) lim F (x + h) = F (x) h 0 F ( ) = lim F (x) = 0 h F (+ ) = lim F (x) = h + Cosideremos ua vez más) el experimeto de lazar u par de moedas, co X defiida como el úmero de caras. Etoces la fució de distribució de X estaría dada por: 0 x < 0 /4 0 x < F(x) = 3/4 x < x Variables aleatorias discretas Cosideramos ahora variables aleatorias tales que el úmero de resultados del experimeto al que está asociadas o es ecesariamete fiito, pero es cotable, es decir, los resultados puede ser puestos e correspodecia co los úmeros aturales (eteros positivos). Para dichas variables podemos eumerar cada resultado del espacio muestral y la probabilidad a éste asociada. Def. La fució de cuatía P X (x) de ua variable aleatoria discreta se defie como

para cada x perteeciete al espacio muestral. Podemos otar que: P X (x) = P(X = x) ( x) Px = dode la suma se realiza sobre todos los valores posibles de X. x La represetació gráfica de ua fució de cuatía es u diagrama de barras exactamete igual que el que se presetó e estadística descriptiva. La fució de distribució F x (x) de ua variable aleatoria discreta se defie como: F x (x 0 ) = P ( x) x = P (x x 0 ) x x 0 Usaremos la letra mayúscula para deotar a las variables aleatorias y la miúscula para cualquiera de los valores que toma. Si graficamos la fució vemos que tiee forma escaloada. Fx(x) x x x3 x4 x Variables aleatorias cotiuas Imagiemos u experimeto aleatorio tal que su resultado puede ser razoablemete descrito por cualquier úmero real (como puede ser el caso de muchas variables ecoómicas). Auque

se puede argumetar que las variables siempre está medidas e uidades de aturaleza discreta (como pesos y cetavos), es u hecho que cuado el úmero de los posibles valores es muy alto, ua aproximació cotiua es mucho más coveiete. El espacio de posibles resultados es ahora ifiito e icotable, y esto cambia la forma e que se realiza la atribució de probabilidades a los evetos y a los valores reales que los describe. La atribució de probabilidades o se realiza a putos e particular como e el caso de las variables discretas y se realiza sobre itervalos de los reales, utilizado las fucioes de desidad y distribució. Ua variable aleatoria X se defie cotiua si existe ua fució f(x) tal que F (x) = x f ()dt t para cada úmero real x. La fució f(x) recibe el ombre de fució de desidad de la variable aleatoria X. La fució de desidad puede verse como ua fució que distribuye masa de probabilidad sobre los distitos itervalos de la recta real. La probabilidad de u puto e particular resulta ahora irrelevate (de hecho para ua variable aleatoria cotiua es igual a cero) e iteresa e cambio las probabilidades de itervalos. La fució de desidad os idica cómo está cambiado la probabilidad acumulada e cada puto, pero o es e sí misma ua probabilidad, y puede tomar valores mayores que. La fució de desidad cumple co dos propiedades: ) f(x ) 0 + ) f ( x)dx = Por su parte la fució de distribució F(x) es o egativa, o decreciete, y su valor cuado x tiede a + es. La fució de distribució e el caso de las variables aleatorias cotiuas tambié caracteriza la probabilidad de que la variable aleatoria tome valores meores o iguales que los de u valor dado de x, pero ahora, e lugar de costruirse como ua suma de las probabilidades de putos, se obtiee como la itegral para los valores meores o iguales a cada x de la fució de desidad. El gráfico siguiete muestra cómo la probabilidad acumulada crece hasta coverger al valor. Para cualquier x real, la altura e el gráfico mostrará la probabilidad acumulada P(X x).

F x (x) P(x 0 x x ) x 0 x La probabilidad de que X tome valores e el itervalo (x o, x ) está dada por la resta de los valores de la fució de distribució e los extremos del itervalo (que e el gráfico puede medirse como la distacia vertical etre las ordeadas e ambos putos): P (x o < X x ) = F(x ) F(x o ) Se cosidera a X mayor estricto que x 0 y meor o igual que x porque el cálculo implica la resta de las probabilidades de X meor o igual que x y que x 0 respectivamete, de modo que el puto específico x 0 o queda icluido. Si se toma e cueta que e el caso de las variables cotiuas la probabilidad P(X = x) = 0, ello o tiee cosecuecias para los cálculos. Aquí es dode se muestra la importacia de las relacioes etre desidad y fució de distribució. Partiedo de que se obtiee que P(X x 0 ) = F X (x 0 ) = x0 f ( x)dx P(X > x 0 ) = + x0 f ( x)dx = F X (x 0 ) Asimismo, la probabilidad de observar a la variable X e determiado itervalo (x 0, x ] puede ser vista como la itegral de la fució de desidad e el itervalo cosiderado:

x x 0 P(x 0 < X x ) = F X (x ) F X (x 0 ) = f ( x)dx f ( x)dx = x x0 f ( x)dx utilizado aditividad respecto del itervalo de itegració. La itegral equivale al área etre ambos putos bajo la fució de desidad, como se muestra e el siguiete gráfico: x0 x f(x) x Esta represetació gráfica de la probabilidad de u itervalo como u área recuerda los histogramas presetados e el cotexto de estadística descriptiva. Esto guarda relació e cierta medida co la motivació del desarrollo de los coceptos de la teoría probabilística, e que las probabilidades puede verse como surgiedo ua idealizació de la idea de frecuecias relativas de itervalos. Como coclusió, partiedo de uestro espacio de probabilidad origial, hemos sustituido a uestro espacio muestral origial S por la recta real, de maera que los evetos queda represetados por distitos valores que toma ua variable aleatoria. A su vez, la clase de los evetos I ha sido sustituida por la clase de Borel, a la cual os aproximamos mediate el cojuto de los itervalos semiabiertos (, x]. La fució P( ), que asiga probabilidades, está ahora defiida sobre itervalos de la recta real. Su domiio sigue siedo u cojuto. Si embargo, las fucioes de distribució, desidad y cuatía so fucioes cuyo domiio es el cojuto de los úmeros reales (y por lo tato permite u maejo mucho más accesible co los métodos del cálculo) para describir e térmios probabilísticos las variables aleatorias. Mometos Para el estudio matemático de la distribució de las variables aleatorias, so importates alguas características de las mismas que llamamos mometos. Para su aálisis hacemos uso de la oció de valor esperado. Es posible ver al valor esperado de ua variable aleatoria como ua forma idealizada de la media. Para ua variable aleatoria discreta el valor esperado se defie como:

µ = E(X) = xp ( x) es decir, ua suma poderada de los valores de la variable, e la que los poderadores so las probabilidades de cada uo de los valores. X puede tomar diferetes valores, pero E(X) es ua costate. Para ua variable aleatoria cotiua, el valor esperado se defie de la siguiete maera: µ = E(X) = x + xf x ( x)dx aquí el lugar de la sumatoria lo toma ua itegral, dode poderamos a todos los valores reales de x por la desidad. E muchos casos es de iterés averiguar la distribució de probabilidad de ua fució de ua variable aleatoria o de u vector aleatorio. A partir de ua variable aleatoria X, a través de ua fució g( ) obteemos Y = g(x). Nos iteresará saber e qué codicioes Y = g(x) será tambié ua variable aleatoria y si es posible derivar la fució de distribució o de desidad de Y a partir del coocimieto de g y de la distribució de X. No será posible dar ua respuesta detallada a ambas cuestioes e el marco de este curso, sio que os limitaremos a llamar la ateció sobre la existecia de este problema y a dar alguas idicacioes sobre resultados útiles que ivolucra distribucioes de fucioes de variables aleatorias y sus mometos. Nos basta co señalar que para que las fucioes de variable aleatoria sea a su vez variables aleatorias debe preservar la estructura de evetos e la clase I e la que está defiidas las probabilidades correspodietes a la variable o vector origial. No estudiaremos la técica para derivar la distribució de Y a partir de g( ) y de la distribució de la X. Sólo mecioaremos que detro de las fucioes, la clase de las fucioes moótoas (las que siempre decrece o siempre crece co x) permitirá u cálculo más secillo de las desidades de Y = g(x), ya que admite e geeral la fució iversa X = g - (Y) y ello os ayuda a rastrear las probabilidades de los itervalos correspodietes. Del mismo modo que calculamos E(X), podemos calcular E(Y) = E(g(X)). E lugar de hallar la desidad de Y y promediar co respecto a esta desidad, podemos promediar g(x) co respecto a la desidad de X. E forma geeral, el valor esperado de ua fució de ua variable aleatoria discreta X, digamos g(x), se defie como: El ombre puede o ser del todo claro, ya que el valor esperado o es ecesariamete uo de los valores posibles de la variable aleatoria. E el caso de la variable "úmero de la cara superior de u dado", por ejemplo, E(X) = 3.5, u valor que uca podemos "esperar" observar. Más cofuso aú es el térmio "esperaza" que a veces se aplica al traducir directamete del iglés expectatio, que se asocia a la idea de expectativa.