CUÁL SERIA LA PREDICCION OPTIMA DEL ESTADO DEL TIEMPO AL DIA SIGUIENTE?

Documentos relacionados
Distribuciones de probabilidad

3 PROBABILIDAD Y DISTRIBUCION NORMAL

Introducción al Diseño de Experimentos.

Técnicas Cuantitativas para el Management y los Negocios I

UNIDAD 4: DISTRIBUCIÓN DE PROBABILIDAD

Distribuciones de probabilidad II

1. La Distribución Normal

Modelos de distribuciones discretas y continuas

PROBABILIDAD E INFERENCIA ESTADÍSTICA TEMA 3: DISTRUBUCIONES DE PROBABILIDAD CONTINUA

Tema 5: Modelos probabilísticos

Distribución de probabilidad

1. Experimentos aleatorios

5. DISTRIBUCIOES COTIUAS DE PROBABILIDAD

PROBABILIDAD Y ESTADÍSTICA. Sesión 6 (A partir de tema 5.9)

ESTADÍSTICA INFERENCIAL

Objetivo: Comprender la diferencia entre valor esperado, varianza y desviación estándar. Poner en práctica el teorema de Chebyshev

Discretas. Continuas

ESTADÍSTICA INFERENCIAL. Sesión 6: Distribuciones de probabilidad para variables aleatorias continuas

Tema 6. Variables aleatorias continuas

Tema 4: Modelos probabilísticos

Definición de probabilidad

Fundamentos de Estadística y Simulación Básica

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

UNIDAD 4: PROBABILIDAD

MATEMÁTICAS APLICADAS A LAS CC. SS. I

Prof. Eliana Guzmán U. Semestre A-2015

Capítulo 5: Probabilidad e inferencia

CAPÍTULO 5 DISTRIBUCIONES TEÓRICAS

Estadística aplicada al Periodismo

1º BACHILLERATO MATEMÁTICAS CIENCIAS SOCIALES

Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema:

DISTRIBUCIÓN NORMAL. Modelo matemático: f ( x ) = σ 2 π

TEMA 3: Probabilidad. Modelos. Probabilidad

Tema 6: Modelos probabilísticos

Probabilidad Condicional

Tema 5 Modelos de distribuciones de Probabilidad

Tema 4: Variables aleatorias. Tema 4: Variables Aleatorias. Tema 4: Variables aleatorias. Objetivos del tema:

Capítulo 1. Teoría de la probabilidad Teoría de conjuntos

Curso de nivelación Estadística y Matemática

Estadística Clase 2. Maestría en Finanzas Universidad del CEMA. Profesor: Alberto Landro Asistente: Julián R. Siri

Estadística Clase 2. Maestría en Finanzas Universidad del CEMA. Profesor: Alberto Landro Asistente: Julián R. Siri

Variables Aleatorias y Principios de Simulación.

Técnicas Cuantitativas para el Management y los Negocios I

Tema 12: Distribuciones de probabilidad

ESTADÍSTICA INFERENCIAL

APUNTES SOBRE INTRODUCCIÓN A LA TEORÍA DE LAS PROBABILIDADES

La Distribución Normal. La Distribución Normal. Características de la distribución de probabilidad normal

Tema 6 Algunas distribuciones importantes Hugo S. Salinas

ANEXO.- DISTRIBUCIÓN BINOMIAL. DISTRIBUCIÓN NORMAL

Especialización en Métodos Estadísticos (EME) CURSO PROPEDÉUTICO ESTADÍSTICA BÁSICA

Probabilidad condicional

VARIABLES ALEATORIAS CONTINUAS

Carrera: Ingeniería Zootecnista E S T A D I S T I C A

T. 2 Modelos teóricos de distribución de probabilidad

Tema 7. Variables Aleatorias Continuas

Distribuciones Continuas

Tema 5 Algunas distribuciones importantes

Definición Se dice que una variable aleatoria X es continua si su conjunto de posibles valores es todo un intervalo (finito o infinito) de números

2. Conceptos Básicos de Probabilidad. ESTADÍSTICA Esp. Paola G. Herrera S.

Folleto de Estadísticas. Teoría del 1er Parcial

Probabilidad Condicional. Teorema de Bayes para probabilidades condicionales:

Distribuciones Fundamentales de Muestreo. UCR ECCI CI-0115 Probabilidad y Estadística Prof. Kryscia Daviana Ramírez Benavides

Fundamentos de Estadística y Simulación Básica

Capítulo. Distribución de probabilidad normal. Pearson Prentice Hall. All rights reserved

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

Distribuciones discretas. Distribución binomial

NIVELACIÓN DE ESTADISTICA. Carlos Darío Restrepo

Curso de nivelación Estadística y Matemática

Cap. Distribuciones de. probabilidad. discreta. Distribuciones de probabilidad. discreta Pearson Prentice Hall. All rights reserved

Probabilidad es una manera de indicar la posibilidad de ocurrencia de un evento futuro

DISTRIBUCIONES DE PROBABILIDAD

LECTURA 03: DISTRIBUCIÓN T STUDENT Y DISTRIBUCIÓN CHICUADRADO TEMA 6: DISTRIBUCION T STUDENT. MANEJO DE TABLAS ESTADISTICAS.

Tema 4: Probabilidad y Teoría de Muestras

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Fundamentos de la investigación en psicología

Distribución de Probabilidad

MODELOS DISCRETOS DE PROBABILIDAD

Distribuciones de probabilidad

Variables aleatorias: El caso continuo. Random variables: The continuous case. Rincón de la Bioestadística

Probabilidad, Variable Aleatoria Pag 1 de 26 PROBABILIDAD

Variables aleatorias

SESION 12 LA DISTRIBUCIÓN BINOMIAL

Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana.

Universidad Autónoma de Baja California

Probabilidad Condicional

Análisis Estadístico de Datos Climáticos. Distribuciones paramétricas de probabilidad (Wilks, cap. 4)

Estadística LTA - Principios de estadística 2017

RESUMEN CONTENIDOS TERCERA EVALUACIÓN PROBABILIDAD DISTRIBUCIÓN BINOMIAL DISTRIBUCIÓN NORMAL

Tema 13: Distribuciones de probabilidad. Estadística

MATEMÁTICAS II PROBABILIDAD DISTRIBUCIÓN BINOMIAL DISTRIBUCIÓN NORMAL

Puntuaciones Estándarizadas, Distribución Normal y Aplicaciones. Dra. Noemí L. Ruiz Limardo 2008 Derechos de Autor Reservados, Revisado 2010

Unidad Temática 3: Probabilidad y Variables Aleatorias

Teorema Central del Límite. Cálculo Numérico y Estadística. Grado en Química. U. de Alcalá. Curso F. San Segundo.

Transcripción:

TEOREMA DE BAYES Explica como considerar matemáticamente la nueva información en la toma de decisiones. P( AΙB) = P( A B) P( B) = P( A) P( BΙA) P( B) PROBLEMA: En cierto lugar llueve el 40% de los días y hay cielo despejado el 60%. Un fabricante de barómetros detecto una falla en su instrumento porque en días lluviosos erróneamente pronosticaba claro el 10% de las veces, mientras que en días despejados erróneamente pronosticaba lluvia el 20% de las veces. CUÁL SERIA LA PREDICCION OPTIMA DEL ESTADO DEL TIEMPO AL DIA SIGUIENTE?

Sin consultar el barómetro se cuenta con las probabilidades a priori (tabla 1). Estado del tiempo (A) Lluvia (A1) Claro (A2) Probabilidad a priori P (A) 0.40 0.60 Al consultar el barómetro se obtiene una probabilidad a posteriori, pero primero se debe establecer formalmente la confiabilidad del barómetro (tabla 2). Estado A Predicción B Lluvia B1 Claro B2 Lluvia A1 0.90 0.10 Claro A2 0.20 0.80 Probabilidades condicionales P (A B)

Al combinar las probabilidades a priori con la información del barómetro se obtiene la tabla 3. Estado del tiempo A Lluvia Lluvia (0.40) Claro (0.60) P r e d i c c i o n (0.4)(0.9)= 0.36 (0.6)(0.2)=0.12 (0.6)(0.8)= 0.48 Claro (0.4)(0.1)=0.04 Una vez hecha una predicción (lluvia o despejado), el espacio muestral se reduce, supongamos que la predicción es lluvia: P (Predicción lluvia) = P (B 1 ) = 0.36+0.12=0.48

Aplicando el teorema de Bayes se obtiene la probabilidad a posteriori que se muestra en a tabla 4 Estado A Lluvia A1 Claro A2 Probabilidad a posteriori P (A B1) 0.75 0. 25 Pr( A1 B1 ) 0.36 P( A1 ΙB1 ) = = = Pr( B ) 0.48 Pr( A2 B1 ) 0.12 P( A2 ΙB1 ) = = = Pr( B ) 0.48 1 1 0.75 0.25

DISTRIBUCIONES DE PROBABILIDAD Una vez que se conocen los conceptos básicos de probabilidad y los métodos para calcular la probabilidad de un evento es posible explorar métodos para calcular la probabilidad de un evento bajo circunstancias más complicadas. Se estudiaran las relaciones entre los valores que puede adquirir una variable y sus probabilidades de ocurrencia que se resumen mediante un mecanismo llamado distribución de probabilidad. La distribución de probabilidad se puede expresar en forma de tabla, grafica o formula. Conocer la distribución de probabilidad para una variable aleatoria proporciona una herramienta poderosa para simplificar y describir un conjunto de datos, y para llegar a conclusiones acerca de la población de datos sobre la base de una muestra de datos extraídos de la población. DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS. Primero se considerará la distribución de probabilidad de una variable discreta, que se define como sigue: La distribución de probabilidad de una variable aleatoria discreta es una tabla, una gráfica, una formula u otro sistema utilizado para especificar todos los valores posibles de una variable aleatoria discreta y sus probabilidades de ocurrencia Una de las distribuciones discretas que se estudiaran es la distribución binomial.

DISTRIBUCIÓN BINOMIAL Una de las distribuciones más ampliamente utilizada en estadística aplicada. Se deriva del procedimiento conocido como ensayo de Bernoulli, en honor al matemático suizo James Bernoulli quien realizó contribuciones importantes en el campo de la probabilidad, en especial la distribución binomial. Cuando en algún ensayo de algún proceso o experimento puede ocurrir sólo uno de dos resultados mutuamente excluyentes, como vida o muerte, alivio o enfermedad, macho o hembra, éxito o fracaso, el ensayo se llama ENSAYO DE BERNOULLI. Una secuencia de ensayos de Bernoulli constituye un PROCESO DE BERNOULLI si se cumplen las siguientes condiciones. 1. En cada ensayo ocurre uno de dos posibles resultados mutuamente excluyentes uno de los cuales se denota (arbitrariamente) como éxito y el otro como fracaso. 2. La probabilidad de un éxito denotada por p, permanece constante de un ensayo a otro y la probabilidad de fracaso 1- p se denota por q. 3. Los ensayos son independientes, es decir, el resultado de algún ensayo en particular no es afectado por el resultado de cualquier otro ensayo.

Ejemplo: Se desea conocer la probabilidad de x éxitos en n ensayos de Bernoulli. Suponga que en cierta población el 52 por ciento de todos los nacimientos que se registraron son varones. Esto significa que la probabilidad del nacimiento de un varón registrado es de 0.52. Si aleatoriamente se escogen 5 registros de nacimientos dentro de esa población, Cuál es la probabilidad de que exactamente tres de ellos pertenezcan a varones?. Solución: Designe la ocurrencia de un registro para el nacimiento de un varón como éxito, esta es una designación arbitraria con fines de claridad y conveniencia y no refleja de ninguna manera la preferencia relativa del nacimiento de varones frente a mujeres. La ocurrencia del registro de nacimiento de un varón se designa como éxito, puesto que lo que se busca son registros de nacimientos de varón. También es conveniente designar el número 1 a un éxito (registro del nacimiento de un varón) y un 0 para el registro de nacimiento de una mujer. El proceso que finalmente resulta en un registro de nacimiento se considera como un proceso de Bernoulli. Suponga que, de los 5 registros de nacimientos seleccionados, resulta esta secuencia de sexos: VMVVM En forma codificada se escribe de la siguiente manera: 10110 Puesto que la probabilidad de un éxito se denota con p y la probabilidad de un fracaso con q, la probabilidad de la secuencia de los resultados anteriores se calcula por medio de la regla de la multiplicación: P(1.0.1.1.0) = pqppq =

La probabilidad resultante es la de obtener la secuencia especifica en el orden en que se muestra. Sin embargo, el interés no está en el orden de ocurrencia de los registros de nacimientos de varones y mujeres, sino, como se ha manifestado previamente, en la probabilidad de ocurrencia exacta de tres registros de nacimiento de varones de entre cinco registros seleccionados aleatoriamente. En lugar de ocurrir en la secuencia mostrada con anterioridad (secuencia número 1), los tres éxitos y dos fracasos pueden ocurrir también en alguna de las secuencias adicionales dadas en la siguiente tabla. Número Secuencia 2 11100 3 10011 4 11010 5 11001 6 10101 7 01110 8 00111 9 01011 10 01101 Cada una de estas secuencias tiene la misma probabilidad de ocurrencia y es q 2 p 3, que es la probabilidad calculada para la primera secuencia. Cuando se extrae una sola muestra de cinco elementos a partir de una población especifica, sólo se obtiene una secuencia de éxitos o fracasos. La pregunta, ahora, es: cuál es la probabilidad de obtener la secuencia número 1, la secuencia numero 2... o la secuencia número 10? Con la regla de... se sabe que esta probabilidad es igual a... Que es equivalente a... Ahora se puede responder la pregunta original cuál es la probabilidad de observar tres registros de nacimiento de varón y dos de mujer? En una muestra aleatoria de 5 elementos extraída de la población especificada?

Dado que en la población p=0.52. entonces q =... Y se resuelve con... Conforme crece el tamaño de la muestra se hace mas tedioso hacer una lista para contar el número de secuencias, por lo que es necesario un método sencillo para contarlas. Para esto podemos utilizar la formula de conteo que nos permite saber cuantos subconjuntos de objetos pueden formarse cuando en diferentes subconjuntos se utilizan números de objetos que componen el conjunto del cual se extraen. Cuando el orden de los objetos dentro del de un subconjunto no importa, el subconjunto se llama combinación de objetos. Si un conjunto cuenta de n objetos y y se pretende formar un subconjunto de x objetos, sin importar el orden de los objetos dentro del subconjunto el resultado se llama combinación Cuando la combinación se forma tomando x objetos de un conjunto de n objetos: La combinación de n objetos tomados x a la vez se obtiene: C x n = n! x!( n x)! donde x! Que se lee x factorial, el es producto de todos los números enteros de x hasta 1. En el ejemplo se tiene una muestra de n=5 nacimientos y se tiene interés en encontrar la probabilidad de que tres de ellos sean nacimientos de varones.

El número de secuencias para el ejemplo es: 5C 3 = 5 4 3 2 1 3 2 1 2 1 = 120 12 = La probabilidad de obtener x éxitos en n ensayos se escribe: f(x)= n C x q n-x p x = n C x p x q n-x A esta expresión se le llama distribución binomial. Esta distribución se puede presentar en una tabla como sigue: Número de éxitos, x Probabilidad f(x) 0 nc 0 q n-0 p 0 1 nc 1 q n-1 p 1 2 nc 2 q n-2 p 2 x nc x q n-x p x O en una grafica: N nc N q n-n p N Total 1 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,29 0,18 0,14 0,04 0,03 0,00 0 1 2 3 4 5 V ariable x 0,32

Ejemplo 2. Suponga que se sabe que 30 % de cierta población es inmune a alguna enfermedad. Si se escoge una muestra aleatoria de 10 elementos de entre esta población. cuál es la probabilidad de que dicha muestra contenga exactamente 4 personas inmunes? Solución: La probabilidad de elegir una persona inmune es de 0.3. Al utilizar la ecuación de la distribución binomial podemos obtener: f (4) = El uso de la ecuación binomial puede resultar tedioso, sobre todo si el tamaño de la muestra es grande y si nos interesa calcular probabilidades acumuladas. Afortunadamente las probabilidades para diferentes valores de n p y x se encuentran tabulados por lo que solo tenemos que consultar la tabla para obtener las probabilidades deseadas. La tabla de la distribución binomial presenta las probabilidades acumuladas de que x sea menor o igual a un valor determinado. Es decir, la tabla presenta las probabilidades acumuladas desde x=0 hasta un numero positivo especifico de éxitos. Uso de la tabla con el ejemplo 2. Ejemplo 3. Suponga que se sabe que en cierta población el 10% es daltónica. Si se extrae una muestra aleatoria de 25 personas de esa población, con la tabla de la distribución binomial encuentre la probabilidad de que: a) Existan 5 o menos daltónicos b) Existan 6 o mas daltónicos c) Existan entre 6 y 9 daltónicos d) Existan 2, 3 o 4 daltónicos.

Tarea Distribución Binomial. Ejercicio 4. Suponiendo que el 26 % de las personas adultas tienen sobrepeso. 1. Al extraer una muestra aleatoria simple de 20 adultos, encontrar (usando la tabla de distribución binomial) la probabilidad de que el número de personas con sobrepeso, dentro de la muestra, sean: a) Exactamente tres personas b) Tres o mas personas c) Menos de tres personas d) Entre tres y siete personas 2. Cuantos adultos con sobrepeso se espera encontrar en la muestra de 20? 3. Suponga que de la misma población se extrae una muestra aleatoria de 5 adultos. Usando la ecuación binomial encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea. a) Cero b) Entre uno y tres c) Cinco d) Más de una e) Dos o menos 4.- Plantee y resuelva un problema en el que se use la distribución binomial. Puede usar datos reales (pagina del INEGI) o realísticos (inventados pero que tengan sentido). Plantear al menos dos preguntas.

DISTRIBUCIONES DE PROBABILIDAD CONTINUAS Una variable aleatoria continua es aquella que puede asumir cualquier valor en un intervalo especifico. Consecuentemente, entre dos valores asumidos por la variable continua existe un número infinito de valores. Considerando los datos de la edad de 169 individuos que participaron en un estudio (es una variable continua). Intervalo de Clase Frecuencia 9.5-19.5 4 19.5-29.5 66 29.5-39.5 47 39.5-49.5 36 49.5-59.5 12 59.5-69.5 4 Total 169 Frecuencia 70 60 50 40 30 20 10 0 14.5 24.5 34.5 44.5 54.5 64.5 Edad

Si el número de valores de la variable es muy grande, y la amplitud del intervalo muy pequeña...

Entre mas observaciones tengamos (n se aproxima a infinito) y la amplitud del intervalo se aproxima a cero, el poligono se aproxima a una curva. Representación grafica de una distribución continua

Características de la distribución de probabilidad continua: El área total bajo la curva es igual a uno La frecuencia relativa de ocurrencia de los valores entre dos puntos cualesquiera, sobre el eje de las x, es igual al área total delimitada por la curva, el eje de las x y las rectas perpendiculares levantadas sobre ambos puntos del eje de las x, como se muestra en la figura. La probabilidad de cualquier valor especifico de la variable aleatoria es cero. Esto es lógico dado que un valor especifico se representa como un ponto sobre el eje de las x.

DISTRIBUCION NORMAL Se considera la distribución más importante en toda la estadística. La formula para esta distribución fue publicada por Abraham De Moivre en 1733. Otros matemáticos hicieron contribuciones importantes en el estudio de esta distribución incluyento a Carl Friedrich Gauss. A esta distribución tambien se le llama distribución de Gauss como reconocimiento a las contribuciones de este matemático. La densidad normal esta dada por: f ( x) = 1 2πσ e 2 2 ( x µ ) / σ 2, x La gráfica de la distribución normal produce la conocida curva en forma de campana.

Características de la distribución normal 1. Es simétrica respecto a su media µ. Tal como se muestra en la figura, la curva hacia cualquiera de los lados de µ es una imagen de espejo de la del otro lado. 2. La media la mediana y la moda son todas iguales 3. El área total bajo la curva sobre el eje de las x es una unidad de área. Esta característica se deduce del hecho de que la distribución normal es una distribución de probabilidad. Debido a la simetria mencionada anteriormente, 50% del area esta a la derecha de la perpendicular levantada sobre la media y el otro 50% a la izquierda. 4. Si se levantan perpendiculares a una distancia de una desviación estándar desde la media hacia ambos lados, el área delimitada por esas perpendiculares, el eje de las x y la curva será de 68 % del área total, aproximadamente, si los limites laterales se extienden a dos desviaciones estándar en ambos lados de la media estará incluido aproximadamente el 95 % del área y extendiendolos a tres desviaciones estandar aproximadamente el 99.7 %. 5. Los parámetros µ y σ determinan completamente la distribución normal. En otras palabras, por cada valor diferente de µ y σ se especifica una distribución normal distinta.los valores diferntes de µ desplazan la gráfica de la distribución a lo largo del eje de las x. Los valores de σ determinan el grado de aplanamiento o levantamiento de la gráfica.

Suponga que usted esta a cargo de la agencia nacional de alquiler de un modelo específico de automóvil. Su agente de servicio en una determinada ciudad no ha sido totalmente digno de confianza porque en el pasado suspendio el servicio 1 de 10 veces. El efecto de dicha suspension es el incremento de la probabilidad de que un cliente cancele el trato de 0.2 a 0.5. Si un individuo cancelo su pedido cuál es la probabilidad de que alguna vez haya sido afectado por la suspension del servicio?

Probabilidad a priori (tabla 1). Servicio (A) Abierto(A1) Cerrado(A2) Probabilidad a priori P (A) Al saber que el agente no es confiable, obtenemos una nueva probabilidad a posteriori, pero primero se debe establecer formalmente la confiabilidad del agente (tabla 2). Servicio A Trato B Hecho B1 Cancelado B2 Abierto A1 Cerrado A2 Probabilidades condicionales P (A B)

Al combinar las probabilidades a priori con la información del barómetro se obtiene la tabla 3. Estado del tiempo A Hecho Abierto(0.90) Cerrado (0.10) T r a t o Cancelado P (Cancelar trato) = P (B2) =

Aplicando el teorema de Bayes se obtiene la probabilidad a posteriori que se muestra en a tabla 4 Estado A Abierto A1 Cerrado A2 Probabilidad a posteriori P (A B2) P( A 2 ΙB 2 ) = Pr( A2 B Pr( B ) 2 2 ) =

Considerando que el 30% de la población fuma. Al extraer una muestra aleatoria simple de 15 adultos. Encuentre la probabilidad de que el número de fumadores en la muestra sean: a) Tres P(x=3)= p(x<=3) p(x<=2)0.2969-0.1268 P(x<=3)= 0.2969 b) Menos de cinco P(x<5)= p(x<=4)= 0.5155 c) Entre cinco y nueve inclusive d) Más de cinco pero menos de 10 e) Seis o más.