R PRÁCTICA II. Probabilidad-Variables Aleatorias. Probabilidad



Documentos relacionados
Manipulación de vectores en R

Tema 3: Variables aleatorias y vectores aleatorios bidimensionales

Capítulo 7: Distribuciones muestrales

2) Un establecimiento comercial dispone a la venta dos artículos en una de sus secciones, de precios p

Tema 1: Test de Distribuciones de Probabilidad

PROBABILIDADES Y ESTADÍSTICA (C) Práctica 2

Tema 2: Estimación puntual

todas especialidades Soluciones de las hojas de problemas

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

Soluciones de los ejercicios de Selectividad sobre Probabilidad de Matemáticas Aplicadas a las Ciencias Sociales II

Algunas Distribuciones de Probabilidad

Muestreo estadístico. Relación 2 Curso

Unidad Temática 1: Unidad 3 Probabilidad Temas 6 y 7

PROBABILIDADES Y ESTADÍSTICA (C) Práctica 2

Problemas de Probabilidad Soluciones

ESTIMACIÓN. puntual y por intervalo

APROXIMACIÓN DE LA DISTRIBUCIÓN BINOMIAL A LA NORMAL, LA CALCULADORA Y

Una breve introducción a Excel c

Estadística aplicada y modelización. 10 de septiembre de 2005

Teoría de Probabilidad

Medidas de tendencia central o de posición: situación de los valores alrededor

5. DISTRIBUCIONES DE PROBABILIDADES

TEMA 7: Análisis de la Capacidad del Proceso

Estimación. Intervalos de Confianza para la Media y para las Proporciones

Tratamiento y Transmisión de Señales Ingenieros Electrónicos SEGUNDA PRÁCTICA

Instructivo Applet en Geogebra grafica frecuencia relativa Lanzamiento de dos dados n veces

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 5: PROBABILIDAD

MATEMÁTICAS CCSS II Sobrantes 2010 (Modelo 1) SELECTIVIDAD ANDALUCÍA

12 Las distribuciones binomial y normal

Sistemas Aleatorios: Probabilidad Condicional

Matemáticas 2º BTO Aplicadas a las Ciencias Sociales

RELACIÓN DE EJERCICIOS DE ESTADÍSTICA. PROBLEMAS DE ESTADÍSTICA: PROBABILIDAD

Covarianza y coeficiente de correlación

x y 8000 x + y a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas.

IES Real Instituto de Jovellanos de Gijón Serie 8. Distribuciones de Probabilidad MATEMÁTICAS 1º B.I. N.M. - Serie 8: Distribuciones de Probabilidad

Tema 3: Variable aleatoria 9. Tema 3: Variable aleatoria

ANÁLISIS DESCRIPTIVO CON SPSS

TEMA 6: VARIABLES ALEATORIAS. DISTRIBUCIONES DE PROBABILIDAD 1. VARIABLES ALEATORIAS

Clase 5: Variables Aleatorias y Distribuciones de Probabilidad

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

Tema 7: Estadística y probabilidad

1.1. Introducción y conceptos básicos

Tema 5. Variables aleatorias discretas

Elementos de Probabilidad y Estadística Segundo de Economía Examen del 26 de junio de 2006 DURACIÓN: 2 horas

UNIVERSIDADES DE ANDALUCÍA PRUEBA DE ACCESO A LA UNIVERSIDAD OPCIÓN A

Ejercicios Resueltos de Teorema Central de Límite (TCL) Ejercicios 1 y 2: Resolución de Ejercicios propuestos del Tema 5.

ANÁLISIS DE DATOS NO NUMERICOS

Tema 12: Contrastes Paramétricos

TEMA 4: Introducción al Control Estadístico de Procesos

Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL

Probabilidad Hoja de trabajo #1. Actividad: Buscando todos los resultados de un experimento

PEOBLEMAS RESUELTO DE CADENAS DE MARKOV

T.1 CONVERGENCIA Y TEOREMAS LÍMITE

Probabilidad. Relación de problemas 5

Asignatura: Econometría. Conceptos MUY Básicos de Estadística

SIMULACION. Formulación de modelos: solución obtenida de manera analítica

Statgraphics Centurión

Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos

1 Ejemplo de análisis descriptivo de un conjunto de datos

I.E.S.MEDITERRÁNEO CURSO DPTO DE MATEMÁTICAS PROGRAMA DE RECUPERACIÓN DE LOS APRENDIZAJES NO ADQUIRIDOS EN MATEMÁTICAS DE 3º DE E.S.O.

Ejercicio de estadística para 3º de la ESO

Otras medidas descriptivas usuales

Curso: Métodos de Monte Carlo. Unidad 1, Sesión 2: Conceptos básicos

Modelos de distribuciones discretas

4. Se considera la función f(x) =. Se pide:

IES Fco Ayala de Granada Septiembre de 2011 (Modelo 5) Soluciones Germán-Jesús Rubio Luna

Definición Se llama suceso aleatorio a cualquier subconjunto del espacio muestral.

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

Problemas de Probabilidad resueltos.

Tema 2 - Introducción

AZAR, PROBABILIDAD Y ESTADÍSTICA EXPERIENCIAS DE AZAR

Tema 1 con soluciones de los ejercicios. María Araceli Garín

Análisis y cuantificación del Riesgo

CONTENIDOS MÍNIMOS BLOQUE III: ÁLGEBRA

SEMINARIOS. (Problemas de exámenes de años anteriores) Estadística. 1º Grado en Informática

Unidad 14 Probabilidad

CUESTIONES DE AUTOEVALUACIÓN (TEMA 1)

Explicación de la tarea 3 Felipe Guerra

MATEMÁTICAS aplicadas a las Ciencias Sociales II

Problemas Resueltos del Tema 1

Propuesta didáctica: Juego de azar

EJ:LANZAMIENTO DE UNA MONEDA AL AIRE : S { } { } ESPACIO MUESTRAL:CONJUNTO DE TODOS LOS SUCESOS ELEMENTALES DE UN EXPERIMENTO ALEATORIO.

UNIVERSIDAD DE ATACAMA

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

Síntesis Numérica de una Variable

14Soluciones a los ejercicios y problemas

Distribuciones discretas. Distribución Binomial

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2012 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 5: PROBABILIDAD

Introducción a la Teoría de Probabilidad

Ejercicios distribuciones discretas probabilidad

Diagramas de frecuencias relativas

REPRESENTACIÓN DE UNA DISTRIBUCIÓN DE PROBABILIDAD DISCRETA

INFORMÁTICA. Práctica 5. Programación en C. Grado en Ingeniería en Electrónica y Automática Industrial. Curso v1.0 (05.03.

Las bebidas Alcohólicas

1. a) Definimos X =número de personas con síntomas si examino sólo una persona, la cual sigue una distribución B(1, p), donde

Medidas de la tendencia central y las gráficas de caja

Tema 2. Análisis gráfico Ejercicios resueltos 1

Departamento de Matemática Aplicada a la I.T. de Telecomunicación

Tema 3. Medidas de tendencia central Introducción. Contenido

OBJETIVOS CONTENIDOS PROCEDIMIENTOS

Transcripción:

R PRÁCTICA II Probabilidad-Variables Aleatorias Sección II.1 Probabilidad 15. En el fichero sintomas.dat se encuentran 9 columnas con los resultados de una estadística médica. Cada columna corresponde a las siguientes variables: V1. Fumador V2.Ha viajado a Asia V3. Cancer de pulmón V4. Bronquitis % V5. Tuberculosis V6.Auscultación torácica normal V7. Doloren el pecho % V8. Rayos X normales V9. Edad Todos los campos, excepto el último, están codificados mediante un 1 si la respuesta es NO y 2 si la respuesta es SI. Importar dicho fichero de los ficheros de datos y responder a: a) Crear un gráfico de barras con la probabilidad de padecer cáncer de pulmón por franjas de edad de 10 años. b) Calcular la probabilidad de padecer cáncer de pulmón si tomamos un individuo de la franja de edad de 40 a 70 años. c) Calcular, para esa misma franja de edad: 1) la probabilidad de padecer cáncer de pulmón teniendo en cuenta que el paciente es fumador. 2) la probabilidad de padecer cáncer de pulmón dado que es fumador y siente dolor en el pecho. 3) la probabilidad de padecer cáncer de pulmón dado que NO es fumador y NO siente dolor en el pecho. 8

II.2. VARIABILIDAD A CORTO PLAZO. REGULARIDAD A LA LARGA 4) la probabilidad de padecer cáncer de pulmón dado que el paciente ha visitado Asia. d) Son los siguientes sucesos dependientes o independientes? 1) Haber visitado Asia y padecer tuberculosis. 2) Fumar y haber visitado Asia. 3) Fumar y padecer cáncer de pulmón. Sección II.2 Variabilidad a corto plazo. Regularidad a la larga 16. Variabilidad a corto plazo. Crear un data.frame nuevo de nombre dado.12. a) Simular 12 lanzamientos de un dado regular (no trucado), almacenando los resultados de los lanzamientos en la columna 1 ( dado_1 ). dado.1<-sample(c(1:6),12,replace=true) b) Repetir el apartado anterior almacenando los resultados en la columna 2 ( dado_2 ) y ( dado_3 ). c) Dibujar diagramas de barras de los datos de las tres columnas. barplot(table(dado.1)) d) Calcular las frecuencias relativas de los 6 sucesos posibles. Son estas frecuencias relativas iguales a 1 6? 17. Variabilidad a largo plazo. Crear un data.frame nuevo de nombre dado.1200. a) Simular 1200 lanzamientos de un dado regular (no trucado), almacenando los resultados de los lanzamientos en la columna ( dado_4 ). b) Repetir el apartado anterior almacenando los resultados en las columnas ( dado_5 ) y ( dado_6 ). c) Dibujar diagramas de barras de los datos de las dos columnas. d) Calcular las frecuencias relativas de los 6 sucesos posibles. Son estas frecuencias relativas iguales a 1 6? 18. Es siempre admisible el concepto clásico de probabilidad? a) Simular 120 lanzamientos de un dado en cuyo interior se han introducido asimétricamente bolas de acero, de forma que P(1) = 0.5; P(2) = 0.25; P(3) = 0.15; P(4) = 0.04 y P(5) = P(6) = 0.03. Almacenar los resultados de los lanzamientos en la variable ( dado.trucado.120 ). b) Dibujar diagramas de barras para la variable anterior. c) Son aproximadamente iguales las frecuencias relativas de los 6 sucesos posibles? A qué concepto de la probabilidad conduce este experimento aleatorio? Universidad de Cantabria. Alberto Luceño y Fco. Javier Glez Ortiz 9

CAPÍTULO II. PROBABILIDAD-VARIABLES ALEATORIAS Sección II.3 Concepto frecuentista de la probabilidad 19. La concepción frecuentista interpreta que la probabilidad de un suceso es el límite de la frecuencia relativa de dicho suceso cuando el número de veces que se repite el experimento asociado tiende a infinito. Por ejemplo, que la probabilidad de sacar cruz al tirar una moneda es 0.5 significa que, en una sucesión de tiradas, la frecuencia relativa de las cruces obtenidas se irá aproximando paulatinamente a 0.5 según avanza la sucesión. a) Generamos un vector que represente la sucesión de tiradas; suponiendo n = 500 tiradas. b) Generamos otro vector F A con las frecuencias absolutas del número de cruces acumuladas hasta cada tirada. c) Calculamos las frecuencias relativas de las cruces en cada tirada. d) Representamos la secuencia de frecuencias relativas acumuladas. e) Podemos añadir la asíntota, a la altura del valor teórico de la probabilidad p = 0.5 Sección II.4 Simulación de experimentos aleatorios 20. Simular el problema del aniversario: a) Simular el nacimiento de 40 personas. muestra.nac.40 b) Analizar los datos repetidos de muestra.nac.40 y comprobar si hay dos personas con el mismo día de nacimiento. c) Simular el nacimiento de 23 personas, muestra.nac.23 y efectuar la misma comprobación que antes. d) Simular el experimento anterior 2000 veces y estimar la probabilidad de que al menos dos personas de un grupo de 23 elegidos al azar cumplan años el mismo día. num.veces<-2000 num.personas<-23 coinciden<-replicate(num.veces,is.element(0, diff(sort(sample(c(1:365),num.personas,replace=true))))) frec<-sum(coinciden)/num.veces frec Universidad de Cantabria. Alberto Luceño y Fco. Javier Glez Ortiz 10

II.4. SIMULACIÓN DE EXPERIMENTOS ALEATORIOS e) Compara los resultados obtenidos con la solución exacta. p = 1 365 364 363 (365 n + 1) 365 n 21. Simular el problema de los dados de Galileo 1 : a) Abrir un nuevo conjunto de datos o data.frame de nombre Galileo. Simular el lanzamiento de un dado 1000 veces.(c1=dado.1) b) Realizar lo mismo para las columnas (C2=dado.2) y (C3=dado.3) c) Establecer en la columna (C4=Suma) la suma de las tres dados. d) Estimar la probabilidad de que la suma de los dados sea 10. e) Estimar la probabilidad de que la suma de los dados sea 9. f ) Realizar, con otra simulación los pasos anteriores y comparar los resultados Suma =10 Suma =9 g) Comparar con los resultados exactos P(sumen 9) = 25 27 = 0.116 P(sumen 10) = 63 6 3 = 0.125 1 galileo<-data.frame(dado.1=sample(1:6,1000,rep=true)) Universidad de Cantabria. Alberto Luceño y Fco. Javier Glez Ortiz 11

CAPÍTULO II. PROBABILIDAD-VARIABLES ALEATORIAS Sección II.5 Distribuciones discretas y continuas más comunes 22. Una v.a. X binomial B(200; 0.4). Se pide: a) P(X < 71) P(X 90) F X (100) b) P(X x) = 0.4 P(X x) = 0.8 F X (75) 23. La centralita telefónica de un hotel recibe un número de llamadas por minuto que sigue una ley de Poisson con parámetro λ = 0.5. Determinar la probabilidad de que en un minuto al azar: a) Se reciba una única llamada. b) Se reciban un máximo de dos llamadas. c) La centralita quede bloqueada, sabiendo que no puede realizar más de 3 conexiones por minuto. 24. Sea X una variable aleatoria normal con µ = 50 y σ 2 = 25. Calcular: a) p(x 40) p(x 60) p(x > 65) b) p(x > 35) p(40 < X < 60) p(30 < X < 42) 25. Una v.a. X se distribuye uniformemente en (2, 4). Se pide: a) P(X < 2.5) P(X 3.2) P(2.2 < X < 3.5) b) P(X x) = 0.4 P(X x) = 0.8 F X (2.7) 26. Una v.a. X se distribuye de forma normal N(0; 1). Se pide: a) P(X < 1.2) P(X 2.6) F X (1.5) b) P(X x) = 0.4 P(X x) = 0.8 F X ( 0.7) Universidad de Cantabria. Alberto Luceño y Fco. Javier Glez Ortiz 12

II.6. TEOREMA CENTRAL DEL LÍMITE Sección II.6 Teorema Central del Límite En este apartado estudiaremos la distribución del promedio de variables independientes e idénticamente distribuidas y a través de los histogramas correspondientes analizaremos el comportamiento de estas distribuciones a medida que promediamos un número creciente de variables aleatorias. X = X 1 + X 2 +... + X n n Teorema de central del límite: Si X 1,..., X n son variables aleatorias independientes con la misma media µ y la misma varianza σ 2 0 y finita, la función de distribución de la variable aleatoria cuando n tiende a infinito. X = X 1 +... + X n n N ( µ, ) σ n 27. Con este ejemplo ilustraremos que el promedio de la media muestral, E[X] = µ y la desviación típica de la media muestral es D.T.[X] = σ n. a) Simula una v.a. normal N(0, σ = 4) de tamaño N = 1000 datos (este valor grande para aumentar la precisión) y calcula de ella su media y su desviación típica. b) Simula 16 muestras de una población normal N(0, σ = 4) de tamaño N = 1000. 1) Calcula la media X 16 = X 1 + X 2 +... + X 16. 16 2) Calcula la desviación típica de la variable X 16 Comprueba que realmente se cumple que E[X] = µ y D.T.[X] = σ n. muestra.16 <- replicate(16, rnorm(1000,mean=0,sd=4)) medias.16<-apply(muestra.16,1,mean) mean(medias.16) sd(medias.16) 28. Simular y representar la media de un muestreo aleatorio simple de tamaño 2 (X 1, X 2 ) de una distribución U(0, 1). a) Simular dos muestras muestras.2 de tamaño N = 1000 para obtener un histograma con bastante precisión muestra.2 <- replicate(2, runif(1000,min=0,max=1)) b) Construir el vector de medias media.2 medias.2<-apply(muestra.2,1,mean) c) Realiza el histograma. hist(medias.2,breaks=100) Universidad de Cantabria. Alberto Luceño y Fco. Javier Glez Ortiz 13

CAPÍTULO II. PROBABILIDAD-VARIABLES ALEATORIAS d) Añadir en el histograma una línea vertical azul 2 que represente el promedio del vector de medias obtenido. Representar con una línea de puntos (lty=3) de color rojo (col=red ) la media de la población. 29. 30. A partir del ejercicio anterior, simular y representar la media de un muestreo aleatorio simple de tamaño 5, (X 1, X 2,, X 5 ) de una distribución U(0, 1). A partir del ejercicio anterior, simular y representar la media de un muestreo aleatorio simple de tamaño 30, (X 1, X 2,, X 30 ) de una distribución U(0, 1). muestra.30 <- replicate(30, runif(1000,min=0,max=1)) medias.30<-apply(muestra.30,1,mean) hist(medias.30,breaks=100,freq=false) Le añadimos la curva normal para visualizar la comparación, N(µ, σ/ n) curve(dnorm(x,0.5,1/sqrt(360)),col="red",add=t,lwd=3) 31. 32. Realizar el ejercicio anterior para una distribución exponencial Ex(α = 2). Un sistema electrónico está dispuesto de forma que cuando falla el primer dispositivo E 1 se activa automáticamente el segundo E 2, y así sucesivamente hasta el E n. Si el tiempo T i hasta que falla E i, para cualquier i, es de tipo exponencial con parámetro α = 0.1 hora 1 y T(n) = T 1 + T 2 + + T n es el tiempo total de funcionamiento de n dispositivos, hallar: a) P[T(1) > 12]. b) P[T(2) > 18]. c) P[T(30) > 350]. d) Calcular los apartados anteriores por simulación Soluciones 15. b) 0.0457172 c) 1)0.0964605; 2) 0.2150754;3) 0.0007471; 4) 0.0769230 22. a) 0.08439778-0.08572368-0.9983152 b) 78-75-0.2589559 23. a) 0.303 b) 0.9856 c) 0.00175 24. a) 0.02275-0.9772-0.0013 b) 0.9986-0.9544-0.05476 25. a) 0.25-0.4-0.65 b) 2.8-2.4-0.35 26. a) 0.8849303-0.004661188-0.9331928 b) -0.2533471-0.8416212-0.2419637 2 abline(v=mean(medias),col=. a zul,lwd=3) Universidad de Cantabria. Alberto Luceño y Fco. Javier Glez Ortiz 14