Probabilidad y Estadística

Probabilidad y Estadística Grado en Ingeniería Informática - Curso 2 Pablo Candela Departamento de Matemáticas (despacho 212) Universidad Autónoma de Madrid pablo.candela@uam.es Introducción 1 / 8

Organización del curso 4 horas semanales de clase: Martes (de 4 a 5) + Miércoles (de 3 a 5) + Jueves (de 4 a 5). 7 hojas de ejercicios durante el curso. Usaré transparencias en clase (beamer), con apuntes adicionales en la pizarra de vez en cuando (sobre todo cuando hagamos los ejercicios). Los apuntes, las hojas de ejercicios, y más material, irán apareciendo en la página web del curso: http://verso.mat.uam.es/~pablo.candela/pye.html Ordenador en clase: lo usaremos ocasionalmente para algunos ejemplos o ejercicios (usando principalmente OpenOffice Calc). Introducción 2 / 8

Evaluación y bibliografía Evaluación: Convocatoria ordinaria: dos métodos: 1. Evaluación continua: Tres exámenes parciales, con valor de 30% de la nota cada uno + uno o dos trabajos entregados, con valor total de 10% de la nota. Aprobación por esta vía no se necesita pasar el examen final. NOTA: para ser evaluado por este método es necesario presentarse a todos los parciales y entregar los trabajos. 2. Evaluación no continua: únicamente por examen final. Fechas: Parciales: primer parcial el 1 de marzo; segundo parcial el 5 de abril; tercer parcial el 10 de mayo. Examen final: el 17 de mayo. Convocatoria extraordinaria: examen, el 20 de junio. Bibliografía: en la página web del curso hay referencias de libros recomendados. Se recomienda en particular el libro de De la Horra. Introducción 3 / 8

Motivación La naturaleza nos presenta numerosos fenómenos cuyas causas o dinámicas son tan complejas que no llegamos a conocerlas completamente. Ejemplos: Condiciones meteorológicas La evolución de una característica de una gran población (datos económicos, demográficos, etc.) El comportamiento de grandes conjuntos de partículas en movimiento (mecánica estadística) La evolución de internet O simplemente, los resultados de lanzamientos repetidos de un dado. La probabilidad y la estadística nacen de nuestro deseo de entender tales fenómenos a pesar de nuestro conocimiento incompleto de sus mecanismos. En este curso veremos cómo podemos llegar a entender de modo útil tales fenómenos aleatorios (útil, en particular, para poder hacer afirmaciones o predicciones informadas/razonables acerca de estos fenómenos). Trataremos de esto en tres partes, reflejadas en la estructura del curso. Introducción 4 / 8

Motivación 1. El objeto típico al que se aplica la estadística es un conjunto de datos (empíricos) tan grande que no podemos abarcarlo entero. Veremos cómo podemos no obstante describir un tal conjunto de modo útil, a partir de muestras tomadas del conjunto. Para obtener tales descripciones, veremos métodos que consisten en resumir las muestras con pocos parámetros. Con este fin estudiaremos parámetros como la media de una muestra, o su varianza, etc.. Tales métodos constituyen la estadística descriptiva. 2. Abstrayendonos del ámbito empírico, pasaremos a estudiar cómo se puede representar tales fenómenos aleatorios con modelos teóricos, y estudiaremos estos modelos. En este estudio consiste la teoría de la probabilidad. Entender los conceptos de esta teoría es muy útil en informática, en particular para idear e implementar algoritmos probabilistas. Por ejemplo, un algoritmo de ordenamiento rápido (quicksort) se puede querer implementar de manera probabilista, eligiendo los pivotes al azar. Se querrá saber entonces qué probabilidad tiene el algoritmo de tardar poco tiempo en completar la ordenación. Introducción 5 / 8

Motivación 3. En esta parte, nos moveremos entre el ámbito empírico y el teórico, considerando problemas del tipo siguiente. Tendremos de entrada unos datos empíricos, y podremos suponer que estos datos siguen alguno de los modelos probabiĺısticos que habremos estudiado, pero no sabremos precisamente cuál de estos modelos (con qué parámetros); o bien, se dará una suposición (hipótesis) de que estos datos siguen un modelo particular, y querremos saber si esta hipótesis es razonable. Estudiaremos métodos para estimar, a partir de los datos, cuál de los modelos se adapta mejor a estos datos, o si la hipótesis dada es razonable. En estos métodos consiste la estimación estadística de modelos probabilistas. De nuevo, estos métodos son importantes en informática. Por ejemplo, son abundantes los programas que usan de algún modo números pseudoaleatorios (simulación por computadora, criptografía, etc.). Si creamos un algoritmo que supuestamente genera números pseudoaleatorios, una forma de comprobar si los números generados son suficientemente aleatorios es aplicarles métodos estadísticos. Introducción 6 / 8

Estructura del curso El curso se desarrollará en tres capítulos (o temas): 1. Estadística descriptiva Con una variable (media y varianza muestrales, asimetría, etc.). Con 2 o más variables (correlación, regresión lineal). 2. Probabilidad Esta teoría usa los lenguajes matemáticos de la teoría de conjuntos, la combinatoria, y el cálculo diferencial. Noción de espacio de probabilidad. Particiones y probabilidades condicionadas. Variables aleatorias. Distribución, media y varianza. Ejemplos importantes de modelos probabiĺısticos. Vectores aleatorios. Noción de independencia de variables aleatorias. Ejemplos importantes de modelos probabiĺısticos multivariables. Leyes de los grandes números. Teorema central del ĺımite. Introducción 7 / 8

Estructura del curso 3. Estimación estadística de modelos probabilistas Se apoya en el lenguaje de la probabilidad, pero se trata mucho más de hacer estimaciones numéricas. Muestreo aleatorio. Estimación puntual: método de máxima verosimilitud, método de momentos. Estimación por intervalos de confianza. Contrastes de hipótesis. Introducción 8 / 8