Análisis de Datos en Física de Partículas

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Análisis de Datos en Física de Partículas"

Transcripción

1 Análisis de Datos en Física de Partículas Sección de Posgrado Facultad de Ciencias Universidad Nacional de Ingeniería C. Javier Solano Página del curso: curso-analisis-estadistico-de-datos-en-fisica-de-particulas-mf708/ J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 1

2 Análisis de Datos en Física de Partículas: Capítulo 5 1 Teorema de Probabilidad de Bayes, Variables aleatorias, y pdfs 2 Funciones de r.v.s, Valores de expectación, propagación de errores 3 Catálogo de pdfs 4 El método de Monte Carlo 5 Test estadísticos: conceptos generales 6 Test statistics, métodos multivariantes 7 Tests Bondad de ajuste (goodness-of-fit) 8 Parámetros de estimación, maximum likelihood 9 Mas de maximum likelihood 10 Método de mínimos cuadrados (least squares) 11 Intervalo de estimación, establecimiento de límites 12 Parámetros molestos (nuisance), incertidumbres sistemáticas 13 Ejemplos de aproximación Bayesiana J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 2

3 Límites de decisión lineal Una frontera de decisión lineal es sólo óptima cuando ambas clases siguen gaussianas multivariados con covarianzas equivalentes y diferentes medias. Para algunos casos un límite lineal es casi inútil. J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 3

4 Transformaciones no lineales de los inputs/entradas Tratemos de encontrar una transformación, 1,..., n -> 1 ( ),..., n ( ), de modo que las variables transformadas, de "características espaciales", se pueden separar mejor por una frontera lineal. Aquí, suponer funciones de base fija (no parámetros libres) J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 4

5 Pruebas/Tests estadísticas no lineales La frontera de decisión óptima puede no ser un hiperplano, prueba estadística no lineal t(x) Métodos estadísticos multivariantes son una gran industria: redes neuronales, máquinas de vectores soporte, métodos de densidad kernel, Física de Partículas puede beneficiarse de los avances en Machine Learning (aprendizaje automático) J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 5

6 Introducción a las redes neuronales Se usa en neurobiología, reconocimiento de patrones, previsión financiera,... Aquí, redes neuronales son sólo un tipo de prueba estadística. Supongamos que tomamos t(x) para tener la forma Logística sigmoide Esto se llama perceptrón de una sola capa s( ) es monotónica equivalente a lineal t(x) J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 6

7 Introducción a las redes neuronales Generalizar a partir de una capa a perceptrón multicapa: Los valores de los nodos de la capa intermedia (oculta) son y la salida de la red está dada por pesos (fuerzas de conexión) J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 7

8 Análisis de redes neuronales Fácil de generalizar a número arbitrario de capas. Red feed-forward: los valores de un nodo dependen sólo de las capas anteriores, por lo general sólo de capa anterior ("arquitectura de red"). Más nodos red neuronal se acerca a óptimo t(x), pero más parámetros necesitan ser determinados. Parámetros generalmente determinados minimizando función de error, donde t (0), t (1) son valores, por ej., 0 y 1 para sigmoide logística. Valores de expectación reemplazados por medias de datos entrenados (ej. MC). En general entrenamiento puede ser difícil; software estándar disponible. J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 8

9 Ejemplo de redes neuronales del LEP II Señal: e + e W + W (frecuente: 4 jets hadrónicos bien separados) Background: e + e qqgg (4 jets hadrónicos menos bien separados) variables de entrada/input basadas en la estructura del jet, forma del evento,... ninguna da sola mucha separación. output redes neuronales lo hace mejor... (Garrido, Juste and Martinez, ALEPH ) J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 9

10 Algunos asuntos con redes neuronales En el ejemplo, con eventos WW, el objetivo era seleccionar a estos eventos con el fin de estudiar las propiedades del bosón W. Necesario evitar el uso de variables input variables correlacionadas con las propiedades que eventualmente queremos estudiar (no trivial) En principio, una sola capa oculta con un número suficientemente nodos puede aproximar arbitrariamente bien la prueba óptima de variables (likelihood ratio / razón de probabilidad). En general comenzamos con un número pequeño de nodos y aumentamos hasta que los errores de clasificación en la validación de datos de la muestra deja de disminuir. En general el entrenamiento MC de datos es barato -- problemas con quedar atrapado en mínimos locales, sobreentrenamiento, etc., menos importante q la preocupación por las diferencias sistemáticas entre los datos entrenados y la Naturaleza, y las preocupaciones por la facilidad de interpretación de los resultados (output). J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 10

11 Técnicas de estimación de densidad de probabilidad (PDE) Construir estimadores no paramétricos de los pdfs y usarlos para construir el likelihood ratio (histograma n-dimensional es un ejemplo de fuerza bruta de esto.) Técnicas de estimación más inteligentes pueden conseguir que esto funcione para dimensiones (un poco) mayores. Ver, ej. K. Cranmer, Kernel Estimation in High Energy Physics, CPC 136 (2001) 198; hep-ex/ ; T. Carli and B. Koblitz, A multi-variate discrimination technique based on range-searching, NIM A 501 (2003) 576; hep-ex/ J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 11

12 PDE basado en Kernel (KDE, ventana de Parzen) Considerar d dimensiones, N eventos de entramiento, x 1,..., x N, estimar f (x) con kernel ancho de banda (parámetro smoothing) Usar, x ej. Kernel Gausiano: términos para evaluar la función (lento); solo cuentan eventos en vecindad de x rcano, búsqueda por rango).en una distribución multivariante general p(x) J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 12

13 Correlación vs independencia En una distribución multivariante general p(x) no factoriza en un; producto de distribuciones marginales para las variables individuales: Se mantiene solo si componentes de x son independientes Más importante, los componentes de x tendrán en general covariancia diferente de cero (es decir, están correlacionadas): J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 13

14 Decorrelación de variables de entrada Podemos definir un conjunto de variables de entrada no correlacionadas por una transformación lineal, es decir, hallar la matriz A tal que para y=a x las covariancias cov[ y i, y j ]=0 Para lo siguiente suponer que las variables son decorrelacionadas de esta manera para cada una de p(x H 0 ) y p(x H 1 ) separadamente (desde que en general sus correlaciones son diferentes) J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 14

15 Decorrelación no es suficiente Porque aún con correlación cero, una pdf multivariante p(x) en general tendrá no linealidades y entonces las variables decorrelacionadas aún no son independientes. pdf con covariancia cero pero componentes todavía no son independientes, desde que y por lo tanto J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 15

16 Bayes sencillo (naive) Pero si las nolinealidades no son muy grandes, es razonable primero decorrelacionar las entradas/inputs y tomar como nuestro estimador para cada pdf Entonces esto al menos reduce el problema a uno de hallar estimados de pdfs 1-dim. El estimado resultante de likelihood ratio da el clasificador Naive Bayes (llamado algunas veces en HEP el método likelihood ) J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 16

17 Terminando Capítulo 6 Nos fijamos en tests estadísticos y asuntos relacionados: discriminar entre tipos de eventos (hipótesis), determinar la eficacia de la selección, pureza de la muestra, etc Hemos discutido algunos métodos modernos (y no tan modernos): discriminante de Fisher, redes neuronales, PDE, KDE, árboles de decisión,... A continuación hablaremos de tests de significancia (goodness-of-fit): p-value expresa el nivel de concordancia entre los datos y la hipótesis J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 6 página 17

Análisis de Datos en Física de Partículas

Análisis de Datos en Física de Partículas Análisis de Datos en Física de Partículas Sección de Posgrado Facultad de Ciencias Universidad Nacional de Ingeniería C. Javier Solano jsolano@uni.edu.pe http://compinformatidf.wordpress.com/ Página del

Más detalles

Análisis de Datos en Física de Partículas

Análisis de Datos en Física de Partículas Análisis de Datos en Física de Partículas Sección de Posgrado Facultad de Ciencias Universidad Nacional de Ingeniería C. Javier Solano jsolano@uni.edu.pe http://compinformatidf.wordpress.com/ Página del

Más detalles

Análisis de Datos en Física de Partículas

Análisis de Datos en Física de Partículas Análisis de Datos en Física de Partículas Sección de Posgrado Facultad de Ciencias Universidad Nacional de Ingeniería C. Javier Solano jsolano@uni.edu.pe http://compinformatidf.wordpress.com/ Página del

Más detalles

Análisis de Datos en Física de Partículas

Análisis de Datos en Física de Partículas Análisis de Datos en Física de Partículas Sección de Posgrado Facultad de Ciencias Universidad Nacional de Ingeniería C. Javier Solano jsolano@uni.edu.pe http://compinformatidf.wordpress.com/ Página del

Más detalles

Análisis de Datos en Física de Partículas

Análisis de Datos en Física de Partículas Análisis de Datos en Física de Partículas Sección de Posgrado Facultad de Ciencias Universidad Nacional de Ingeniería C. Javier Solano jsolano@uni.edu.pe http://compinformatidf.wordpress.com/ Página del

Más detalles

Análisis de Datos en Física de Partículas

Análisis de Datos en Física de Partículas Análisis de Datos en Física de Partículas Sección de Posgrado Facultad de Ciencias Universidad Nacional de Ingeniería C. Javier Solano S. jsolano@uni.edu.pe http://compinformatidf.wordpress.com/ Página

Más detalles

MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN

MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Teoría

Más detalles

El Perceptrón Multicapa

El Perceptrón Multicapa El Perceptrón Multicapa N entradas M neuronas de salida L: neuronas en la capa oculta E = 1 p M ( zi ( k) yi ( k) ) k = 1 i= 1 Implementación de la función XOR Regiones de clasificación en función del

Más detalles

Aprendizaje Automático

Aprendizaje Automático id3 id3 como búsqueda Cuestiones Adicionales Regresión Lineal. Árboles y Reglas de Regresión Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje

Más detalles

ESTIMACIÓN Estas transparencias contienen material adaptado del curso de PATTERN RECOGNITION AND MACHINE LEARNING de Heikki Huttunen y del libro Duda.

ESTIMACIÓN Estas transparencias contienen material adaptado del curso de PATTERN RECOGNITION AND MACHINE LEARNING de Heikki Huttunen y del libro Duda. ESTIMACIÓN Estas transparencias contienen material adaptado del curso de PATTERN RECOGNITION AND MACHINE LEARNING de Heikki Huttunen y del libro Duda. APRENDIZAJE AUTOMÁTICO, ESTIMACIÓN Y DETECCIÓN Introducción

Más detalles

Estimación de densidades basada en núcleos: algunos elementos. Isabel Cañette

Estimación de densidades basada en núcleos: algunos elementos. Isabel Cañette Estimación de densidades basada en núcleos: algunos elementos básicos. Isabel Cañette Seminario de Reconocimiento de Patrones. Seminario de Probabilidad y Estadística. Diciembre, 2002 Introducción. Decimos

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Desde la antigüedad, el problema de buscar patrones en datos es fundamental en diversas

Más detalles

Clasificación Supervisada

Clasificación Supervisada Clasificación Supervisada Ricardo Fraiman 26 de abril de 2010 Resumen Reglas de Clasificación Resumen Reglas de Clasificación Descripción del problema Muestra de entrenamiento (X 1, Y 1 ),..., (X n, Y

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Teórica básica. Incluimos. - Temas

Teórica básica. Incluimos. - Temas Teórica básica Incluimos - Temas 1 - Tema 1: Fenómenos aleatorios. Conceptos de probabilidad. Propiedades. Independencia de sucesos. Teorema de Bayes. - Tema 2: Variables aleatorias. Variables discretas.

Más detalles

Análisis de Datos. Clasificación Bayesiana para distribuciones normales. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Clasificación Bayesiana para distribuciones normales. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Clasificación Bayesiana para distribuciones normales Profesor: Dr. Wilfrido Gómez Flores 1 Funciones discriminantes Una forma útil de representar clasificadores de patrones es a través

Más detalles

Índice general. Prefacio...5

Índice general. Prefacio...5 Índice general Prefacio...5 Capítulo 1 Introducción...13 1.1 Introducción...13 1.2 Los datos...19 1.3 Etapas en los procesos de big data...20 1.4 Minería de datos...21 1.5 Estructura de un proyecto de

Más detalles

Técnicas Supervisadas Aproximación no paramétrica

Técnicas Supervisadas Aproximación no paramétrica Técnicas Supervisadas Aproximación no paramétrica 2016 Notas basadas en el curso Reconocimiento de Formas de F.Cortijo, Univ. de Granada Pattern Classification de Duda, Hart y Storck The Elements of Statistical

Más detalles

PROGRAMA DE CURSO. Código Nombre MA3403 Probabilidades y Estadística Nombre en Inglés Probability and Statistics SCT

PROGRAMA DE CURSO. Código Nombre MA3403 Probabilidades y Estadística Nombre en Inglés Probability and Statistics SCT PROGRAMA DE CURSO Código Nombre MA3403 Probabilidades y Estadística Nombre en Inglés Probability and Statistics SCT Unidades Horas de Horas Docencia Horas de Trabajo Docentes Cátedra Auxiliar Personal

Más detalles

PROGRAMA DE CURSO. Horas de Trabajo Personal Horas de Cátedra. Básica. Resultados de Aprendizaje

PROGRAMA DE CURSO. Horas de Trabajo Personal Horas de Cátedra. Básica. Resultados de Aprendizaje Código Nombre MA3403 Probabilidades y Estadística Nombre en Inglés Probability and Statistics SCT es Docentes PROGRAMA DE CURSO Horas de Cátedra Horas Docencia Auxiliar Horas de Trabajo Personal 6 10 3

Más detalles

Inteligencia Artificial. Aprendizaje neuronal. Ing. Sup. en Informática, 4º. Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani

Inteligencia Artificial. Aprendizaje neuronal. Ing. Sup. en Informática, 4º. Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani Inteligencia Artificial Aprendizaje neuronal Ing. Sup. en Informática, 4º Curso académico: 20/202 Profesores: Ramón Hermoso y Matteo Vasirani Aprendizaje Resumen: 3. Aprendizaje automático 3. Introducción

Más detalles

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.

Más detalles

Las Redes Neuronales Artificiales y su importancia como herramienta en la toma de decisiones. Villanueva Espinoza, María del Rosario CAPÍTULO V

Las Redes Neuronales Artificiales y su importancia como herramienta en la toma de decisiones. Villanueva Espinoza, María del Rosario CAPÍTULO V CAPÍTULO V V. ALGORITMOS NEURONALES Los modelos neuronales utilizan varios algoritmos de estimación, aprendizaje o entrenamiento para encontrar los valores de los parámetros del modelo, que en la jerga

Más detalles

Variables aleatorias

Variables aleatorias Variables aleatorias Un poco más general: si ahora S n está dada por la suma de variables independientes de la forma: S n =c 1 X 1 +... +c n X n, entonces la función generatriz viene dada por: Variables

Más detalles

05/06. Análisis estadístico y calibración. Juan A. Montiel-Nelson. Last Revision:

05/06. Análisis estadístico y calibración. Juan A. Montiel-Nelson. Last Revision: 05/06 Análisis estadístico y calibración Juan A. Montiel-Nelson Last Revision: 02.03.06 Escuela Técnica Superior de Ingenieros de Telecomunicación Universidad de Las Palmas de Gran Canaria Índice Análisis

Más detalles

Universidad Autónoma de Sinaloa

Universidad Autónoma de Sinaloa Séptima Edición del Diplomado en Estadística Mc. José V. Jiménez Ramírez Director de la Escuela de Ciencias Fisico-Matemáticas Tel. : 7 16 11 54 vidaljr@uas.uasnet.mx Dr. René Castro Montoya Coordinador

Más detalles

Estadística. Para el caso de dos variables aleatorias X e Y, se puede mostrar que. Pero y son desconocidos. Entonces. covarianza muestral

Estadística. Para el caso de dos variables aleatorias X e Y, se puede mostrar que. Pero y son desconocidos. Entonces. covarianza muestral Para el caso de dos variables aleatorias X e Y, se puede mostrar que Pero y son desconocidos. Entonces donde covarianza muestral Estimación de intervalos de confianza Cuál es el intervalo (de confianza)

Más detalles

INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON

INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON 2008-02-31 Notas tomadas por: María Eugenia Rojas Qué es Machine Learning? El proceso de aprendizaje de maquina consiste en tener una gran base de datos

Más detalles

Examen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4

Examen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4 Aprenentatge 0-03 Q Examen Parcial Nombre: (Examen ) Instrucciones. (0 puntos) Este examen dura horas. Responded todas las preguntas en estas hojas. Para las preguntas test poned un circulo alrededor de

Más detalles

Perceptrón simple y perceptrón multicapa

Perceptrón simple y perceptrón multicapa UNL - FICH - Departamento de Informática - Ingeniería Informática Inteligencia Computacional Guía de trabajos prácticos Perceptrón simple y perceptrón multicapa. Objetivos Aplicar diferentes arquitecturas

Más detalles

Redes Neuronales. Las redes neuronales son modelos computacionales que buscan imitar el funcionamiento

Redes Neuronales. Las redes neuronales son modelos computacionales que buscan imitar el funcionamiento Redes Neuronales Las redes neuronales son modelos computacionales que buscan imitar el funcionamiento de las neuronas biológicas. Se usan principalmente para el reconocimiento de patrones complejos. Para

Más detalles

Clasificación estadística de patrones

Clasificación estadística de patrones Clasificación estadística de patrones Clasificador gaussiano César Martínez cmartinez _at_ fich.unl.edu.ar Tópicos Selectos en Aprendizaje Maquinal Doctorado en Ingeniería, FICH-UNL 19 de setiembre de

Más detalles

CRITERIOS DE SELECCIÓN DE MODELOS

CRITERIOS DE SELECCIÓN DE MODELOS Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,

Más detalles

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja

Más detalles

Tema 2: Análisis Discriminante

Tema 2: Análisis Discriminante Tema 2: Análisis Discriminante P 1 P 2 Problema de clasificación: Ténemos observaciones que corresponden a 2 grupos P_1, P_2. Si nos dan uno nuevo x_0 a que grupo pertenece? Guión 1. Motivación 2. Clasificación

Más detalles

Least Squared Methods for System Identification. 1. Modelamiento de datos - Least Squared Estimator

Least Squared Methods for System Identification. 1. Modelamiento de datos - Least Squared Estimator 16/4/2011 UNIVERSIDAD TECNICA FEDERICO SANTA MARIA DEPARTAMENTO DE ELECTRONICA ELO325 SoftComputing y Aplicaciones Least Squared Methods for System Identification Tomás Arredondo Vidal - 1. Modelamiento

Más detalles

TEMA 1: INTRODUCCIÓN N AL PROCESADO Y ANÁLISIS DE DATOS

TEMA 1: INTRODUCCIÓN N AL PROCESADO Y ANÁLISIS DE DATOS Procesado y Análisis de Datos Ambientales. Curso 2009-2010. José D. Martín, Emilio Soria, Antonio J. Serrano TEMA 1: INTRODUCCIÓN N AL PROCESADO Y ANÁLISIS DE DATOS ÍNDICE Introducción. Selección de variables.

Más detalles

UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA

UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA DIRECCIÓN GENERAL DE ASUNTOS ACADÉMICOS PROGRAMA DE ASIGNATURA POR COMPETENCIAS I. DATOS DE IDENTIFICACIÓN 1. Unidad Académica: Facultad de Ingeniería. Mexicali.

Más detalles

Estadística. Generalmente se considera que las variables son obtenidas independientemente de la misma población. De esta forma: con

Estadística. Generalmente se considera que las variables son obtenidas independientemente de la misma población. De esta forma: con Hasta ahora hemos supuesto que conocemos o podemos calcular la función/densidad de probabilidad (distribución) de las variables aleatorias. En general, esto no es así. Más bien se tiene una muestra experimental

Más detalles

MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico.

MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 4: Modelos lineales. 1 Objetivos del tema Conocer los parámetros que indican la posible relación lineal entre variables. Aprender

Más detalles

ESTADÍSTICA. 4 horas a la semana 8 créditos Semestre variable según la carrera

ESTADÍSTICA. 4 horas a la semana 8 créditos Semestre variable según la carrera ESTADÍSTICA 4 horas a la semana 8 créditos Semestre variable según la carrera Objetivo del curso: Aplicar los conceptos de la teoría, metodología y las técnicas de la Estadística, requeridas para modelar

Más detalles

ANX-PR/CL/ GUÍA DE APRENDIZAJE

ANX-PR/CL/ GUÍA DE APRENDIZAJE PROCESO DE COORDINACIÓN DE LAS ENSEÑANZAS PR/CL/001 ASIGNATURA 55000643 - PLAN DE ESTUDIOS 05IR - CURSO ACADÉMICO Y SEMESTRE 2018/19 - Primer semestre Índice Guía de Aprendizaje 1. Datos descriptivos...1

Más detalles

Aprendizaje Automático

Aprendizaje Automático Regresión Lineal: Descenso de Gradiente Árboles de Regresión: M5 Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje (PLG) Departamento de Informática

Más detalles

Estadística /Química 2004

Estadística /Química 2004 UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLAN LICENCIATURA EN: QUÍMICA. NOMBRE DE LA ASIGNATURA: ESTADÍSTICA. ÓRGANO INTERNO QUE COORDINA EL PROGRAMA DE LA ASIGNATURA:

Más detalles

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Validación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción La mayoría de los clasificadores que se han visto requieren de uno o más parámetros definidos libremente,

Más detalles

Programa Regular. Probabilidad y Estadística.

Programa Regular. Probabilidad y Estadística. Programa Regular Probabilidad y Estadística. Modalidad de la asignatura: teórico-práctica. Carga horaria: 5hs. Objetivos: Con relación a los conocimientos a impartir en el desarrollo de la materia, es

Más detalles

Planificaciones Probabilidad y Estadística B. Docente responsable: GRYNBERG SEBASTIAN PABLO. 1 de 6

Planificaciones Probabilidad y Estadística B. Docente responsable: GRYNBERG SEBASTIAN PABLO. 1 de 6 Planificaciones 6109 - Probabilidad y Estadística B Docente responsable: GRYNBERG SEBASTIAN PABLO 1 de 6 OBJETIVOS 1) Que los estudiantes aprendan los elementos básicos del método probabilístico y de la

Más detalles

Planificaciones Probabilidad y Estadística B. Docente responsable: GRYNBERG SEBASTIAN PABLO. 1 de 6

Planificaciones Probabilidad y Estadística B. Docente responsable: GRYNBERG SEBASTIAN PABLO. 1 de 6 Planificaciones 8104 - Probabilidad y Estadística B Docente responsable: GRYNBERG SEBASTIAN PABLO 1 de 6 OBJETIVOS 1) Que los estudiantes aprendan los elementos básicos del método probabilístico y de la

Más detalles

ASIGNATURA: MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA. (Especialidad: Mecánica) Troncal 1 cuatrimestre, 6 créditos: 3 teóricos, 3 prácticos

ASIGNATURA: MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA. (Especialidad: Mecánica) Troncal 1 cuatrimestre, 6 créditos: 3 teóricos, 3 prácticos ASIGNATURA: MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA (Especialidad: Mecánica) Troncal 1 cuatrimestre, 6 créditos: 3 teóricos, 3 prácticos (Código: 632079) 1. EQUIPO DOCENTE Dr. D. Vicente Novo Sanjurjo. Profesor

Más detalles

Introducción. Existen dos aproximaciones para resolver el problema de clasificación: Aproximación Generativa (vista en el Tema 3) Basada en:

Introducción. Existen dos aproximaciones para resolver el problema de clasificación: Aproximación Generativa (vista en el Tema 3) Basada en: Introducción Eisten dos aproimaciones para resolver el problema de clasificación: Aproimación Generativa (vista en el Tema 3) Basada en: Modelar p(,w)=p( w)p(w) p( w) es la distribución condicional de

Más detalles

Perceptrones Fernando Berzal,

Perceptrones Fernando Berzal, Fernando Berzal, berzal@acm.org Introducción Redes neuronales artificiales Modelos de redes Modelo de neurona artificial Funciones de activación La neurona de McCulloch y Pitts El algoritmo de aprendizaje

Más detalles

Perceptrón Simple. Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA. Rosana Matuk Primer Cuatrimestre 2018

Perceptrón Simple. Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA. Rosana Matuk Primer Cuatrimestre 2018 Perceptrón Simple Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA Rosana Matuk Primer Cuatrimestre 2018 Rosana Matuk (DC-FCEyN-UBA) Perceptrón simple Primer Cuatrimestre 2018 1 / 29 Objetivo

Más detalles

Conocer los principales métodos de la estadística inferencial e identificar sus aplicaciones a diversas áreas del conocimiento y de la cotidianidad.

Conocer los principales métodos de la estadística inferencial e identificar sus aplicaciones a diversas áreas del conocimiento y de la cotidianidad. NOMBRE DEL CURSO: ESTADÍSTICA INFERENCIAL CÓDIGO: CRÉDITOS 5 PRE-REQUISITO: POST-REQUISITO: JORNADA: PRESENTACIÓN: Se estudian los métodos más importantes de la estadística inferencial, enfocándose principalmente

Más detalles

Estadística Aplicada

Estadística Aplicada Estadística Aplicada Universidad Maimónides 2016 Clase 5 Distribución de la Media Muestral Pedro Elosegui 1 2 Métodos y Distribuciones de Muestreo En estadística nos gustaría contar con los parámetros

Más detalles

Econometría Avanzada FLACSO 2014

Econometría Avanzada FLACSO 2014 Econometría Avanzada FLACSO 2014 Hemos cubierto: Mapa Planteamiento de una pregunta económica de interés Diferencias entre econometría y estadística Métodos: Lineales (MCO) revisión, variables instrumentales

Más detalles

4 Teoría de clasificadores

4 Teoría de clasificadores Reconocimiento de señales de tráfico para un sistema de ayuda a la conducción 4 Teoría de clasificadores 4.1 Introducción Clasificar un objeto consiste en asignarlo a una de las clases disponibles. Los

Más detalles

REDES NEURONALES ADAPTABLES

REDES NEURONALES ADAPTABLES REDES NEURONALES ADAPTABLES Unidad 3: Redes neuronales artificiales y modelos de entrenamiento SubTemas 3.2 Perceptron simple Arquitectura Regla delta Multi Layer Perceptrón 3.3 Redes Neuronales Adaptables

Más detalles

Repaso de conceptos de álgebra lineal

Repaso de conceptos de álgebra lineal MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Repaso

Más detalles

Análisis multivariante II

Análisis multivariante II Análisis multivariante II Tema 1: Introducción Pedro Galeano Departamento de Estadística Universidad Carlos III de Madrid pedro.galeano@uc3m.es Curso 2016/2017 Grado en Estadística y Empresa Pedro Galeano

Más detalles

Julio Deride Silva. 4 de junio de 2010

Julio Deride Silva. 4 de junio de 2010 Curvas ROC y Regresión Lineal Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 4 de junio de 2010 Tabla de Contenidos Curvas ROC y Regresión Lineal

Más detalles

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74 Índice 1. Introducción al R 15 1.1. Introducción............................. 15 1.2. El editor de objetos R....................... 18 1.3. Datos en R............................. 19 1.3.1. Vectores...........................

Más detalles

Reconocimiento automático de palabras en documentos históricos usando redes neuronales convolucionales

Reconocimiento automático de palabras en documentos históricos usando redes neuronales convolucionales Reconocimiento automático de palabras en documentos históricos usando redes neuronales convolucionales Dra. Ma. de Guadalupe García Hernández Departamento de Ingeniería Electrónica Objetivo general Aplicar

Más detalles

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS 1 POR QUÉ SE LLAMAN CONTRASTES NO PARAMÉTRICOS? A diferencia de lo que ocurría en la inferencia paramétrica, ahora, el desconocimiento de la población que vamos

Más detalles

Técnicas de Muestreo Métodos

Técnicas de Muestreo Métodos Muestreo aleatorio: Técnicas de Muestreo Métodos a) unidad muestral elemental: a.1) muestreo aleatorio simple a.2) muestreo (seudo)aleatorio sistemático a.3) muestreo aleatorio estratificado b) unidad

Más detalles

Cátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS

Cátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS Cátedra: TABLA DE CONTENIDOS INTRODUCCIÓN Qué es la Probabilidad? Qué es la Estadística? La evolución histórica de la Estadística Algunos conceptos imprescindibles Fuentes de datos Tipos de datos y escalas

Más detalles

CUERPO TÉCNICO, OPCION ESTADISTICA

CUERPO TÉCNICO, OPCION ESTADISTICA CUERPO TÉCNICO, OPCION ESTADISTICA ESTADÍSTICA TEÓRICA BÁSICA TEMA 1. Fenómenos aleatorios. Conceptos de probabilidad. Axiomas. Teoremas de probabilidad. Sucesos independientes. Teorema de Bayes. TEMA

Más detalles

Redes neuronales con funciones de base radial

Redes neuronales con funciones de base radial Redes neuronales con funciones de base radial Diego Milone y Leonardo Rufiner Inteligencia Computacional Departamento de Informática FICH-UNL Organización: RBF-NN Motivación y orígenes RBF Arquitectura

Más detalles

INDICE. Prólogo a la Segunda Edición

INDICE. Prólogo a la Segunda Edición INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.

Más detalles

Técnicas de inteligencia artificial. Aprendizaje: Perceptrón multi-capa

Técnicas de inteligencia artificial. Aprendizaje: Perceptrón multi-capa Técnicas de inteligencia artificial Aprendizaje: Perceptrón multi-capa Índice Regla delta Modelo computacional Neuronas e hiperplanos Entrenamiento como ajuste supervisado No-separabilidad lineal Backpropagation

Más detalles

Estadística con R. Clasificadores

Estadística con R. Clasificadores Estadística con R Clasificadores Análisis discriminante lineal (estadístico) Árbol de decisión (aprendizaje automático) Máquina soporte vector (aprendizaje automático) Análisis discriminante lineal (AD)

Más detalles

Variables aleatorias

Variables aleatorias Distribuciones continuas Se dice que una variable aleatoria X tiene una distribución continua, o que X es una variable continua, si existe una función no negativa f, definida sobre los números reales,

Más detalles

Análisis de Datos. Métodos de mínimos cuadrados. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Métodos de mínimos cuadrados. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Métodos de mínimos cuadrados Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Recordemos que los clasificadores lineales se utilizan ampliamente debido a que son computacionalmente

Más detalles

Aprendizaje Automático

Aprendizaje Automático Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje (PLG) Departamento de Informática Escuela Politécnica Superior Universidad Carlos III de Madrid

Más detalles

Nota de los autores... vi

Nota de los autores... vi ÍNDICE Nota de los autores... vi 1 Qué es la estadística?... 1 1.1 Introducción... 2 1.2 Por qué se debe estudiar estadística?... 2 1.3 Qué se entiende por estadística?... 4 1.4 Tipos de estadística...

Más detalles

TLU(s) MULTICAPAS. Se pueden implementar funciones en TLU con más de una capa.

TLU(s) MULTICAPAS. Se pueden implementar funciones en TLU con más de una capa. TLU(s) MULTICAPAS Se pueden implementar funciones en TLU con más de una capa 1 05 2 15 2 3 z 3 15 2 4 05 No eisten, en la actualidad, mecanismos de entrenamiento que permita conocer los pesos sinápticos

Más detalles

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10 Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores

Más detalles

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN ÍNDICE CAPÍTULO 1. INTRODUCCIÓN 1.1. OBJETO DE LA ESTADÍSTICA... 17 1.2. POBLACIONES... 18 1.3. VARIABLES ALEATORIAS... 19 1.3.1. Concepto... 19 1.3.2. Variables discretas y variables continuas... 20 1.3.3.

Más detalles

Probabilidad Condicional

Probabilidad Condicional Probabilidad Condicional Ejemplo: Se tiene que dos bolas son seleccionadas aleatoriamente (sin reemplazo) de un caja que contiene r bolas rojas y b bolas azules. Cuál es la probabilidad de que la primera

Más detalles

Facultad de Ciencias Sociales - Universidad de la República

Facultad de Ciencias Sociales - Universidad de la República Facultad de Ciencias Sociales - Universidad de la República Estadística y sus aplicaciones en Ciencias Sociales Edición 2016 Ciclo Avanzado 3er. Semestre (Licenciatura en Ciencia Política/ Licenciatura

Más detalles

Introducción Climatología y variabilidad climática (espacial y temporal). Datos climáticos. Revisión sobre el concepto de probabilidad.

Introducción Climatología y variabilidad climática (espacial y temporal). Datos climáticos. Revisión sobre el concepto de probabilidad. Nombre de la Asignatura: Análisis Estadístico de Datos Climáticos Créditos: 10 Docentes responsables: Ciencias) Álvaro Díaz (F. Ingeniería) y Mario Bidegain (F. Objetivo de la asignatura: Desarrollar en

Más detalles

PROGRAMA DE CURSO. Código Nombre MA3402 Estadística Nombre en Inglés Statistics SCT Requisitos. DIM Resultados de Aprendizaje

PROGRAMA DE CURSO. Código Nombre MA3402 Estadística Nombre en Inglés Statistics SCT Requisitos. DIM Resultados de Aprendizaje > < ; U Q R ;?C: VT 2 +D :?CB J B > > ; S6D :? < ;? ; C?C : >? ; W( U C > X?2 > R+DE?C : < > ; ; 9 : : R > ; Y < > < ; U Q R ;?C: VT 2 +D :?C B J B > > ; S6D :? < ;? ; C?C : >? ; W( U C > X?2 > R+DE?C

Más detalles

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2015-2016 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Escuela Politécnica Superior

Más detalles

MÍNIMOS CUADRADOS GENERALIZADOS

MÍNIMOS CUADRADOS GENERALIZADOS Métodos Estadísticos para Economía y Gestión (IN540-2) Otoño 2008 - Semestre I, Parte II Universidad de Chile Departamento de Ingeniería Industrial Profesor: Mattia Makovec (mmakovec@dii.uchile.cl) Auxiliar:

Más detalles

(x) = 1 si P (Y = 1 X = x) P (Y = 0 X = x) P (Y = 0 X = x) > P (Y = 1 X = x) P (X = x Y = 0)P (Y = 0) > P (X = x Y = 1)P (Y = 1)

(x) = 1 si P (Y = 1 X = x) P (Y = 0 X = x) P (Y = 0 X = x) > P (Y = 1 X = x) P (X = x Y = 0)P (Y = 0) > P (X = x Y = 1)P (Y = 1) 1 1. Conceptos generales de clasificación 2. Clasificador k-vecino más cercano 3. Clasificador Bayesiano óptimo 4. Análisis discriminante lineal (LDA) 5. Clasificadores lineales y el Modelo perceptrón

Más detalles

Análisis de Datos. Regresión logística. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Regresión logística. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Regresión logística Profesor: Dr. Wilfrido Gómez Flores 1 Regresión logística Supóngase que se tiene una variable binaria de salida Y, y se desea modelar la probabilidad condicional P(Y=1

Más detalles

Intervalos de confianza con STATGRAPHICS

Intervalos de confianza con STATGRAPHICS Intervalos de confianza con STATGRAPHICS Ficheros empleados: TiempoaccesoWeb.sf3 ; TiempoBucle.sf3; 1. Ejemplo 1: Tiempo de acceso a una página Web Se desean construir intervalos de confianza para la media

Más detalles

Tema 4: VARIABLE ALEATORIA N-DIMENSIONAL

Tema 4: VARIABLE ALEATORIA N-DIMENSIONAL Tema 4: VARIABLE ALEATORIA N-DIMENSIONAL Carlos Alberola López Lab. Procesado de Imagen, ETSI Telecomunicación Despacho D04 caralb@tel.uva.es, jcasasec@tel.uva.es, http://www.lpi.tel.uva.es/sar Concepto

Más detalles

APRENDIZAJE PROBABILÍSTICO NAIVE BAYES

APRENDIZAJE PROBABILÍSTICO NAIVE BAYES 1 APRENDIZAJE PROBABILÍSTICO NAIVE BAYES Bases de Datos Masivas 9 de Noviembre de 2016 2 Razonamiento Probabilístico Es una herramienta de aprendizaje estadístico. Se trata de razonar en un contexto incierto;

Más detalles

Red Neuronal Artificial

Red Neuronal Artificial índice RN Supervisadas - Introducción - El Perceptrón y la estructura multicapa MLP - El aprendizaje retropropagado: BP - Aplicaciones y ejemplos - Características y limitaciones P Campoy 1 Red Neuronal

Más detalles

ANX-PR/CL/ GUÍA DE APRENDIZAJE

ANX-PR/CL/ GUÍA DE APRENDIZAJE PROCESO DE COORDINACIÓN DE LAS ENSEÑANZAS PR/CL/001 ASIGNATURA 55000012 - PLAN DE ESTUDIOS 05TI - Grado en Ingenieria en Tecnologias CURSO ACADÉMICO Y SEMESTRE 2017-18 - Primer semestre Índice Guía de

Más detalles

ÍNDICE. Prefacio... xi

ÍNDICE. Prefacio... xi ÍNDICE Prefacio... xi Capítulo 1 Introducción... 1 1.1 Por qué hay que tomar este curso y quién utiliza la estadística?... 2 1.2 Historia... 3 1.3 Subdivisiones de la estadística... 4 1.4 Un enfoque simple

Más detalles

Tópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones

Tópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 1 Algoritmos para Reconocimiento de Patrones 18 de septiembre de 2014 1. Objetivos Introducir conceptos básicos de aprendizaje automático.

Más detalles

ANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Estadistica. CURSO ACADÉMICO - SEMESTRE Primer semestre

ANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Estadistica. CURSO ACADÉMICO - SEMESTRE Primer semestre ANX-PR/CL/001-01 GUÍA DE APRENDIZAJE ASIGNATURA Estadistica CURSO ACADÉMICO - SEMESTRE 2016-17 - Primer semestre GA_05IQ_55001012_1S_2016-17 Datos Descriptivos Nombre de la Asignatura Titulación Centro

Más detalles

CONTRASTE DE HIPÓTESIS

CONTRASTE DE HIPÓTESIS CONTRASTE DE HIPÓTESIS Antonio Morillas A. Morillas: Contraste de hipótesis 1 CONTRASTE DE HIPÓTESIS 1. Introducción 2. Conceptos básicos 3. Región crítica óptima i. Teorema de Neyman-Pearson ii. Región

Más detalles

Programa Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Fundamentos de Estadística

Programa Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Fundamentos de Estadística Ficha Técnica Titulación: Grado en Ingeniería de Organización Industrial Plan BOE: BOE número 75 de 28 de marzo de 2012 Asignatura: Módulo: Fundamentos de Matemáticas Curso: 2º Créditos ECTS: 6 Tipo de

Más detalles