SISTEMAS INTELIGENTES

Tamaño: px
Comenzar la demostración a partir de la página:

Download "SISTEMAS INTELIGENTES"

Transcripción

1 SISTEMAS INTELIGENTES T7: Introducción al Aprendizaje Automático {jdiez, aic.uniovi.es

2 Índice Definición de Aprendizaje Automático Objetivos Aplicaciones: características, ejemplos Diseño de sistemas de aprendizaje inductivo Experiencia de entrenamiento Función objetivo: representación Aprendizaje: aproximación de la función objetivo Evaluación Técnicas de aprendizaje: tipos, conceptos básicos y ejemplos

3 Definiciones Inducción: generalizar a partir de observaciones para sintetizar conocimiento de más alto nivel Aprendizaje Inductivo: razonamiento hipotético de casos particulares a casos generales Aprendizaje: es la identificación de patrones, de regularidades, existentes en la evidencia es la predicción de observaciones futuras con plausibilidad es eliminación de redundancia = compresión de información

4 Una Definición de Aprendizaje Automático Un programa de ordenador APRENDE a partir de una experiencia E a realizar una tarea T (de acuerdo con una medida de rendimiento P), si su rendimiento al realizar T, medido con P, mejora gracias a la experiencia E [Mitchell, 97]

5 Objetivos Producir programas capaces de mejorar su rendimiento a través de la experiencia Mejorar al realizar una tarea T Respecto a una medida de rendimiento P Gracias a la utilización de la experiencia E Construir sistemas capaces de adquirir el conocimiento necesario para realizar tareas, usando la experiencia acumulada Proporcionar a los expertos de un dominio conocimiento explícito de cómo se resuelve un determinado problema

6 Disciplinas relacionadas : representación simbólica de conceptos, búsquedas, sistemas expertos, Estadística: caracterización de errores, muestras, intervalos de confianza, test estadísticos, Métodos bayesianos: el teorema de Bayes es clave para el cálculo de la probabilidad de las hipótesis, Teoría de Control: procedimientos para el control de procesos Teoría de la Información: medidas de entropía, codificación de hipótesis, MDL, Teoría Computacional: límites teóricos de la complejidad de las tareas de aprendizaje, Psicología: ley de la energía de la práctica, más experto, más tiempo, más difícil mejorar, Neurología: inspira las redes neuronales artificiales, Filosofía: la navaja de Ocamm, la hipótesis más simple es la mejor,

7 Algunas aplicaciones (clásicos) (I) Conducir un vehículo. ALVINN 100 Km/hora durante 150 Kms en autopista, RALPH, más de 4500 kms desde Pittsburgh hasta San Diego Reconocimiento del habla. SPHINX Reconocimiento de fonemas y de palabras Jugador de backgammon de nivel mundial TD-Gammon

8 Algunas aplicaciones (clásicos) (II) Clasificación de estructuras astronómicas

9 Aplicaciones típicas Problemas donde no hay expertos humanos Importancia económica de qtls en secuencias genéticas Tareas que los humanos hacemos pero no podemos describir cómo las hacemos Reconocimiento de caracteres Problemas donde la función objetivo cambia frecuentemente Predicciones bursátiles Situaciones donde cada usuario tiene su propia función objetivo Adaptación de interfaces, spam, gestión de correo electrónico Problemas donde el volumen de datos hace imposible a los humanos realizar cualquier análisis Técnicas de Data-Mining capaces de encontrar relaciones dentro de grandes BDs intratables a ojo

10 Más ejemplos de aplicaciones de AA Carciogénesis de compuestos químicos Perfil de clientes Concesión de créditos hipotecarios Sistemas automáticos de filtrado (correo, noticias) Entornos personalizados (buscadores, ventas, ) Construcción automática de portales web Análisis de textos Sistemas de reconocimiento de texto y voz Robots (conductores, carteros, jugadores de fútbol, ) Juegos (DEEP-BLUE)

11 Algunos problemas que no son de AA Aprender a ordenar una lista de números Podemos hacerlo más rápido sin necesidad de la experiencia, conocemos el concepto de orden y sabemos aplicarlo Aprender la velocidad a la que cae un objeto desde una cierta altura Conocemos el modelo físico que sigue ese proceso, podemos calcularlo precisa y eficientemente AA: resuelve problemas que no se pueden modelar, pero de los que tenemos (o podemos adquirir) experiencias sobre su resolución

12 Etapas para el diseño de sistemas de AA 1. Elegir la experiencia que usaremos para entrenar el sistema de aprendizaje 2. Definir el tipo de función objetivo que pretendemos aprender 3. Determinar la representación que utilizaremos para la función objetivo 4. Seleccionar el algoritmo de AA a utilizar y aplicarlo para aprender la función objetivo 5. Evaluar el sistema

13 Diagnóstico de una enfermedad T = diagnosticar la presencia de una enfermedad P = % diagnósticos correctos E = datos médicos de pacientes y el diagnóstico correcto realizado por un médico Habrá que considerar: Qué parámetros médicos usaremos para describir el estado de los pacientes? Seguramente dispondremos de mucha información y no toda será útil Qué tipo de conocimiento es más útil para aprender a diagnosticar la enfermedad? Queremos aprender a diferenciar pacientes de dos clases: los que padecen la enfermedad y los que no Es una herramienta consultiva o predictiva?

14 Producción lechera T = predecir la producción de leche de vacas P = diferencia entre la predicción y la producción real E = datos genéticos de vacas y su producción lechera Habrá que considerar: Qué información genética usaremos para describir los animales? La selección de la información genética que creemos influye en la producción lechera será decisiva Qué tipo de conocimiento es más útil para aprender a predecir la producción futura? Queremos aprender a asignar un valor numérico a cada animal que será la leche que producirá

15 Calidad cárnica de una canal T = valorar la calidad de acuerdo a una escala definida P = grado de acierto de las calidades propuestas E = canales y la calificación asignada por los expertos Habrá que considerar: Cómo representamos las características de la canal de un animal? Podemos usar imágenes, medidas, o variables físicoquímicas de la carne Qué tipo de conocimiento es el adecuado para valorar la calidad de acuerdo a una escala? Situación intermedia entre aprender clases y asignar valores numéricos: tenemos clases pero entre ellas existe una relación de orden

16 Organizador de correo electrónico T = ordenar el correo electrónico entrante de acuerdo a su importancia para el usuario P = concordancia entre el orden propuesto y el orden de lectura del usuario E = gestión diaria del correo por parte del usuario Habrá que considerar: Cómo representamos las características de un correo electrónico? Usar el título, el remitente, el contenido, Qué tipo de conocimiento es el adecuado para ordenar los correos de acuerdo a su importancia? El sistema se presta a valorar numéricamente cada correo, o a determinar si uno es más importante que otro. Enfoques distintos, diferentes sistemas de AA Cómo medir la utilidad y el rendimiento del sistema?

17 Tipos de clientes de una empresa T = descubrir distintos grupos de clientes P = eficacia de la campaña de publicidad posterior E = hábitos de consumo de los clientes Habrá que considerar: Cómo representamos las características de un cliente? Selección de las características que sean más útiles para diferenciarlos Qué tipo de conocimiento necesitamos generar? En este caso pretendemos agruparlos sin disponer previamente de otros clientes que han sido agrupados No hay clases predefinidas ni valores numéricos que asignar

18 Jugador de damas T = jugar a las damas P = % partidas ganadas frente a oponentes E = partidas jugadas? Habrá que considerar: Cómo representamos las situaciones de una partida?» No resulta fácil describir un tablero o al menos hay muchas formas posibles de hacerlo Qué tipo de conocimiento es más útil para aprender a jugar partidas de damas?» Queremos aprender a decidir cuál es el movimiento más apropiado dada una posición del tablero» No aprendemos ni clases ni asignaremos números» Hay otra forma de hacerlo?

19 Elegir la experiencia de entrenamiento (I) Clave en el proceso de aprendizaje: es a partir de lo que generalizamos. Si es mala, incompleta,, saldrá seguro mal! Hay problemas en los que nos vendrá dada Diagnóstico de enfermedades: la experiencia procederá de los datos médicos de pacientes junto al diagnóstico que los médicos hicieron Es representativa del problema? Hasta que punto estamos modelando bien el problema con la experiencia utilizada? Podemos usar maestros como modelos o no: A veces los tenemos: diagnóstico de enfermedades, calidad carne A veces procede de una variable medible: producción de leche A veces no lo necesitamos para la tarea: agrupar clientes A veces necesitaremos procesos para capturarla: gestor de correo

20 Elegir la experiencia de entrenamiento (II) Diagnóstico de enfermedades: < variables médicas > <SI NO> Producción lechera: < descripción genética de una vaca > <Producción anual en litros> Organizador de correo electrónico: < remitente, título, tamaño > < Valoración del usuario > < palabras [en/no en] el correo> < Orden de lectura > < este correo > lo leyó antes que < este correo > Dependiendo de la representación de la experiencia elegida, estaremos enfocando el problema hacia un tipo de aprendizaje

21 Elegir la experiencia de entrenamiento (III) Calidad cárnica de una canal: < foto de la canal > < categoría: S E U R O P > < medidas de la canal > < categoría: numérica > Tipos de clientes: < datos del cliente > No hay clase, ni número que aprender a predecir Jugador de damas < posición del tablero > < movimiento elegido > < descripción de una posición > < valoración de la posición > Hay representaciones que resultarían más difíciles de aprender que otras

22 Etapas para el diseño de sistemas de AA 1. Elegir la experiencia que usaremos para entrenar el sistema de aprendizaje 2. Definir el tipo de función objetivo que pretendemos aprender 3. Determinar la representación que utilizaremos para la función objetivo 4. Seleccionar el algoritmo de AA a utilizar y aplicarlo para aprender la función objetivo 5. Evaluar el sistema

23 Definir el tipo de la función objetivo (I) Qué queremos aprender exactamente? Definimos cómo es la función objetivo que queremos aprender Una misma tarea se puede aprender de distintas formas, hay que concretar! Existe una función objetivo (perfecta) f que desconocemos El aprendizaje aproximará esta función mediante una función del mismo tipo que denominaremos hipótesis, h Sencillez, aprender lo necesario

24 Definir el tipo de la función objetivo (II) Diagnóstico de enfermedades f : Paciente {SI, NO} Producción de leche f : Vaca R Calidad de la carne f : Canal { S,E,U,R,O,P} Jugador de damas f 1 : Tablero Movimiento (difícil de calcular) f 2 : Tablero R (más operativa) Si determinamos f 2, es fácil decidir el mejor movimiento dada una posición (es decir, tener f 1 )

25 Datos de entrenamiento (I) La experiencia a utilizar y el tipo de función objetivo se plasma en la definición de los datos que se emplearán para aprender El proceso de aprendizaje también se denomina entrenamiento Los datos usados durante el aprendizaje (entrenamiento) se denomina conjunto de entrenamiento Atributos Atr-1 Atr-n Clase(opcional) ejemplo 1 ejemplo m clase ej-1 clase ej-m

26 Datos de entrenamiento (II) Atributos: describen los ejemplos Numéricos: nº reales o enteros Simbólicos o Nominales: etiquetas sin relación de orden Clase: según su tipo estaremos ante distintos tipos de aprendizaje Aprendizaje supervisado: disponemos de una clase asociada a cada ejemplo Conjunto finito de clases simbólicas: clasificación (Ej: diagnóstico enfer) Conjunto finito de clases simbólicas con una relación de orden entre ellas o valores enteros: regresión ordinal (Ej: calidad carne) Numérica (real): regresión (Ej: producción de leche) Aprendizaje no-supervisado: sin clase No tenemos o nos interesa (Ej: tipos de clientes)

27 Datos de entrenamiento (III) Sepal length Sepal width Petal length Petal width Type Iris setosa Iris setosa Iris versicolor Iris versicolor Iris virginica Iris virginica Age Spectacle prescription Astigmatism Tear production rate Recommended lenses Young Myope No Reduced None Pre-presbyopic Myope No Normal Soft Pre-presbyopic Myope Yes Normal Hard Presbyopic Hypermetrope No Reduced None Cycle time Main memory Cache Channels Performance (ns) (Kb) (Kb) MIN MAX

28 Problemas con los datos de entrenamiento Mal de la dimensionalidad: muchos sistemas de AA sufren (se ralentizan) con la dimensión (nº de atributos) del cjto de entrenamiento Ruido: ejemplos con la clase mal etiquetada, o atributos con valores con ruido Sensores poco fiables, captura manual de datos, manipulación de datos, etc Atributos mal elegidos: Atributos irrelevantes para el problema: no influyen en el conocimiento que trata de inducirse Atributos redundantes (mal de la dimensionalidad) Missing values: puede ocurrir que para algunos ejemplos desconozcamos el valor de alguno de sus atributos Relación entre el nº de atributos y el nº de ejemplos disponibles Muchos atributos y pocos ejemplos: el conocimiento inducido puede ser poco fiable

29 Técnicas de Aprendizaje Aprendizaje no supervisado: el conjunto de observaciones no tienen clases asociadas Se emplea para la Descripción Objetivo: detectar regularidades en los datos Agrupaciones (clustering), contornos, asociaciones, valores anómalos Aprendizaje supervisado: cada observación incluye un valor de la clase a la que corresponde Se emplea para la Predicción Se aprende un clasificador Sirven para explicar las causas que llevan a tomar una decisión Aprendizaje por refuerzo: el sistema recibe recompensas en función de las decisiones que toma

30 Aprendizaje Inductivo No Supervisado Datos de Entrenamiento Sistema de Aprendizaje Procesos Inductivos Agrupamiento Análisis Dependencias Visualización Conocimiento

31 Aprendizaje No Supervisado Podemos agrupar los ejemplos en base a sus características? Atributo 2 Atributo 1

32 Aprendizaje Inductivo Supervisado Datos de Entrenamiento Sistema de Aprendizaje Proceso Inductivo Nuevos casos Modelo Predicción Conocimiento

33 Tipos de Aprendizaje Supervisado Dependiendo del número y tipo de clases: clase discreta: se conoce como clasificación Ejemplos:» determinar la variedad de una especie de flores» estimar el partido al que voto de una persona Si sólo hay dos clases (V y F) se conoce como aprendizaje de conceptos» determinar si una persona tiene cáncer clase continua o discreta ordenada: se denomina regresión (o estimación) y regresión ordinal Ejemplos:» estimar la pureza en la producción de zinc» clasificar productos agroalimentarios en escalas discretas

34 Hipótesis del Aprendizaje Inductivo Si una hipótesis aproxima bien la función objetivo sobre un conjunto de entrenamiento suficientemente grande, también aproximará bien la función objetivo sobre los ejemplos no observados

35 Aprendizaje Supervisado Podemos aprender a clasificar ejemplos de estas tres clases? Atributo 2 Atributo 1

36 Aprendizaje Inductivo Supervisado Clase Descripción de los objetos

37 Etapas para el diseño de sistemas de AA 1. Elegir la experiencia que usaremos para entrenar el sistema de aprendizaje 2. Definir el tipo de función objetivo que pretendemos aprender 3. Determinar la representación que utilizaremos para la función objetivo 4. Seleccionar el algoritmo de AA a utilizar y aplicarlo para aprender la función objetivo 5. Evaluar el sistema

38 Representación de la función objetivo (I) Existen diferentes tipos de funciones dependiendo de la clase de problema que estemos tratando: clasificación, regresión, agrupación, Diferentes modelos: Simbólicos (reglas, árboles de decisión, PLI, ) Subsimbólicos (redes neuronales, svm, ) La elección depende del uso que vaya a tener Predicción: puede ser simbólico o subsimbólico Explicación: debe ser simbólico

39 Representación de la función objetivo (II) Diagnóstico de enfermedades Necesitamos conocimiento simbólico, si queremos ofrecer explicaciones. Podemos usar reglas o árboles de decisión Producción de leche Es un problema de regresión, podemos optar por representarla mediante una red neuronal Calidad de la carne Podemos usar métodos bayesianos para determinar la probabilidad de que pertenezca a cada una de las clases en función del valor de los atributos Organizador de correo Podemos usar una solución basada en máquina de vectores soporte que nos permita ordenar los correos de acuerdo a su importancia

40 Representación de la función objetivo (III) Jugador de damas Podemos elegir una combinación lineal de los atributos empleados para describir la posición del tablero» x 1 : nº de piezas negras que quedan» x 2 : nº de piezas blancas que quedan» x 3 : nº de damas negras que quedan» x 4 : nº de damas blancas que quedan» x 5 : nº de piezas negras que están atacadas» x 6 : nº de piezas blancas que están atacadas Demasiado simple? Podría no ser lineal, por ejemplo, un polinomio de un cierto grado

41 Representación de la función objetivo (IV) Al fijar la representación, estamos definiendo un espacio de búsqueda para la función h (hipótesis) con la que pretendemos aproximar la función objetivo f A este espacio se le denomina espacio de hipótesis El espacio de hipótesis puede no contener a la función objetivo Si es así, nuestra hipótesis está condenada a equivocarse sobre algunos ejemplos (lo cual no siempre es grave) Cuanto más complejo sea el espacio de hipótesis: Más difícil será aprender la función h Más ejemplos de entrenamiento serán necesarios Pero más capacidad tendrá para aproximar la función objetivo f En muchas ocasiones, cuando no se tiene muy claro que tipo de representación es más adecuada, se prueban varias y se evalúa la calidad de las soluciones alcanzadas (evaluación)

42 Técnicas de Aprendizaje Supervisado Separadores lineales Redes Neuronales Multicapa RBF Reglas/árboles de decisión Naive Bayes Classifier Basadas en ejemplos

43 Etapas para el diseño de sistemas de AA 1. Elegir la experiencia que usaremos para entrenar el sistema de aprendizaje 2. Definir el tipo de función objetivo que pretendemos aprender 3. Determinar la representación que utilizaremos para la función objetivo 4. Seleccionar el algoritmo de AA a utilizar y aplicarlo para aprender la función objetivo 5. Evaluar el sistema

44 Seleccionar y aplicar el algoritmo de AA (I) Para cada tipo de función objetivo, o espacio de hipótesis o tipo de conocimiento tendremos distintos algoritmos que pueden aplicarse Ej: si queremos obtener un separador lineal, podríamos usar: una red neuronal, una máquina de vectores soporte, el algoritmo OC1, y otros muchos Es posible utilizar varios algoritmos distintos o diferentes implementaciones y comparar posteriormente su rendimiento Ej: hay muchas implementaciones diferentes de máquinas de vectores soporte con distintos sistemas de optimización A veces se selecciona el algoritmo o la implementación en función de la plataforma o de otras herramientas con las que deba utilizarse

45 Seleccionar y aplicar el algoritmo de AA (II) Parámetros: todos los sistemas tienen algún tipo de parámetro Básicamente sirven para evitar dos factores: El ruido de los datos de entrenamiento El grado de ajuste a los datos Es habitual ejecutar el algoritmo de AA con distintos parámetros para evaluar y comparar su rendimiento A veces se utilizan algoritmos genéticos para ajustar los parámetros de un AA

46 Técnicas de Aprend. No Supervisado Técnicas de clustering: Clustering jerárquicos k-means Mapas auto-organizados (SOM) [Kohonen, 95] EM [Dempster et al. 77] Cobweb [Fisher, 87] Análisis exploratorios: Estudios de correlaciones Detección datos anómalos Asociaciones y dependencias Análisis de dispersión

47 Técnicas de Aprendizaje Supervisado Árboles de Decisión: Clasificación: ID3, C4.5, CART Regresión: CUBIST Sistemas basados en reglas: C4-5rules, CN2, ABANICO, INNER, Aprendizaje basado en instancias k-nn (Nearest Neighbor) IB Múltiples sistemas de reducción de instancias: DROP, CNN, BETS, Híbridos: RISE Redes de Neuronas Artificiales (ANN): Perceptron Redes Multicapa (backpropagation) Clasificadores Estadísticos Naive Bayes Basados en kernels: SVM (Máquina de vectores soporte)

48 Etapas para el diseño de sistemas de AA 1. Elegir la experiencia que usaremos para entrenar el sistema de aprendizaje 2. Definir el tipo de función objetivo que pretendemos aprender 3. Determinar la representación que utilizaremos para la función objetivo 4. Seleccionar el algoritmo de AA a utilizar y aplicarlo para aprender la función objetivo 5. Evaluar el sistema

49 Evaluación El sistema funciona bien en la práctica? Generaliza bien en situaciones no vistas durante el entrenamiento? Tratamos de analizar si las regularidades observadas en la muestra (finita) usada en el entrenamiento se mantiene en la distribución que representa Aprendizaje supervisado: Normalmente se separan algunos ejemplos, no se utilizan para entrenar, y con ellos se evalúa la calidad de la hipótesis inducida Hay distintas técnicas de evaluación: Entrenamiento-test: dos conjuntos separados Hold-out: 66% ejemplos para entrenar, 33% para test Cross-Validation: se generan distintos cjtos de entrenamientotest Leave-one-out: se entrenan con todos los ejemplos menos uno y luego se evalúa sobre ese ejemplo

50 Precisión de hipótesis: planteamiento (I) Dado un espacio de ejemplos posible X, asumimos que cada ejemplo puede ser encontrado con una determinada frecuencia Luego, tenemos una distribución de probabilidad D que define la probabilidad de encontrar cada elemento de X (D no dice nada sobre la clase de cada ejemplo) El aprendizaje consiste en encontrar una función objetivo f considerando un espacio de hipótesis H El sistema de aprendizaje empleado sintetizarán una hipótesis h de entre las del espacio de hipótesis H Disponemos de una muestra de ejemplos S generado con elementos de X siguiendo la distribución D, a los que un maestro añade la clase correspondiente <x X, f(x)>

51 Precisión de hipótesis: planteamiento (II) Dada la hipótesis h obtenida a partir un sistema de aprendizaje, nos gustaría conocer varias cosas: Cuál es el mejor estimador que podemos utilizar para medir la precisión de h sobre ejemplos futuros, generados con la misma distribución D? Cuál es el error probable de ese estimador? Dado que el conjunto de datos disponible siempre será limitado, cuál es el mejor método para aprender la hipótesis y evaluar su precisión? Si empleamos dos sistemas de aprendizaje diferentes, que generan hipótesis distintas, cuál de ellas se comportará mejor? Surge una necesidad evidente de disponer de estimadores que midan la calidad de las hipótesis sintetizadas por los sistemas de aprendizaje

52 Error de una hipótesis: verdadero Es la probabilidad de que una hipótesis h clasifique mal un ejemplo cualquiera generado a partir de la distribución D del espacio de instancias X error D ( h) = Pr[ f ( x) h( x)] x D Espacio de Instancias X - f Error h No podemos calcularlo

53 Error de una hipótesis: una muestra No podemos calcular el error verdadero, pero podemos medir el error en una muestra S: 1 error S ( h) = ( f ( x) h( x)) S Cómo de bueno es el error en una muestra como estimador del error verdadero? x S Dependemos de algún factor para hacer estimaciones del error verdadero a partir del error en una muestra? Podemos acotar el error verdadero de una hipótesis h, conocido su error en una muestra? La estadística nos ayuda a responder a estas preguntas

54 Evaluación de hipótesis: error (I) Una opción es estimar el error verdadero La evaluación se puede realizar: Durante el aprendizaje, para seleccionar una hipótesis adecuada Al final del aprendizaje, para indicar el nivel de confianza de la hipótesis elegida Usar el error sobre los ejemplos del conjunto de entrenamiento (error de reescritura) para seleccionar la hipótesis es peligroso El sistema de aprendizaje tenderá a ajustarse en exceso a los datos de entrenamiento

55 Sobre-ajuste (overfitting) Clase Una hipótesis h 1 H se sobre-ajusta a una muestra S de datos si existe una hipótesis alternativa h 2 H tal que: error ( h1 ) errors ( h2 ) S < y error ( h1 ) errord ( h2 ) D >

56 Sub-ajuste (underfitting) Clase Una hipótesis h 1 H se sub-ajusta a una muestra de datos si existe una hipótesis alternativa h 2 H tal que: error ( h1 ) errors ( h2 ) S > y error ( h1 ) errord ( h2 ) D >

57 Evaluación de hipótesis: error (II) Si disponemos de muchísimos ejemplos, no hay problema en usar sólo una parte de los ejemplos para entrenar y el resto como conjunto de test para estimar el error Hold-out (2/3 para entrenar, 1/3 para test) Lamentablemente, lo normal es disponer de un conjunto de datos con pocos ejemplos No podemos lastrar el proceso de aprendizaje usando pocos ejemplos Qué alternativas tenemos? Una opción intermedia es separar parte de los ejemplos (conjunto de validación) y utilizarlos para optimizar parámetros o tomar decisiones a la hora de seleccionar la hipótesis más adecuada Usar métodos de resampling para generar distintos conjuntos de entrenamiento/test

58 Evitar el sobreajuste Empíricos Validación Cruzada K-fold CV Leave-One-Out CV Usar datos no etiquetados Teóricos Técnicas bayesianas PAC Minimum description length (MDL) Minimización del Riesgo Estructural (SRM)

59 Entrenamiento, validación, test La manera más adecuada de aprender, seleccionar hipótesis y obtener una estimación adecuada del error verdadero es: Separar los ejemplos disponibles en 3 conjuntos: Conjunto de entrenamiento: para aprender hipótesis Conjunto de validación: seleccionar hipótesis, ajustar parámetros, Conjunto de test: obtener un estimador no sesgado y con poca varianza del error verdadero Los conjuntos de validación y test deben cumplir las condiciones que indicamos antes para poder aproximar sus estimaciones mediante una distribución normal Tendremos estimadores no sesgados y con poca varianza

60 K-fold CV Es una manera de obtener conjuntos de entrenamiento (validación) y test cuando tenemos pocos ejemplos Evita perder muchos ejemplos para entrenar y además podemos obtener un buen estimador del error K-fold CV es Divide los n ejemplos en k cjtos disjuntos (folds) Para i=1 hasta k Entrenar usando todos los folds menos i Emplear el fold i para estimar el error Devolver la media de los errores de los k folds Fin Es habitual usar k=10 y repetir el proceso para obtener un estimador aún mejor

61 Leave-One-Out CV Cuando k=n, es decir, tantos folds como ejemplos Permite entrenar con muchos ejemplos Tiene un coste computacional muy alto Hay situaciones en que es inadecuado Ejemplo: clasificador clase mayoritaria Si tenemos un conjunto de datos con dos clases y balanceado El error estimado será del 100%!!!!

62 Comparación de sistemas de aprendizaje Supongamos que hacemos CV con dos sistemas de aprendizaje Es significativa la diferencia entre sus medias? Dado que son pocos datos, usamos test-t pareado de Student Nos permite asegurar con un cierto nivel de confianza si uno de los sistemas es mejor que el otro

63 Terminología Función objetivo: Es la función verdadera f que pretendemos aprender Ejemplo (de entrenamiento): <x, f(x)> donde x es un vector de atributos y f(x) es la clase o etiqueta a la que pertenece x, en base a la función objetivo f Atributo: cada una de las componentes que permite representar los objetos x Espacio de ejemplos: espacio X de todos los posibles ejemplos Conjunto de Entrenamiento: conjunto de ejemplos de entrenamiento, representan una determinada muestra del espacio de ejemplos Hipótesis: función propuesta h para aproximar la función objetivo f Espacio de hipótesis: H conjunto de todas las hipótesis h que puede seleccionar un algoritmo de aprendizaje al tratar de aprender una función objetivo f

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013 VivaMéxico sin PRI Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres Facultad de Ciencias de la Computación Benemérita Universidad Autónoma de Puebla Otoño 2013 IMAGENESpemexmorena Adquisición

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.

Más detalles

Reconocimiento de Patrones DRA. LETICIA FLORES PULIDO

Reconocimiento de Patrones DRA. LETICIA FLORES PULIDO Reconocimiento de Patrones DRA. LETICIA FLORES PULIDO 2 CONTENIDO TEMA1: INTRODUCCIÓN TEMA2: APRENDIZAJE MÁQUINA TEMA3: REDES NEURONALES MULTICAPA TEMA4: PROGRAMACIÓN EVOLUTIVA 3 TEMA 2 : APRENDIZAJE MÁQUINA

Más detalles

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja

Más detalles

Métodos de Inteligencia Artificial

Métodos de Inteligencia Artificial Métodos de Inteligencia Artificial L. Enrique Sucar (INAOE) esucar@inaoep.mx ccc.inaoep.mx/esucar Tecnologías de Información UPAEP Agentes que Aprenden: Clasificador Bayesiano Clasificación Clasificador

Más detalles

Tema 4: Introducción al Aprendizaje Automático

Tema 4: Introducción al Aprendizaje Automático Introducción a la Ingeniería del Conocimiento Curso 2004 2005 Tema 4: Introducción al Aprendizaje Automático Miguel A. Gutiérrez Naranjo Dpto. de Ciencias de la Computación e Inteligencia Artificial Universidad

Más detalles

CRITERIOS DE SELECCIÓN DE MODELOS

CRITERIOS DE SELECCIÓN DE MODELOS Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,

Más detalles

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur EVALUACIÓN Evaluación: entrenamiento y test Una vez obtenido el conocimiento es necesario validarlo para

Más detalles

Tipos de Aprendizaje

Tipos de Aprendizaje Karina Figueroa Contenido Objetivo: Comprender las nociones básicas de los enfoques representativos de aprendizaje automático Nota del día Aprendizaje y el modelo científico Clasificación de los algoritmos

Más detalles

Aprendizaje inductivo

Aprendizaje inductivo Inteligencia Artificial Aprendizaje inductivo Ing. Sup. en Informática, 4º Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani Aprendizaje Resumen: 3. Aprendizaje automático 3.1 Introducción

Más detalles

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos

Más detalles

Aplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural.

Aplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural. Capítulo 5 Evaluación En muchas ocasiones requerimos hacer una evaluación muy precisa de nuestros algoritmos de aprendizaje computacional porque los vamos a utilizar en algún tipo de aplicación que así

Más detalles

Práctica 3: Almacenamiento de modelos con WEKA.

Práctica 3: Almacenamiento de modelos con WEKA. PROGRAMA DE DOCTORADO INTERUNIVERSITARIO APRENDIZAJE AUTOMÁTICO Y DATA MINING Práctica 3: Almacenamiento de modelos con WEKA. Objetivos: Almacenar modelos creados con WEKA. Utilizar un modelo previo para

Más detalles

Técnicas de Minería de Datos

Técnicas de Minería de Datos Técnicas de Minería de Datos Act. Humberto Ramos S. 1 Qué es Minería de datos? El desarrollo de dispositivos tecnológicos para acumular datos a bajo costo. Acumulación o registro de gran cantidad de datos.

Más detalles

Tema 12: Introducción a la Estadística.

Tema 12: Introducción a la Estadística. MOLEDO GUGLIOTTA VICTOR Tratamiento de los datos Tema 12: Introducción a la Estadística. Al intentar interpretar la realidad a través de las herramientas que nos aporta la Estadística, lo primero que se

Más detalles

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos

Más detalles

Introducción IMADIL /17/2014. Tema 3. Características estadísticas fundamentales (Tercera parte)

Introducción IMADIL /17/2014. Tema 3. Características estadísticas fundamentales (Tercera parte) IMADIL 0 /7/0 Tema. Características estadísticas fundamentales (Tercera parte) Ignacio Martín y José Luis Padilla IMADIL 0. Introducción. Representación Gráfica. Correlación. Índice Introducción Uno de

Más detalles

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar

Más detalles

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Validación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción La mayoría de los clasificadores que se han visto requieren de uno o más parámetros definidos libremente,

Más detalles

Aprendizaje Automático

Aprendizaje Automático id3 id3 como búsqueda Cuestiones Adicionales Regresión Lineal. Árboles y Reglas de Regresión Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje

Más detalles

RESUMEN PROGRAMACIÓN ESTADÍSTICA I. 3. Diseñar tablas estadísticas para coleccionar y ordenar datos.

RESUMEN PROGRAMACIÓN ESTADÍSTICA I. 3. Diseñar tablas estadísticas para coleccionar y ordenar datos. RESUMEN PROGRAMACIÓN ESTADÍSTICA I OBJETIVOS 1. Conocer los principales conceptos usados en Estadística: población, muestra e individuo. 2. Diferenciar los tres tipos de variables estadísticas: cualitativas,

Más detalles

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2015-2016 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Escuela Politécnica Superior

Más detalles

APRENDIZAJE PROBABILÍSTICO NAIVE BAYES

APRENDIZAJE PROBABILÍSTICO NAIVE BAYES 1 APRENDIZAJE PROBABILÍSTICO NAIVE BAYES Bases de Datos Masivas 9 de Noviembre de 2016 2 Razonamiento Probabilístico Es una herramienta de aprendizaje estadístico. Se trata de razonar en un contexto incierto;

Más detalles

INVESTIGACIÓN OPERATIVA Redes Neuronales Artificiales y Aplicaciones INTEGRANTES: Armijos Mauricio Jara Iza Rony

INVESTIGACIÓN OPERATIVA Redes Neuronales Artificiales y Aplicaciones INTEGRANTES: Armijos Mauricio Jara Iza Rony INVESTIGACIÓN OPERATIVA Redes Neuronales Artificiales y Aplicaciones INTEGRANTES: Armijos Mauricio Jara Iza Rony Técnicas De La Inteligencia Artificial Programación Heurística Redes Neuronales. Evolución

Más detalles

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill. GLOSARIO ESTADÍSTICO Fuente: Murray R. Spiegel, Estadística, McGraw Hill. CONCEPTOS Y DEFINICIONES ESPECIALES Es el estudio científico de los métodos para recoger, organizar, resumir y analizar los datos

Más detalles

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

IAAE - Inteligencia Artificial Aplicada a la Ingeniería Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2016 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA

Más detalles

Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1)

Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1) Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1) Mathias Bourel IMERL - Facultad de Ingeniería, Universidad de la República, Uruguay 24 de octubre de 2016 M.Bourel

Más detalles

Práctica 5: Clasificación con número variable de ejemplos.

Práctica 5: Clasificación con número variable de ejemplos. 5º INGENIERÍA DE TELECOMUNICACIÓN INTELIGENCIA ARTIFICIAL Y RECONOCIMIENTO DE PATRONES Práctica 5: Clasificación con número variable de ejemplos. Objetivos: Utilización de conjuntos de entrenamiento y

Más detalles

Aprendizaje basado en ejemplos.

Aprendizaje basado en ejemplos. Aprendizaje basado en ejemplos. In whitch we describe agents that can improve their behavior through diligent study of their own experiences. Porqué queremos que un agente aprenda? Si es posible un mejor

Más detalles

Modelos de Scoring para Riesgo de Crédito

Modelos de Scoring para Riesgo de Crédito Modelos de Scoring para Riesgo de Crédito Los modelos de scoring de riesgo, dentro del proceso de otorgamiento de crédito, están orientados a anticipar comportamiento futuro. Podemos dividirlos en tres

Más detalles

ANÁLISIS DE DATOS. Jesús García Herrero

ANÁLISIS DE DATOS. Jesús García Herrero ANÁLISIS DE DATOS Jesús García Herrero ANALISIS DE DATOS EJERCICIOS Una empresa de seguros de automóviles quiere utilizar los datos sobre sus clientes para obtener reglas útiles que permita clasificar

Más detalles

LA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN

LA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN LA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN Miguel Ángel Negrín; Christian González; Jaime Pinilla; Francisco-José Vázquez-Polo

Más detalles

Aprendizaje Automático. Objetivos. Funciona? Notas

Aprendizaje Automático. Objetivos. Funciona? Notas Introducción Las técnicas que hemos visto hasta ahora nos permiten crear sistemas que resuelven tareas que necesitan inteligencia La limitación de estos sistemas reside en que sólo resuelven los problemas

Más detalles

Itinerario: Inteligencia Computacional

Itinerario: Inteligencia Computacional Máster Universitario en Investigación e Innovación en Tecnologías de la Información y las Comunicaciones Itinerario: Inteligencia Computacional Escuela Politécnica Superior Universidad Autónoma de Madrid

Más detalles

ESTADISTICA. Tradicionalmente la aplicación del término estadística se ha utilizado en tres ámbitos:

ESTADISTICA. Tradicionalmente la aplicación del término estadística se ha utilizado en tres ámbitos: ESTADISTICA Tradicionalmente la aplicación del término estadística se ha utilizado en tres ámbitos: a) Estadística como enumeración de datos. b) Estadística como descripción, es decir, a través de un análisis

Más detalles

Introducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Introducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Introducción a la minería de datos CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Minería de datos Detección, interpretación y predicción de patrones cuantitativos y cualitativos

Más detalles

Aprendizaje: Boosting y Adaboost

Aprendizaje: Boosting y Adaboost Técnicas de Inteligencia Artificial Aprendizaje: Boosting y Adaboost Boosting 1 Indice Combinando clasificadores débiles Clasificadores débiles La necesidad de combinar clasificadores Bagging El algoritmo

Más detalles

Reconocimiento de Patrones

Reconocimiento de Patrones Reconocimiento de Patrones Técnicas de validación (Clasificación Supervisada) Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica, Óptica y Electrónica Clasificación Supervisada Para qué evaluar

Más detalles

Inteligencia en Redes de Comunicaciones - 06 Aprendizaje

Inteligencia en Redes de Comunicaciones - 06 Aprendizaje El objetivo de este tema es realizar una introducción a los conceptos, fundamentos y técnicas básicas de aprendizaje computacional. En primer lugar se formalizará el concepto de aprendizaje y se describirán

Más detalles

Examen de Septiembre de TACCIII y TAI (Modelo 2)

Examen de Septiembre de TACCIII y TAI (Modelo 2) Examen de Septiembre de TACCIII y TAI (Modelo 2) 12 de septiembre de 2008 1. La desordenación de la base de datos puede influir en el resultado obtenido mediante a) clasificación por distancia a las medias

Más detalles

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

IAAE - Inteligencia Artificial Aplicada a la Ingeniería Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA

Más detalles

Técnicas de aprendizaje sobre series temporales

Técnicas de aprendizaje sobre series temporales Técnicas de aprendizaje sobre series temporales Contenido 1. Motivación. 2. Ejemplo del Problema. 3. Aproximaciones al problema de clasificación de series temporales. 4. Aprendizaje de reglas. 5. Boosting

Más detalles

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur TIPOS DE TAREAS, MODELOS Y ALGORITMOS ? Datos Entrenamiento Algoritmo Modelo Galaxia espiral TAREAS / MODELOS

Más detalles

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández El método incluye diferentes elementos Justificación Planteamiento del problema

Más detalles

Aprendizaje Automático

Aprendizaje Automático Aprendizaje Automático cbea LSI - FIB IA - Curso 2014/2015 cbea (LSI - FIB) Aprendizaje Automático IA - Curso 2014/2015 1 / 46 Índice 1 Introducción 2 Aprendizaje inductivo 3 Árboles de decisión 4 Aprendizaje

Más detalles

Tema 12. Selección de Variables

Tema 12. Selección de Variables Tema 12. Selección de Variables Pedro Larrañaga, Iñaki Inza, Abdelmalik Moujahid Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea

Más detalles

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

IAAE - Inteligencia Artificial Aplicada a la Ingeniería Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA

Más detalles

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

IAAE - Inteligencia Artificial Aplicada a la Ingeniería Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA

Más detalles

N T E N.. IDO. CAPíTULO 3 TABLAS Y GRÁFICAS: UNA IMAGEN DICE MÁS QUE MIL PALABRAS 78. CAPíTULO I LA IMAGINACiÓN ESTADíSTICA

N T E N.. IDO. CAPíTULO 3 TABLAS Y GRÁFICAS: UNA IMAGEN DICE MÁS QUE MIL PALABRAS 78. CAPíTULO I LA IMAGINACiÓN ESTADíSTICA N T E N.. IDO PREFACIO xiv CAPíTULO I LA IMAGINACiÓN ESTADíSTICA Introducción La imaginación estadística 3 Enlace de la imaginación estadística con la imaginación sociológica 4 Normas estadísticas y normas

Más detalles

TALLER DE MATEMÁTICAS 1º E.S.O.

TALLER DE MATEMÁTICAS 1º E.S.O. CONTENIDOS MÍNIMOS TALLER DE MATEMÁTICAS 1º E.S.O. A continuación se da una estimación de dichos contenidos mínimos: 1. Calcular expresiones numéricas con números enteros, con y sin paréntesis, respetando

Más detalles

Programación Evolutiva

Programación Evolutiva Introducción a la Computación Evolutiva Quinta Clase: Programación Evolutiva Programación Evolutiva Desarrollada en USA durante los años 60 Autores principales: D. Fogel Aplicada típicamente a: PE tradicional:

Más detalles

Aprendizaje Automático

Aprendizaje Automático Regresión Lineal: Descenso de Gradiente Árboles de Regresión: M5 Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje (PLG) Departamento de Informática

Más detalles

Sobreajuste - Overfitting

Sobreajuste - Overfitting Sobreajuste - Overfitting Miguel Cárdenas-Montes Cuando se evalúa la calidad de un modelo o un ajuste, es importante medir el error en el conjunto de entrenamiento y en la predicción. La utilización exclusiva

Más detalles

TEMA 7. ESTADÍSTICA. INDIVÍDUO: Es cada uno de los elementos que forman la población o la muestra.

TEMA 7. ESTADÍSTICA. INDIVÍDUO: Es cada uno de los elementos que forman la población o la muestra. TEMA 7. ESTADÍSTICA ACCESO CICLO SUPERIOR En esta sociedad resulta imprescindible disponer de técnicas que permitan obtener, de forma sencilla y fiable, información de los diferentes conjuntos de datos

Más detalles

Comparación de dos métodos de aprendizaje sobre el mismo problema

Comparación de dos métodos de aprendizaje sobre el mismo problema Comparación de dos métodos de aprendizaje sobre el mismo problema Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Contenido 1. Motivación 2.

Más detalles

Primera aproximación al aprendizaje automático.

Primera aproximación al aprendizaje automático. APRENDIZAJE Introducción al aprendizaje algorítmico José M. Sempere Departamento de Sistemas Informáticos y Computación Universidad Politécnica de Valencia Aprender: Tomar algo en la memoria [...] Adquirir

Más detalles

Julio Deride Silva. 18 de agosto de 2010

Julio Deride Silva. 18 de agosto de 2010 Estadística Descriptiva Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 18 de agosto de 2010 Tabla de Contenidos Estadística Descriptiva Julio Deride

Más detalles

Curso de Formación Continua Nº identificación Propuesta nueva/reedición

Curso de Formación Continua Nº identificación Propuesta nueva/reedición Curso de Formación Continua Nº identificación Propuesta nueva/reedición Aplicaciones Industriales con Minería de Datos y Sistemas Expertos FC1011195 Propuesta nueva Tipo de Créditos Créditos ECTS Campo

Más detalles

Inteligencia artificial

Inteligencia artificial Inteligencia artificial APRENDIZAJE DE MÁQUINAS (MACHINE LEARNING) Aprendizaje Construcción o modificación de representaciones de lo que se experimenta R. Michalski Lograr cambios útiles en nuestras mentes.

Más detalles

Fase 2. Estudio de mercado: ESTADÍSTICA

Fase 2. Estudio de mercado: ESTADÍSTICA 1. CONCEPTO DE ESTADÍSTICA. ESTADÍSTICA DESCRIPTIVA 2. 3. TABLA DE FRECUENCIAS 4. REPRESENTACIONES GRÁFICAS 5. TIPOS DE MEDIDAS: A. MEDIDAS DE POSICIÓN B. MEDIDAS DE DISPERSIÓN C. MEDIDAS DE FORMA 1 1.

Más detalles

Capitulo 1: Introducción al reconocimiento de patrones (Secciones )

Capitulo 1: Introducción al reconocimiento de patrones (Secciones ) Capitulo 1: Introducción al reconocimiento de patrones (Secciones 1.1-1.6) M A C H I N E P E R C E P T I O N U N E J E M P L O S I S T E M A S D E R E C O N O C I M I E N T O D E P A T R O N E S C I C

Más detalles

Aprendizaje Automático. Segundo Cuatrimestre de Clasificadores: Naive Bayes, Vecinos Más Cercanos, SVM

Aprendizaje Automático. Segundo Cuatrimestre de Clasificadores: Naive Bayes, Vecinos Más Cercanos, SVM Aprendizaje Automático Segundo Cuatrimestre de 2016 Clasificadores: Naive Bayes, Vecinos Más Cercanos, SVM Naive Bayes Naive Bayes Dada una nueva instancia con valores de atributos a 1, a 2,..., a n, su

Más detalles

Tópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones

Tópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 1 (2da. parte) Algoritmos para Reconocimiento de Patrones 20 de Octubre de 2010 1. Objetivos Introducir conceptos básicos de aprendizaje

Más detalles

Introducción a la minería de datos

Introducción a la minería de datos Introducción a la minería de datos 1 Temario Qué es minería de datos? Quién usa minería de datos? Por qué de la minería de datos? Ciclo virtuoso de la minería de datos 2 Definición de minería de datos

Más detalles

Inducción de Reglas Proposicionales

Inducción de Reglas Proposicionales Inducción de Reglas Proposicionales Reglas de clasificación Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Motivación 2. Reglas de Clasificación 1. Reglas

Más detalles

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

Estimación de Parámetros. Jhon Jairo Padilla A., PhD. Estimación de Parámetros Jhon Jairo Padilla A., PhD. Inferencia Estadística La inferencia estadística puede dividirse en dos áreas principales: Estimación de Parámetros Prueba de Hipótesis Estimación de

Más detalles

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

Estimación de Parámetros. Jhon Jairo Padilla A., PhD. Estimación de Parámetros Jhon Jairo Padilla A., PhD. Inferencia Estadística La inferencia estadística puede dividirse en dos áreas principales: Estimación de Parámetros Prueba de Hipótesis Estimación de

Más detalles

Predicción de potencia en el parque eólico de Villonaco, Loja, Ecuador. Alberto Reyes y Tania Guerrero INER Ecuador

Predicción de potencia en el parque eólico de Villonaco, Loja, Ecuador. Alberto Reyes y Tania Guerrero INER Ecuador Predicción de potencia en el parque eólico de Villonaco, Loja, Ecuador Alberto Reyes y Tania Guerrero INER Ecuador INTRODUCCIÓN El comportamiento del viento presenta alto grado de aleatoriedad, incertidumbre

Más detalles

CONCLUSIONES. La teoría de Redes Neuronales Artificiales, presenta grandes ventajas con

CONCLUSIONES. La teoría de Redes Neuronales Artificiales, presenta grandes ventajas con 319 CONCLUSIONES La teoría de Redes Neuronales Artificiales, presenta grandes ventajas con respecto a otros modelos típicos de solución de problemas de Ingeniería, una de ellas es su inspiración en modelos

Más detalles

Psicometría Tema 6 VALIDEZ DE LAS INFERENCIAS I

Psicometría Tema 6 VALIDEZ DE LAS INFERENCIAS I Psicometría Tema 6 VALIDEZ DE LAS INFERENCIAS I Psicometría Mª Isabel García Barbero, UNED. Universidad Nacional de Educación a Distancia, 2006 1 La fiabilidad de un instrumento de medida es una condición

Más detalles

RECONOCIMIENTO DE PATRONES DRA. LETICIA FLORES PULIDO

RECONOCIMIENTO DE PATRONES DRA. LETICIA FLORES PULIDO RECONOCIMIENTO DE PATRONES DRA. LETICIA FLORES PULIDO 2 CONTENIDO TEMA1: INTRODUCCIÓN TEMA2: APRENDIZAJE MÁQUINA TEMA3: RECONOCIMIENTO DE PATRONES TEMA4: PROGRAMACIÓN EVOLUTIVA 3 TEMA 3 : RECONOCIMIENTO

Más detalles

MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN

MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Teoría

Más detalles

TÉCNICO SUPERIOR UNIVERSITARIO EN PROCESOS INDUSTRIALES ÁREA SISTEMAS DE GESTIÓN DE LA CALIDAD EN COMPETENCIAS PROFESIONALES

TÉCNICO SUPERIOR UNIVERSITARIO EN PROCESOS INDUSTRIALES ÁREA SISTEMAS DE GESTIÓN DE LA CALIDAD EN COMPETENCIAS PROFESIONALES TÉCNICO SUPERIOR UNIVERSITARIO EN PROCESOS INDUSTRIALES ÁREA SISTEMAS DE GESTIÓN DE LA CALIDAD EN COMPETENCIAS PROFESIONALES ASIGNATURA DE PROBABILIDAD Y ESTADÍSTICA 1. Competencias Plantear y solucionar

Más detalles

ESTADÍSTICA I Tema 2: Algunas ideas básicas sobre inferencia estadística. Muestreo aleatorio

ESTADÍSTICA I Tema 2: Algunas ideas básicas sobre inferencia estadística. Muestreo aleatorio ESTADÍSTICA I Tema 2: Algunas ideas básicas sobre inferencia estadística. Muestreo aleatorio Muestra aleatoria Conceptos probabiĺısticos básicos El problema de inferencia Estadísticos. Media y varianza

Más detalles

Aprendizaje Supervisado Máquinas Vectoriales de Soporte

Aprendizaje Supervisado Máquinas Vectoriales de Soporte Aprendizaje Supervisado Máquinas Vectoriales de Soporte Tipos de Variables 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado

Más detalles

Aprendizaje Computacional y Extracción de Información

Aprendizaje Computacional y Extracción de Información Aprendizaje Computacional y Extracción de Información Introducción Jose Oncina oncina@dlsi.ua.es Dep. Lenguajes y Sistemas Informáticos Universidad de Alicante 17 de octubre de 2005 J. Oncina (Universidad

Más detalles

CRITERIOS DE EVALUACIÓN DEPARTAMENTO DE MATEMÁTICAS

CRITERIOS DE EVALUACIÓN DEPARTAMENTO DE MATEMÁTICAS 1º ESO CRITERIOS DE EVALUACIÓN DEPARTAMENTO DE MATEMÁTICAS 1. Utilizar numeros naturales, enteros, fracciones y decimales sencillos, sus operaciones y propiedades, para recoger, transformar e intercambiar

Más detalles

Métodos de Búsqueda para juegos humano-maquina. PROF: Lic. Ana María Huayna D.

Métodos de Búsqueda para juegos humano-maquina. PROF: Lic. Ana María Huayna D. Métodos de Búsqueda para juegos humano-maquina PROF: Lic. Ana María Huayna D. Tópicos 1. Introducción 2. Juegos 3. Estrategias de Juego 4. Algoritmo Minimax 5. Algoritmo Poda Alfa-Beta 1.- Introducción

Más detalles

Pattern Classification

Pattern Classification Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors

Más detalles

Métodos de Inteligencia Artificial

Métodos de Inteligencia Artificial Métodos de Inteligencia Artificial L. Enrique Sucar (INAOE) esucar@inaoep.mx ccc.inaoep.mx/esucar Tecnologías de Información UPAEP Agentes que Aprenden Introducción Tipos de aprendizaje Aprendizaje cómo

Más detalles

13. Utilizar la fórmula del término general y de la suma de n términos consecutivos

13. Utilizar la fórmula del término general y de la suma de n términos consecutivos Contenidos mínimos 3º ESO. 1. Contenidos. Bloque I: Aritmética y álgebra. 1. Utilizar las reglas de jerarquía de paréntesis y operaciones, para efectuar cálculos con números racionales, expresados en forma

Más detalles

Curso de Inteligencia Artificial

Curso de Inteligencia Artificial Curso de Inteligencia Artificial Modelos Ocultos de Markov Gibran Fuentes Pineda IIMAS, UNAM Redes Bayesianas Representación gráfica de relaciones probabilísticas Relaciones causales entre variables aleatorias

Más detalles

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación Facultad de Ciencias Sociales, UdelaR Índice 1. Repaso: estimadores y estimaciones. Propiedades de los estimadores. 2. Estimación puntual.

Más detalles

11. FUENTES DE INFORMACIÓN

11. FUENTES DE INFORMACIÓN multidimensionales Unidad 3: Tratamiento del color Identificar las características del histograma y su uso para el tratamiento del color Obtener el histograma de diferentes imágenes para indicar las características

Más detalles

2021: Odisea del Ciberespacio

2021: Odisea del Ciberespacio 2021: Odisea del Ciberespacio M.C. Romeo A. Sánchez López CISM CEH CISSP CCNA CCSI SCSA SCJP SCMAD ITIL MCP TOGAF Ingeniero en Seguridad Computacional Maestro en Educación Maestro en Ciencias en Sistemas

Más detalles

Notas de clase Estadística R. Urbán R.

Notas de clase Estadística R. Urbán R. Inferencia estadística Sabemos que una población puede ser caracterizada por los valores de algunos parámetros poblacionales, por ello es lógico que en muchos problemas estadísticos se centre la atención

Más detalles

Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary

Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary P. Duygulu, K. Barnard, J.F.G. de Freitas, and D.A. Forsyth Dr. Enrique Sucar 1 Victor Hugo Arroyo Dominguez 1

Más detalles

RECONOCIMIENTO DE PAUTAS

RECONOCIMIENTO DE PAUTAS RECONOCIMIENTO DE PAUTAS ANÁLISIS DISCRIMINANTE (Discriminant analysis) Reconocimiento de pautas supervisado si se cuenta con objetos cuya pertenencia a un grupo es conocida métodos: análisis de discriminantes

Más detalles

Vecinos próximos (IB1/IBk) Vecinos próximos

Vecinos próximos (IB1/IBk) Vecinos próximos Clasificación de patrones: Métodos supervisados Máxima verosimilitud (ZeroR) Jordi Porta Zamorano es el método más simple Escuela Politécnica Superior Universidad Autónoma de Madrid jordi.porta@uam.es

Más detalles

1.-DATOS DE LA ASIGNATURA

1.-DATOS DE LA ASIGNATURA 1.-DATOS DE LA ASIGNATURA Nombre de la asignatura: Minería de Datos Carrera: Ingeniería en Sistemas Computacionales Clave de la asignatura: ADM-0701 Horas teoría-horas práctica-créditos: 3-2-8 2.-HISTORIA

Más detalles

Aprendizaje Automatizado. Árboles de Clasificación

Aprendizaje Automatizado. Árboles de Clasificación Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles

Más detalles

Taller #3. Carlos Reveco Cinthya Vergara

Taller #3. Carlos Reveco Cinthya Vergara Taller #3 Carlos Reveco creveco@dcc.uchile.cl Cinthya Vergara cvergarasilv@ing.uchile.cl 1 Taller#3 - Uso de RapidMiner 5.0 Limpieza y selección de datos Data Cleansing: Eliminación de valores nulos o

Más detalles

Estadística. Generalmente se considera que las variables son obtenidas independientemente de la misma población. De esta forma: con

Estadística. Generalmente se considera que las variables son obtenidas independientemente de la misma población. De esta forma: con Hasta ahora hemos supuesto que conocemos o podemos calcular la función/densidad de probabilidad (distribución) de las variables aleatorias. En general, esto no es así. Más bien se tiene una muestra experimental

Más detalles

que pretende introducir un grado de vaguedad en las cosas que evalúa. En el mundo en que

que pretende introducir un grado de vaguedad en las cosas que evalúa. En el mundo en que CAPÍTULO 3 Lógica difusa Recientemente, la cantidad y variedad de aplicaciones de la lógica difusa han crecido considerablemente. La lógica difusa es una lógica alternativa a la lógica clásica que pretende

Más detalles

UNIVERSIDAD AGRO-ALIMENTARIA ALIMENTARIA DE MAO IEES-UAAM PROGRAMA ANALÍTICO EVALUACION DEL RENDIMIENTO FISICO. Mao, Valverde República Dominicana

UNIVERSIDAD AGRO-ALIMENTARIA ALIMENTARIA DE MAO IEES-UAAM PROGRAMA ANALÍTICO EVALUACION DEL RENDIMIENTO FISICO. Mao, Valverde República Dominicana UNIVERSIDAD AGRO-ALIMENTARIA ALIMENTARIA DE MAO IEES-UAAM PROGRAMA ANALÍTICO EVALUACION DEL RENDIMIENTO FISICO Mao, Valverde República Dominicana I. DATOS DE LA ASIGNATURA Nombre de la asignatura: Evaluación

Más detalles

INTELIGENCIA ARTIFICAL COMO HERRAMIENTA EN LA TOMA DE DECISIONES. Tecnología i3b

INTELIGENCIA ARTIFICAL COMO HERRAMIENTA EN LA TOMA DE DECISIONES. Tecnología i3b INTELIGENCIA ARTIFICAL COMO HERRAMIENTA EN LA TOMA DE DECISIONES Tecnología i3b G R U P O I B E R M Á T I C A Introducción Objetivos Puntos de información y de estudio Tipos de análisis Análisis proactivo

Más detalles

CURSO: ANALISIS ESTADISTICO DE RIESGOS

CURSO: ANALISIS ESTADISTICO DE RIESGOS MANAGEMENT CONSULTORES CURSO: ANALISIS ESTADISTICO DE RIESGOS Cnel. R.L. Falcón 1435 C1406GNC 35 Buenos Aires, Argentina Tel.: 054-11-15-5468-3369 Fax: 054-11-4433-4202 Mail: acaminos@mgmconsultores.com.ar

Más detalles

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas jfallas56@gmail.com 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por

Más detalles

Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS

Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS En esta clase concluimos el curso de Análisis de Datos con una visión de las metodologías del análisis de datos. Como se ha visto, este es un campo

Más detalles