Clasificadores Débiles - AdaBoost
|
|
|
- María Concepción Ortega Silva
- hace 8 años
- Vistas:
Transcripción
1 Capítulo 3 Clasificadores Débiles - AdaBoost El término boosting hace referencia a un tipo de algoritmos cuya finalidad es encontrar una hipótesis fuerte a partir de utilizar hipótesis simples y débiles. Durante este trabajo se hablará del algoritmo AdaBoost, el cual fue creado por Freund y Schapire y es un diseño mejorado del boosting original; y de sus diferentes variantes [Freund and Schapire E., 1996]. AdaBoost es una contracción de Adaptive Boosting, en donde el término Adaptive hace alusión a su principal diferencia con su predecesor. En términos de funcionalidad son iguales, ambos algoritmos buscan crear un clasificador fuerte cuya base sea la combinación lineal de clasificadores débiles simples h t (x). Sin embargo, AdaBoost propone entrenar una serie de clasificadores débiles de manera iterativa, de modo que cada nuevo clasificador o weak learner se enfoque en los datos que fueron erróneamente clasificados por su predecesor, de esta manera el algoritmo se adapta y logra obtener mejores resultados. En este punto cabe aclarar que el tipo de AdaBoost sobre el que se trabajó en esta investigación es el binario; esto significa que sólo se trabaja con dos tipos de datos los 21
2 cuales se representan con +1 y 1, por lo tanto el resultado se expresa como pertenece a x clase/no pertenece a x clase. La contraparte del tipo binario es el tipo multiclase, cuya característica es que puede diferenciar entre numerosos tipos de datos pero tiene una complejidad de análisis mayor. Una de las formas más sencillas de entender la finalidad de este tipo de algoritmos es mediante el ejemplo que se da en [Freund and Schapire E., 1999] y en [Corso, ]. El primer ejemplo considera a una persona experta en apuestas de carreras de caballos, dicho personaje puede tener varias estrategias para determinar al posible ganador en una carrera específica, por ejemplo basándose en mayor número de carreras ganadas, mejor tiempo en dar una vuelta, el caballo con mayor número de apuestas, etc. Sin embargo, para obtener una hipótesis que permita predecir con mayor seguridad el resultado de cualquier carrera, se necesita discernir cuáles carreras aportan mayor información. El segundo ejemplo consiste en considerar un filtro capaz de diferenciar entre un correo spam y uno que no lo es, para esto se crean hipótesis acerca de qué tipo de palabras clave contienen este tipo de archivos y así generar un clasificador que logré diferenciar de manera más precisa entre estos dos tipos de correos. Para lograr esto, primero se necesita de un weak learner, este es un algoritmo que nos ayuda a encontrar las hipótesis débiles. El método boosting llama t veces al weak learner, cada vez dándole una distribución diferente de los datos para el entrenamiento. A todos los datos se les asigna inicialmente el mismo peso de (1/m), este peso se va actualizando con cada iteración según los ejemplos mal clasificados, de esta manera se busca minimizar el error esperado y enfocarse en clasificar correctamente los datos 22
3 Figura 3.1: Diagrama de flujo del funcionamiento de AdaBoost que ahora tienen mayor peso. De este modo, al final se realiza la suma de todos los clasificadores previamente generados y se obtiene una hipótesis cuya predicción es más acertada. La Figura 3.1 muestra un diagrama de flujo que explica el funcionamiento de AdaBoost. Para que un clasificador sea efectivo y preciso en sus predicciones, se requiere que cumpla las siguientes tres condiciones [N. Vapnik, 2013]: Debe de haber sido entrenado con suficientes ejemplos-datos. Debe de tener un error de entrenamiento bajo. Debe de ser simple La Figura 3.2 muestra un ejemplo del procedimiento que un algoritmo AdaBoost 23
4 Figura 3.2: Ejemplo de procedimiento de AdaBoost simple sigue para formar el clasificador final, para este caso se utiliza como weak learner un árbol de decisión de un sólo nivel. Se tiene el siguiente conjunto de datos en donde un tipo de datos se representa por símbolos + azules y el otro por símbolos - en rojo. En su primer intento, el clasificador realiza un corte tratando de separar los datos pero podemos observar como realiza tres errores: deja dos datos negativos dentro del conjunto positivo y un dato positivo no lo toma en cuenta. En su siguiente intento, el peso de estos tres datos en donde hubo error es incrementado, de modo que el nuevo clasificador le de más importancia a resolver bien estos puntos. En su segundo intento logra discriminar correctamente a los datos negativos que tenían más peso pero ahora incluye aquellos que tenían un bajo peso. Debido a esto, se incrementa el peso de estos errores y, por el contrario, aquellos datos que ya fueron correctamente clasificados reciben un peso menor. Se realiza un tercer clasificador que de igual manera 24
5 Figura 3.3: Clasificador final tratará de hacer el mejor corte para resolver el problema. Finalmente se sumarán todos los clasificadores creados para crear la solución que, teóricamente, debería de ser mejor que cada clasificador por separado. A continuación se explicará el pseudocódigo de Adaboost, lo primero es definir sus entradas, que en este caso son el conjunto de datos a utilizar junto con sus etiquetas para determinar de que tipo son, determinar el número de iteraciones a realizar e inicializar el la distribución de pesos otorgados a cada uno de los datos. Dado:(x 1, y 1 ),..., (x m, y m ) donde x i X, y i 1, +1. Inicializar: D i = 1/m para i = 1,..., m. Para t = 1,..., T : Entrenar el clasificador débil (weak learner) utilizando la distribución D i. Obtener una hipótesis débil h t : X 1,
6 Meta: Obtener una h t con un error bajo. ɛ t = P r i Dt [h t (x i ) y i ]. (3.1) Calcular el peso del clasificador débil actual: α t = 1 ( ) 1 2 ln ɛt. (3.2) ɛ t Actualizar la distribución D t, para i = 1,..., m, según los errores que se hayan realizado en la etapa previa. D t+1 (i) = D t(i)exp ( α t y i h t (x i )) Z t (3.3) En donde Z t es un factor de normalización (elegido de modo que D t+1 sea una distribución). La hipótesis final se expresa de la siguiente manera: ( T ) H (x) = sign α t h t (x) t=1 (3.4) Es decir, se realiza una sumatoria de todas las hipótesis débiles calculadas para poder obtener la hipótesis fuerte. En [Emer, 2012] se explican las ventajas y desventajas que tienen los algoritmos AdaBoost, esta información se puede visualizar en la Tabla
7 Desventajas Clasificadores débiles complejos pueden llevar a overfitting Clasificadores débiles demasiado débiles pueden producir un bajo margen y overfitting Es vulnerable al rudio Ventajas Simple y sencillo de programar El único parámetro a establecer son las iteraciones El clasificador débil no requiere conocimiento previo Versátil Rápido 3.1. GML AdaBoost Tabla 3.1: Ventajas y Desventajas de AdaBoost Durante este trabajo el algoritmo que se utilizó para realizar la clasificación de las características se encuentra en la ToolBox GML AdaBoost [Vezhnevets, 2007], este archivo utiliza como weak learner a un árbol de decisión CART junto con uno de tres algoritmos disponibles: Real, Gentle y Modest AdaBoost. Este Toolbox utiliza el tipo de aprendizaje supervisado, este tipo de aprendizaje se utiliza cuando se tiene conocimiento pleno acerca del tipo al que pertenecen cada uno de los datos que se van a utilizar. Por lo tanto, se generaron mediante una estructura for dos vectores, estos elementos contienen etiquetas que nos permiten identificar mediante un +1 cierto tipo de llanto, por ejemplo asfixia o sordera, y con un 1 un tipo de llanto diferente. Las funciones más importantes dentro de este algoritmo son: stump, tree node, XAda- Boost, Classify. Los primeros dos se utilizan para generar el árbol e ir agregando los nodos conforme avanza el programa. XAdaBoost es el algoritmo que realiza el entrenamiento de los nodos del árbol a través de un algoritmo boosting. Para utilizarlo se debe de inicializar al árbol, cargar los datos de interés junto con sus respectivas etiquetas y determinar el 27
8 número de iteraciones que va a realizar, como resultado entrega un conjunto de nodos entrenados. Classify utiliza los nodos entrenados por la función AdaBoost para clasificar los datos de interés. Esta función entrega como resultado un vector con valores de +1 y -1, posteriormente se comparan estos valores con el vector de etiquetas para así poder determinar el número de aciertos que tuvo. Los parámetros que se requieren establecer para utilizar este algoritmo son el número de nodos que tendrá el árbol y el número de iteraciones que realizará el algoritmo. El valor para ambos parámetros fue determinado mediante métodos heurísticos, por lo que el número de nodos fue de 30 y se fijaron 100 iteraciones por prueba Modest AdaBoost El primer algoritmo de AdaBoost fue propuesto en 1996, a partir de entonces se han diseñado numerosas versiones modificadas que buscan tener mejores características que su versión original. Entre los métodos que se han creado se pueden mencionar los siguientes: Real AdaBoost, Gentle AdaBoost, Margin AdaBoost, Float AdaBoost, entre otros. Sin embargo, durante este trabajo se hará especial énfasis en el método de Modest AdaBoost [Vezhnevets and Vezhnevets, 2007]. A continuación se explicara el pseudocógido de Modeste AdaBoost, al igual que el AdaBoost original se utilizan como entrada los siguiente parámetros: Z= (z 1, z 2,..., z N con z i = (x i, y i ) como conjunto de entrenamiento. M, que representa el máximo numero de clasificadores. La salida, por otro lado, es la siguiente: H(x), la cual representa a clasificador adaptado al conjunto de entrenamiento. 28
9 Inicializar los pesos de los datos, al inicio todos son iguales ω i = 1,i 1,..., N N De m=1 hasta M y mientras H m. Entrenar H m (x) utilizando la distribución de ω i. Calcular la distribución invertida ϖ = (1 ω i ) y re-normalizar a i ϖ i = 1. Se recalculan los pesos del clasificador previo : P +1 m = P ω (y = +1, H m (x)). P +1 m P 1 m = P ϖ (y = +1, H m (x)). = P ω (y = 1, H m (x)). (3.5) P 1 m = P ϖ (y = 1, H m (x)). Poner H m (x) = (P +1 m (1 P +1 m ) P 1 m (1 P 1 m )) Actualizar ω i ω i exp( y i H m (x i )) y re-normalizar a i ω i = 1. La salida se expresa como: ( M ) H (x) = sign H m (x). (3.6) m=1 Las ecuaciones 3.5 son las que logran hacer diferente a AdaBoost, estos valores representan que tan bien está funcionando un clasificador. Dicho valor se decrementa si es que un clasificador está trabajando demasiado bien en datos que ya se han clasificado correctamente, de esta manera se da un poco de holgura al clasificador para seguir evaluando los datos y encontrar una mejor manera de clasificarlos. 29
10 Modest AdaBoost es un método que, a diferencia del algoritmo original; aumenta el peso de los elementos correctamente clasificados y disminuye aquellos en los que hubo errores. Las características que lo convierten en un buen método para este experimento son: su capacidad de evadir el overfitting y su menor porcentaje de error a cambio de tener un error mayor durante el entrenamiento. El overfitting, también llamado sobreajuste; es el efecto que se da al entrenar de más un algoritmo de aprendizaje, de este modo el algoritmo queda muy ajustado a características muy específicas y por lo tanto su respuesta a nuevos datos empeora. Para lograr esto, el algoritmo le da un valor a cada clasificador que representa la eficiencia al trabajar con los datos, en caso de que este funcionando demasiado bien su valor se decrementa para evitar que pase por alto información importante por confiarse. Los otros dos algoritmos considerados durante este trabajo son Real y Gentle Ada- Boost. Real AdaBoost es una versión mejorada del AdaBoost original, su nombre se debe a que obtiene como resultado un valor real, el cual representada la probabilidad de que cierto patrón de entrada pertenezca a una clase. Por otro lado, Gentle AdaBoost es un algoritmo cuyo resultado es un conjunto más estable y confiable, esto se logra al realizar una optimización con respecto a H m mediante métodos numéricos CART (Classification and Regression Trees Los árboles de decisiones son estructuras que permiten llegar a un resultado después de pasar por numerosas reglas que describen el comportamiento de su entrada a través de una serie de atributos. Para que sean más fáciles de entender para el ser humano pueden 30
11 Figura 3.4: Ejemplo de un árbol CART ser representados mediante reglas tipo si-entonces. En este caso se utilizó un árbol tipo CART, el cual es un acrónimo de Classification and Regression Trees. Este tipo de árboles realiza tres tareas importantes: como dividir los datos en cada nodo, sabe cuando debe detenerse y cómo predecir el valor de y para cada partición de los datos de entrada. La Figura 3.4 muestra el funcionamiento de un árbol CART, se ingresa un dato a la raíz. En la raíz del árbol se evalúa el dato y según el valor de un atributo se puede tomar el camino derecho o el camino izquierdo, sin importar el nodo al que llegue se vuelve a repetir el proceso. Al final, llega a alguna hoja del árbol en donde puede tener un valor de +1 o -1, dependiendo del cual es la categoría a la que pertenece el llanto. 31
Aprendizaje Automatizado
Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto
Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja
Aprendizaje: Boosting y Adaboost
Técnicas de Inteligencia Artificial Aprendizaje: Boosting y Adaboost Boosting 1 Indice Combinando clasificadores débiles Clasificadores débiles La necesidad de combinar clasificadores Bagging El algoritmo
CRITERIOS DE SELECCIÓN DE MODELOS
Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,
Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR
Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos
Tema 15: Combinación de clasificadores
Tema 15: Combinación de clasificadores p. 1/21 Tema 15: Combinación de clasificadores Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial
Aprendizaje Automatizado. Árboles de Clasificación
Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles
Tema 2 Primeros Modelos Computacionales
Universidad Carlos III de Madrid OpenCourseWare Redes de Neuronas Artificiales Inés M. Galván - José Mª Valls Tema 2 Primeros Modelos Computacionales 1 Primeros Modelos Computacionales Perceptron simple
ANÁLISIS DE DATOS. Jesús García Herrero
ANÁLISIS DE DATOS Jesús García Herrero ANALISIS DE DATOS EJERCICIOS Una empresa de seguros de automóviles quiere utilizar los datos sobre sus clientes para obtener reglas útiles que permita clasificar
Random Forests. Teoría y ejemplos. Romain Gouron. Conferencia 9, GLAM, Doble titulo Ecole Centrale de Nantes (Francia)
Teoría y ejemplos 1 1 Departamiento de Ingenería Matemática Doble titulo Ecole Centrale de Nantes (Francia) Conferencia 9, GLAM, 2016 Outline 1 Árboles de decisión Construcción 2 3 Rotation forest Gradient
3.7 IDENTIFICACION DE UN SISTEMA DINÁMICO NO LINEAL Descripción del Problema: La identificación de un sistema consiste en
301 3.7 IDENTIFICACION DE UN SISTEMA DINÁMICO NO LINEAL 3.7.1 Descripción del Problema: La identificación de un sistema consiste en determinar una función que relacione las variables de entrada con las
Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO
Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar
Inteligencia Artificial. Aprendizaje neuronal. Ing. Sup. en Informática, 4º. Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani
Inteligencia Artificial Aprendizaje neuronal Ing. Sup. en Informática, 4º Curso académico: 20/202 Profesores: Ramón Hermoso y Matteo Vasirani Aprendizaje Resumen: 3. Aprendizaje automático 3. Introducción
TEMA 6. SVM Support Vector Machines (Máquinas de Vectores Soporte)
TEMA 6. SVM Support Vector Machines (Máquinas de Vectores Soporte) Francisco José Ribadas Pena Modelos de Razonamiento y Aprendizaje 5 Informática [email protected] 17 de abril de 2012 FJRP ccia [Modelos
GUION TÉCNICO AUDIO. El Conjunto De Los Números Reales. realidad, es una ciencia resultado de más de 4 mil años de
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. El Conjunto De Los Números Reales. Hablar de matemáticas, no es solo referirse a números. En realidad, es
Tema 1.0 Amplificador diferencial basado en transistores BJT
Tema 1.0 Amplificador diferencial basado en transistores BJT Particularmente este arreglo, establece un antecedente importante en el estudio de amplificadores operacionales; ya que representa una etapa
Algoritmos para determinar Caminos Mínimos en Grafos
Problemas de camino mínimo Algoritmos para determinar Caminos Mínimos en Grafos Algoritmos y Estructuras de Datos III DC, FCEN, UBA, C 202 Problemas de camino mínimo Dado un grafo orientado G = (V, E)
EXAMEN EXTRAORDINARIO Informática y Computación IV
Nombre del alumno: EXAMEN EXTRAORDINARIO Informática y Computación IV Lee cada una de las preguntas y contesta con una V para verdedero o una F en caso de que sea falso lo que se propone. Una base de datos
Análisis Numérico para Ingeniería. Clase Nro. 3
Análisis Numérico para Ingeniería Clase Nro. 3 Ecuaciones Diferenciales Ordinarias Introducción Problemas de Valores Iniciales Método de la Serie de Taylor Método de Euler Simple Método de Euler Modificado
Técnicas de Minería de Datos
Técnicas de Minería de Datos Act. Humberto Ramos S. 1 Qué es Minería de datos? El desarrollo de dispositivos tecnológicos para acumular datos a bajo costo. Acumulación o registro de gran cantidad de datos.
GLOSARIO 1. Qué es bit y byte? Bit: Es la unidad mínima de información. Puede ser 0 o 1. Byte: Es el conjunto de 8 bits. Ejemplo:
Cuestionario Modulo 1.1 GLOSARIO 1. Qué es bit y byte? Bit: Es la unidad mínima de información. Puede ser 0 o 1. Byte: Es el conjunto de 8 bits. Ejemplo: 1001 0110. 2. qué es Dato? Definición: Es toda
Minería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria
Minería de Datos Árboles de Decisión Cristina Tîrnăucă Dept. Matesco, Universidad de Cantabria Fac. Ciencias Ing. Informática Otoño de 2012 Twenty questions Intuición sobre los árboles de decisión Juego
Formulación del problema de la ruta más corta en programación lineal
Formulación del problema de la ruta más corta en programación lineal En esta sección se describen dos formulaciones de programación lineal para el problema de la ruta más corta. Las formulaciones son generales,
Programación Evolutiva
Introducción a la Computación Evolutiva Quinta Clase: Programación Evolutiva Programación Evolutiva Desarrollada en USA durante los años 60 Autores principales: D. Fogel Aplicada típicamente a: PE tradicional:
Reconocimiento de Patrones
Reconocimiento de Patrones Técnicas de validación (Clasificación Supervisada) Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica, Óptica y Electrónica Clasificación Supervisada Para qué evaluar
INFORME TAREA N 4 CLUSTERING
Universidad de Chile Facultad de Ciencias Físicas y Matemáticas Departamento de Ingeniería Eléctrica EL4106 Inteligencia Computacional INFORME TAREA N 4 CLUSTERING Nombre Alumno : Profesor : Profesor Auxiliar
ARBOLES DE DECISION. Miguel Cárdenas-Montes. 1 Introducción. Objetivos: Entender como funcionan los algoritmos basados en árboles de decisión.
ARBOLES DE DECISION Miguel Cárdenas-Montes Los árboles de decisión son estructuras lógicas con amplia utilización en la toma de decisión, la predicción y la minería de datos. Objetivos: Entender como funcionan
4. NÚMEROS PSEUDOALEATORIOS.
4. NÚMEROS PSEUDOALEATORIOS. En los experimentos de simulación es necesario generar valores para las variables aleatorias representadas estas por medio de distribuciones de probabilidad. Para poder generar
INSTITUCIÓN UNIVERSITARIA ESUMER
INSTITUCIÓN UNIVERSITARIA ESUMER UNIDAD DE ESTUDIOS EMPRESARIALES Y DE MERCADEO ESPECIALIZACIÓN GERENCIA DE PROYECTOS MÓDULO NO 2 EVALUACIÓN FINANCIERA DEL PROYECTO GUÍAS DEL CURSO - CLASE NO 3 OBJETIVOS
Tipos de datos y Operadores Básicos
Módulo I: Conceptos Básicos Tema 1. Qué es un ordenador? Tema 2. Cómo se representan los datos en un ordenador? Tema 3. Qué es un lenguaje de programación? Tema 4. Cómo se hace un programa informático?
Aux 6. Introducción a la Minería de Datos
Aux 6. Introducción a la Minería de Datos Gastón L Huillier 1,2, Richard Weber 2 [email protected] 1 Departamento de Ciencias de la Computación Universidad de Chile 2 Departamento de Ingeniería Industrial
Inducción de Árboles de Decisión ID3, C4.5
Inducción de Árboles de Decisión ID3, C4.5 Contenido 1. Representación mediante árboles de decisión. 2. Algoritmo básico: divide y vencerás. 3. Heurística para la selección de atributos. 4. Espacio de
OPTIMIZACIÓN VECTORIAL
OPTIMIZACIÓN VECTORIAL Métodos de Búsqueda Directa Utilizan sólo valores de la función Métodos del Gradiente Métodos de Segundo Orden Requieren valores aproimados de la primera derivada de f) Además de
TEMA 1: Algoritmos y programas
TEMA 1: Algoritmos y programas 1.1.-Introducción La razón principal para utilizar un ordenador es para resolver problemas (en el sentido más general de la palabra), o en otras palabras, procesar información
Metaheurísticas y heurísticas. Algoritmos y Estructuras de Datos III
Metaheurísticas y heurísticas Algoritmos y Estructuras de Datos III Metaheurísticas Heurísticas clásicas. Metaheurísticas o heurísticas modernas. Cuándo usarlas? Problemas para los cuales no se conocen
Técnicas de aprendizaje sobre series temporales
Técnicas de aprendizaje sobre series temporales Contenido 1. Motivación. 2. Ejemplo del Problema. 3. Aproximaciones al problema de clasificación de series temporales. 4. Aprendizaje de reglas. 5. Boosting
Escribir programas a partir de un diagrama de flujo
Escribir programas a partir de un diagrama de flujo por Iván Cruz En esta lectura se revisará una estrategia específica para lograr implementar un programa computacional a partir de un diagrama de flujo,
INGENIERÍA DE SISTEMAS INVESTIGACIÓN OPERATIVA
INGENIERÍA DE SISTEMAS INVESTIGACIÓN OPERATIVA Sesión 4 Objetivos: Aplicar el método simplex a la solución de problemas reales. Contenido: Introducción al método Simplex Requerimiento del método Simplex
Búsqueda en línea y Búsqueda multiagente
Búsqueda en línea y Búsqueda multiagente Ingeniería Informática, 4º Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani 1 Tema 2: Agentes basados en Búsqueda Resumen: 2. Agentes basados
Un sistema de ecuaciones diferenciales son aquellas que tienen varias posibilidades para su solución. Estas son:
Unidad X: Programación lineal (continuación) Objetivo específico: Entender ampliamente el fenómeno del comportamiento de los modelos matemáticos para la resolución de problemas enfocados a las ecuaciones
RECONOCIMIENTO DE PAUTAS
RECONOCIMIENTO DE PAUTAS ANÁLISIS DISCRIMINANTE (Discriminant analysis) Reconocimiento de pautas supervisado si se cuenta con objetos cuya pertenencia a un grupo es conocida métodos: análisis de discriminantes
Redes de Neuronas de Base Radial
Redes de Neuronas de Base Radial 1 Introducción Redes multicapa con conexiones hacia delante Única capa oculta Las neuronas ocultas poseen carácter local Cada neurona oculta se activa en una región distinta
CONTENIDO MODELOS PARA LA LOCALIZACION DE PLANTA
MODELOS PARA LA LOCALIZACION DE PLANTA PROFESOR: DR. JORGE ACUÑA A. 1 CONTENIDO Modelos de localización Modelos de optimización Modelo del centro de gravedad Modelo de distancias (Ardalan) Trayectorias
PROGRAMACION DE REDES. MODELOS DE TRANSPORTE
PROGRAMACION DE REDES. MODELOS DE TRANSPORTE El modelo de transporte o modelo de distribución es un ejemplo de un problema de optimización de redes. Se aplican para resolver ciertos tipos de problemas
VIII Jornadas de Usuarios de R
VIII Jornadas de Usuarios de R Análisis del Abandono en el Sector Bancario Predicción del abandono de clientes Albacete, 17 de Noviembre de 2016 I. INDICE : Modelo Abandonos I. COMPRENSIÓN DEL NEGOCIO
Tema: Análisis de valores faltantes con SPSS
Tema: Análisis de valores faltantes con SPSS 1.- Introducción Hemos de comenzar advirtiendo que el Procedimiento Valores perdidos no se incluye en el sistema Base de SPSS, por lo que solo estará disponible
Construcción de Gráficas en forma manual y con programados
Universidad de Puerto Rico en Aguadilla División de Educación Continua y Estudios Profesionales Proyecto CeCiMaT Segunda Generación Tercer Año Título II-B, Mathematics and Science Partnerships Construcción
Modelos Gráficos Probabilistas L. Enrique Sucar INAOE. Sesión 10: Redes Bayesianas Inferencia. 1era parte. [Neapolitan 90]
Modelos Gráficos Probabilistas L. Enrique Sucar INAOE Sesión 10: Redes Bayesianas Inferencia 1era parte [Neapolitan 90] Inferencia en Redes Bayesianas Introducción Clases de algoritmos 1era Parte Propagación
FUNDACIÓN EDUCATIVA OBRERA FUNEDO TÉCNICO EN SECRETARIADO EJECUTIVO SISTEMATIZADO. Conceptos básicos de Access 2013
Base de datos: Conceptos básicos de Access 2013 Una base de datos es un conjunto de datos que están organizados para un uso determinado y el conjunto de los programas que permiten gestionar estos datos
Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE
Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE Objetivos 2 Identificar los tipos de gráficas. Definir los conceptos tablas y cuadros Reconocer las partes de una gráfica. Construir
APRENDIZAJE Y ENTRENAMIENTO. (Neural Nets Capt. 8; Hilera Capt. 3)
Tema 2: Aprendizaje y Entrenamiento Sistemas Conexionistas 1 2.- Aprendizaje o Entrenamiento. 2.1.- Aprendizaje Automático. 2.2.- Tipos de aprendizaje. APRENDIZAJE Y ENTRENAMIENTO. (Neural Nets Capt. 8;
Flujos de redes (Network Flows NF)
Fluos de redes (Network Flows NF). Terminología. Árbol generador mínimo. Camino mínimo 4. Fluo máximo 5. Fluo de coste mínimo TEORÍA DE GRAFOS. OPTIMIZACIÓN EN REDES Terminología Red o grafo (G) Nodos
INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 6)
TEMA Nº 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Ser capaz de definir correctamente una o más variables aleatorias sobre los resultados de un experimento aleatorio y determinar
https://dac.escet.urjc.es/docencia/etc-sistemas/teoria-cuat1/tema2.pdf
1.3 Sistemas numéricos 1.3.1. Introducción Un sistema de representación numérica es un lenguaje que consiste en: Un conjunto ordenado de símbolos (dígitos o cifras) y otro de reglas bien definidas para
OSCILACIONES ACOPLADAS
OSCILACIONES ACOPLADAS I. Objetivos: Analizar el movimiento conjunto de dos osciladores armónicos similares (péndulos de varilla), con frecuencia natural f 0, acoplados por medio de un péndulo bifilar.
Reconocimiento de Patrones
Reconocimiento de Patrones Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica Óptica y Electrónica [email protected] Contenido Introducción Enfoques Problemas Selección de Variables Clasificación
Grafos Eulerianos y Hamiltonianos. Algoritmos y Estructuras de Datos III
Grafos Eulerianos y Hamiltonianos Algoritmos y Estructuras de Datos III Grafos eulerianos Definiciones: Un circuito C en un grafo (o multigrafo) G es un circuito euleriano si C pasa por todos las aristas
TEMA 1: SISTEMAS MODELADOS POR ECUACIONES DIFERENCIALES EN INGENIERÍA QUÍMICA. CLASIFICACIÓN. GENERALIDADES.
TEMA 1: SISTEMAS MODELADOS POR ECUACIONES DIFERENCIALES EN INGENIERÍA QUÍMICA. CLASIFICACIÓN. GENERALIDADES. 1. INTRODUCCIÓN. PLANTEAMIENTO DE PROBLEMAS EN INGENIERÍA QUÍMICA 2. PROBLEMAS EXPRESADOS MEDIANTE
Redes Neuronales Artificiales
Algoritmo de retropropagación Back propagation Es utilizado para entrenar redes neuronales multicapa. Exige que la función de activación de las neuronas sea derivable y creciente. Las funciones comúnmente
Esquema de Dividir y Vencer
Esquema de Dividir y Vencer Amalia Duch Barcelona, marzo de 2006 Índice 1. Esquema general 1 2. Búsqueda binaria (binary search) 2 3. Ordenación por fusión (merge sort) 2 4. Ordenación rápida (quick sort)
El Juego como Problema de Búsqueda
El Juego como Problema de Búsqueda En este algoritmo identificamos dos jugadores: max y min. El objetivo es encontrar la mejor movida para max. Supondremos que max mueve inicialmente y que luego se turnan
INTELIGENCIA ARTIFICIAL Puzzle 3 x 3 con 3 Heurísticas
INTELIGENCIA ARTIFICIAL Puzzle x con Heurísticas El juego del puzzle se representa, sobre un tablero de x casillas. 8 de las casillas contienen una pieza o ficha que se puede deslizar a lo largo del tablero
MODELOS DE INVESTIGACION DE OPERACIONES
MODELOS DE INVESTIGACION DE OPERACIONES CARACTERÍSTICAS Los modelos se dividen en determinísticos (no probabilisticos) y estocásticos (probilisticos). Hay otros modelos híbridos porque incluyen las dos
Guía para la Gestión de Límites de Riesgo Concentración de cartera y depósitos
Guía para la Gestión de Límites de Riesgo Concentración de cartera y depósitos Intendencia de Riesgos de la EPS y de la S FPS En ero 2016 Tabla de contenido 1 Introducción... 3 2 Objetivo... 3 3 Definiciones...
Aprendizaje Automático
Aprendizaje Automático Andrea Mesa 21 de mayo de 2010 Aprendizaje automático Otras denominaciones: machine learning, statistical learning, data mining, inteligencia artificial. Las técnicas de Aprendizaje
Pseudocódigo. La forma en que se escribe un pseudocódigo es la siguiente:
Pseudocódigo El pseudocódigo o pseudolenguaje, son una serie de instrucciones en nuestro lenguaje natural (español, ingles, etc.) y expresiones que representan cada uno de los pasos que resuelven un problema
Métodos de Clasificación sin Métrica. Reconocimiento de Patrones- 2013
Métodos de Clasificación sin Métrica Reconocimiento de Patrones- 03 Métodos de Clasificación sin Métrica Datos nominales sin noción de similitud o distancia (sin orden). Escala nominal: conjunto de categorías
CAPÍTULO 4 RECOPILACIÓN DE DATOS Y CÁLCULO DEL VPN. En el presente capítulo se presenta lo que es la recopilación de los datos que se tomarán
CAPÍTULO 4 RECOPILACIÓN DE DATOS Y CÁLCULO DEL VPN En el presente capítulo se presenta lo que es la recopilación de los datos que se tomarán para realizar un análisis, la obtención del rendimiento esperado
Teoría de grafos y optimización en redes
Teoría de grafos y optimización en redes José María Ferrer Caja Universidad Pontificia Comillas Definiciones básicas Grafo: Conjunto de nodos (o vértices) unidos por aristas G = (V,E) Ejemplo V = {,,,,
MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión.
MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión. 1 Objetivos del tema Conocer en qué consiste un árbol de decisión. Aprender los problemas que pueden
CONTENIDOS. 1. Procesos Estocásticos y de Markov. 2. Cadenas de Markov en Tiempo Discreto (CMTD) 3. Comportamiento de Transición de las CMTD
CONTENIDOS 1. Procesos Estocásticos y de Markov 2. Cadenas de Markov en Tiempo Discreto (CMTD) 3. Comportamiento de Transición de las CMTD 4. Comportamiento Estacionario de las CMTD 1. Procesos Estocásticos
Módulo de Bancos. Versión 1.0.
Módulo de Bancos Versión 1.0 rápido seguro confiable ÍNDICE Introducción Módulo de Bancos Crear Banco/Caja Tipo de Moviemientos Movimientos Editar un Movimiento Concilia Movimientos Estado de Cuenta Bancario
Ejercicios resueltos de Álgebra, hoja 2. Beatriz Graña Otero
Ejercicios resueltos de Álgebra, hoja 2. Beatriz Graña Otero 11 de Diciembre de 2008 2 B.G.O. 104.- Determina si los siguientes subconjuntos del espacio vectorial correspondiente son subvariedades afines:
ALGORITMO MINIMAX. o Nodo: Representa una situación del juego. o Sucesores de un nodo: Situaciones del juego a las que se
ALGORITMO MINIMAX Algoritmo de decisión para minimizar la pérdida máxima aplicada en juegos de adversarios Información completa (cada jugador conoce el estado del otro) Elección del mejor movimiento para
GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.
GLOSARIO ESTADÍSTICO Fuente: Murray R. Spiegel, Estadística, McGraw Hill. CONCEPTOS Y DEFINICIONES ESPECIALES Es el estudio científico de los métodos para recoger, organizar, resumir y analizar los datos
Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental
Universidad de Puerto Rico Recinto de Aguadilla Programa CeCiMat Elemental Definición de conceptos fundamentales de la Estadística y la Probabilidad y su aportación al mundo moderno Dr. Richard Mercado
PRÁCTICA I. Ejercicios Teóricos
PRÁCTICA I TEORÍA DE LA DECISIÓN BAYESIANA Ejercicios Teóricos Ejercicio. En el caso de dos categorías, en la regla de decisión de Bayes el error condicional está dado por la ecuación (7). Incluso si las
Capítulo 7. Introducción a las Interfaces Gráficas de usuario. Continuar
Capítulo 7 Introducción a las Interfaces Gráficas de usuario Continuar Introducción Se explicará qué es una interfaz gráfica, cómo han evolucionado y cómo es que debe desarrollarse un programa que incluya
Figura 1: Esquema de las tablas simplex de inicio y general.
RELACIONES PRIMAL-DUAL Los cambios que se hacen en el modelo original de programación lineal afectan a los elementos de la tabla óptima actual el que se tenga en el momento, que a su vez puede afectar
Tipos De Datos. Numéricos. Alfanuméricos (string) Arreglos (Vectores, Matrices) Estructurados Registros (Def. Por el Archivos Usuario) Apuntadores
Tipos De Datos Todos los datos tienen un tipo asociado con ellos. Un dato puede ser un simple carácter, tal como b, un valor entero tal como 35. El tipo de dato determina la naturaleza del conjunto de
White paper Un método para hacer corresponder entre candidatos y un puesto de trabajo Posiciones basadas en un modelado predictivo Presentado por:
White paper Un método para hacer corresponder entre candidatos y un puesto de trabajo Posiciones basadas en un modelado predictivo Presentado por: Introducción Si pregunta a dos directores de recursos
MatemáticaDiscreta&Lógica 1
MatemáticaDiscreta&Lógica 1 Sistemas de numeración Aylen Ricca Tecnólogo en Informática San José 2014 http://www.fing.edu.uy/tecnoinf/sanjose/index.html SISTEMAS DE NUMERACIÓN.::. Introducción. Podemos
INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016
ANEXO ESTADÍSTICO 1 : COEFICIENTES DE VARIACIÓN Y ERROR ASOCIADO AL ESTIMADOR ENCUESTA NACIONAL DE EMPLEO (ENE) INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 9 de Abril de 016 1 Este anexo estadístico es una
CONTENIDO 1 Diagrama de flujo 2 Pseudocodigo 3 Diagrama estructurado (nassi-schneiderman)
CONTENIDO 1 Diagrama de flujo 2 Pseudocodigo 3 Diagrama estructurado (nassi-schneiderman) Las dos herramientas utilizadas comúnmente para diseñar algoritmos son: Diagrama de Flujo Pseuducodigo 1 Diagrama
Práctica 5: Clasificación con número variable de ejemplos.
5º INGENIERÍA DE TELECOMUNICACIÓN INTELIGENCIA ARTIFICIAL Y RECONOCIMIENTO DE PATRONES Práctica 5: Clasificación con número variable de ejemplos. Objetivos: Utilización de conjuntos de entrenamiento y
1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA
MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse
Tema 2. Concepto de Algoritmo
Tema 2. Concepto de Algoritmo Objetivos Definir el concepto de algoritmo Resolver problemas sencillos mediante el diseño de un algoritmo Conocer los tipos de datos elementales y las operaciones sobre ellos
Métodos de Inteligencia Artificial
Métodos de Inteligencia Artificial L. Enrique Sucar (INAOE) [email protected] ccc.inaoep.mx/esucar Tecnologías de Información UPAEP Agentes que Aprenden Introducción Tipos de aprendizaje Aprendizaje cómo
COLEGIO PABLO DE TARSO IED CONSTRUCCION DE PROYECTOS DE VIDA PRODUCTIVOS DREAMWEAVER UNO- PRÁCTICAS DOC RAUL MONROY PAMPLONA
Metas de comprensión cuarto periodo Comprende sus responsabilidades a la hora de formular sus propuestas como soluciones a problemas reales que impliquen el uso de las tecnologías de información y la gestión
