Decisiones Secuenciales
|
|
- Pascual Murillo Lara
- hace 6 años
- Vistas:
Transcripción
1 Decisiones Secuenciales CI Inteligencia rtificial 2 Clases 4 y 5 Cap 17. Russel & Norvig: Inteligencia rtificial. Un enfoque estructurado genda Motivación Qué son los MDPs? Modelos Recompensas Lifetime Políticas Cálculo de políticas Resumen
2 Problemas de Decisión Secuencial Problema de decisión que involucra un conjunto de decisiones cuyo resultado (utilidad) se conoce hasta el final Se considera que se tiene una serie de estados y decisiones asociadas en el tiempo Se tiene incertidumbre asociada con los resultados de las acciones (MDP), y posiblemente también con los estados (POMDP) Ejemplo: Ratón que busca queso Queso uscar en el espacio de estados? Problema de satisfacción de restricciones? Planning dirigido a la meta (oal-directed)?
3 lgunas ideas El objetivo es acumular recompensas (rewards), en lugar de estados objetivos. Los objetivos se alcanzan durante el camino, en lugar de al final. La tarea es generar políticas de cómo actuar en todas las situaciones, en lugar de hacer un plan para una situación inicial dada. Las políticas pueden tener value functions, las cuales describen el mayor reward que puede alcanzarse en cada estado. Las Value functions se calculan por aproximación iterativa Procesos de Decisión Markovianos (MDPs) gente Estado Reward cción mbiente a s a 1 a s1 s 2 2 s 3 r r 1 r 2 Dado un modelo del ambiente como un MDP construir una política para actuar que maximize la utilidad esperada V = r + γ r 1 + γ 2 r 2...
4 MDPs, Ejemplo a s a 1 a s1 s 2 2 s 3 r r 1 r 2 Ejemplo: s1 a Se muestran las transiciones legales Rewards en las transiciones no estiquetadas es. MDPs Modelo: Un conjunto finito de estados, S Un conjunto finito de acciones, Modelo probabilístico de transiciones, δ(s,a) recompensas para cada estado y acción, R(s,a) Proceso: Observar el estado s t in S Escoger una acción en Recibir la recompensa r t El estado cambia a s t+1
5 Suposiciones de los mbientes MDP Suposición de Markov: El próximo estado y la función de reward, solo son función del estado actual y la acción actuales: s t+1 = δ(s t, a t ) r t = r(s t, a t ) mbiente desconocido y con incertidumbre δ y r pueden ser no-determinísticas y desconocidas. HOY: Sólo el caso determinístico Utilidad Esperada Horizonte finito: Las recompensas (rewards) se acumulan durante un período fijo de tiempo: $K + $K + $K = $3K Horizonte infinito: Se asume que los rewards se acumulan por siempre: $K + $K +... = infinity Descuento: Las recompensas futuras no son tan valiosas como las presentes Se introduce un factor de descuento γ $K + γ $K + γ 2 $K... = converge
6 sumimos un mundo determinístico Política π : S Selecciona una acción para cada estado Política óptima π* : S Para cada estado selecciona la acción que maximiza la utilidad esperada. π π Puede haber muchas políticas, no todas ellas son necesariamente óptimas. Puede haber varias políticas optimas
7 Value Function V π para una política dada π V π (s t ) es la utilidad esperada acumulada resultante de la aplicación de la política π a partir del estado inicial s t : V π (s t ) = r t + γ r t+1 + γ 2 r t+2... V π (s t ) = i γ i r t+i donde r, t r t+1, r t+2... Son generados al seguir la política π comenzando en s t. π asumimos γ = V π n Optimal Policy π* iven Value Function V* Dado un estado s 1. Examinar las acciones posibles a i en el estado s. 2. Seleccionar la acción a i con la mayor utilidad esperada.. La utilidad esperada Q(s, a i ) es: La recompensa immediata de realizar la acción r(s,a) Más la utilidad esperada comenzando en estado destino V(δ(s, a)) Descontando por γ. π*(s) = argmax a [r(s,a) + γv * (δ(s, a)] Requiere: π Value function Modelo ambiental: δ : S x S 1 r : S x R
8 Ejemplo: Mapeando una Value Function en política El agente selecciona la opción óptima a partir dev: π(s) = argmax a [ r(s,a) + γv (δ(s, a) ] Modelo + V: γ = Ejemplo: Mapendo una Value Function en política El agente selecciona la opción óptima a partir dev: π(s) = argmax a [r(s,a) + γv(δ(s, a)] π: Modelo + V: a 9 b 81 9 γ =.9 a: +.9 x = 9 b: +.9 x 81 = 72.9 selecciono a
9 Ejemplo: Mapendo una Value Function en politica El agente selecciona la opción optima a partir dev: π(s) = argmax a [r(s,a) + γv(δ(s, a)] Modelo + V: 9 a b 81 9 π: γ =.9 a: +.9 x = b: +.9 x 9 = 81 selecciono a Ejemplo: Mapendo una Value Function en politica El agente selecciona la opción optima a partir dev: π(s) = argmax a [r(s,a) + γv(δ(s, a)] π: Modelo + V: 9 81 a b 9 c γ =.9 a:? b:? c:? selecciono?
10 Cálculo de Value Functions Value Function (V ) para Universidad una Simón olívar política optimal (π ) Ejemplo R S Value function optimal en horizonte de 1 paso: V* 1 (s) = max a [r(s,a i i )] V* 1 (S ) S S V* 1 (S ) R R R S Max... R R S S
11 Value Function (V ) para Universidad una Simón olívar política optimal (π ) Ejemplo R S R Value function optimal en horizonte de 1 paso: V* 1 (s) = max ai [r(s,a i )] Value function optimal en horizonte de 2 pasos : V* 2 (s) = max ai [r(s,a i ) + γv 1 (δ(s, a i ))] Instancia del principio de programación dinámica: Reutilizar sub-resultados compartidos horro exponencial R S R V* 2 (S ) S S V* 2 (S ) γ V* R + 1 (S ) R Max... S... S + γ V* 1 (S ) S S Value Function (V ) para Universidad una Simón olívar política optimal (π ) Ejemplo R Value function optimal en horizonte de 1 paso: V* 1 (s) = max a [r(s,a i i )] Value function optimal en horizonte de 2 pasos : V* 2 (s) = max a [r(s,a i i ) + γv 1 (δ(s, a i ))] Value function optimal en horizonte de n pasos : V* n (s) = max a [r(s,a i i ) + γv n-1 (δ(s, a i ))] S R R S R
12 Value Function (V ) para Universidad una Simón olívar política optimal (π ) Ejemplo R Value function optimal en horizonte de 1 paso: V* 1 (s) = max a [r(s,a i i )] Value function optimal en horizonte de 2 pasos : V* 2 (s) = max a [r(s,a i i ) + γv 1 (δ(s, a i ))] Value function optimal en horizonte de n pasos : V* n (s) = max a [r(s,a i i ) + γv n-1 (δ(s, a i ))] Value function optimal en horizonte infinito: R S V*(s) = max a i [r(s,a i) + γv (δ(s, a i ))] R S R Resolución de MDPs por Value Iteration Se puede calcular los valores de la política óptima usando programación dinámica. lgoritmo: Calcular los valores iterativamente usando la ecuación de ellman: V* t+1 (s) max a [r(s,a) + γv t(δ(s, a))] Terminar cuando los valores están suficientemente cerca V* t+1 (s) - V t (s) < ε Los agentes seleccionan la acción optimal con un paso de lookahead sobre V : π*(s) = argmax a [r(s,a) + γv (δ(s, a)]
13 Convergencia del lgoritmo lgoritmo: Calcular los valores iterativamente usando la ecuación de ellman: V t+1 (s) max a [r(s,a) + γv t (δ(s, a))] Terminar cuando los valores están suficientemente cerca V t+1 (s) - V t (s) < ε Luego: Max s in S V t+1 (s) - V (s) < 2εγ/(1 - γ) La convergencia está garantizada (en t infinito), no importando el orden de las actualizaciones. Ejemplo de Value Iteration V* t+1 (s) max a [r(s,a) + γv t (δ(s, a))] V γ =.9 t V t+1 a b a: +.9 x = b: +.9 x = Max =
14 Ejemplo de Value Iteration V* t+1 (s) max a [r(s,a) + γv t (δ(s, a))] V t V t+1 c a b γ =.9 a: +.9 x = b: +.9 x = c: +.9 x = Max = Ejemplo de Value Iteration V* t+1 (s) max a [r(s,a) + γv t (δ(s, a))] γ =.9 V t V t+1 a a: +.9 x = Max =
15 Ejemplo de Value Iteration V* t+1 (s) max a [r(s,a) + γv t (δ(s, a))] γ =.9 V t V t+1 Ejemplo de Value Iteration V* t+1 (s) max a [r(s,a) + γv t (δ(s, a))] γ =.9 V t V t+1
16 Ejemplo de Value Iteration V* t+1 (s) max a [r(s,a) + γv t (δ(s, a))] γ =.9 V t V t+1 Ejemplo de Value Iteration V* t+1 (s) max a [r(s,a) + γv t (δ(s, a))] γ =.9 V t V t+1 9 9
17 Ejemplo de Value Iteration V* t+1 (s) max a [r(s,a) + γv t (δ(s, a))] γ =.9 V t V t Ejemplo de Value Iteration V* t+1 (s) max a [r(s,a) + γv t (δ(s, a))] γ =.9 V t V t
18 Referencias y Enlaces Russell, S. and Norvig, P. Inteligencia rtificial. Un enfoque moderno. Prentice Hall Láminas de Russel: Planning to Maximize Reward:Markov Decision Processes: Planning to Maximize Reward: Markov Decision Processes Código ejemplo de los diferentes tipos de agentes disponible en:
Métodos de Inteligencia Artificial
Métodos de Inteligencia Artificial L. Enrique Sucar (INAOE) esucar@inaoep.mx ccc.inaoep.mx/esucar Tecnologías de Información UPAEP Agentes que Aprenden: Aprendizaje por Refuerzo (RL) Introducción MDPs
Más detallesIA y Robótica. Aprendizaje por Refuerzo. Instituto de Computación Facultad de Ingeniería Universidad de la República
IA y Robótica Aprendizaje por Refuerzo Instituto de Computación Facultad de Ingeniería Universidad de la República Contenido Aprendizaje por refuerzo. Redes neuronales y aprendizaje por refuerzo. Aprendizaje
Más detallesModelos Gráficos Probabilistas L. Enrique Sucar INAOE. Sesión 15: Procesos de Decisión de Markov
Modelos Gráficos Probabilistas L. Enrique Sucar INAOE Sesión 15: Procesos de Decisión de Markov Procesos de Decisión de Markov Procesos de Decisión Secuenciales Procesos de Decisión de Markov (MDPs) Técnicas
Más detallesCurso de Inteligencia Artificial
Curso de Inteligencia Artificial Modelos Ocultos de Markov Gibran Fuentes Pineda IIMAS, UNAM Redes Bayesianas Representación gráfica de relaciones probabilísticas Relaciones causales entre variables aleatorias
Más detalles1. Cuáles de las siguientes afirmaciones acerca del algoritmo Q-learning son ciertas
Universidad Rey Juan Carlos Curso 2014 2015 Hoja de Problemas Tema 12 1. Cuáles de las siguientes afirmaciones acerca del algoritmo Q-learning son ciertas (a) Para garantizar la convergencia de los valores
Más detallesAprendizaje por refuerzo
Inteligencia Artificial Aprendizaje por refuerzo Ing. Sup. en Informática, 4º Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani Aprendizaje Resumen: 3. Aprendizaje automático 3.1 Introducción
Más detallesREINFORCEMENT LEARNING. Jesús Fernández Bes
Jesús Fernández Bes Noviembre 2012 ÍNDICE 1. Qué es, qué no es y para qué sirve el RL? 2. Formulación: Markov Decision Processes 1. Dynamic Programming 2. Algoritmos clásicos de RL 3. Líneas de InvesWgación
Más detallesRequerimiento de capital bancario y ciclos de crédito
Requerimiento de capital bancario y ciclos de crédito SBS Octubre 211 Motivación Que se hace en esta investigación? Metodología Por que un modelo DSGE? Motivación 1 El requerimiento de capital bancario
Más detallesCONTENIDO Prefacio CAPITULO 1: Qué es la investigación de operaciones? CAPITULO 2: Introducción a la programación lineal...
CONTENIDO Prefacio XV CAPITULO 1: Qué es la investigación de operaciones? 1 1.1 Modelos de investigación de operaciones 1 1.2 Solución del modelo de investigación de operaciones.. 4 1.3 Modelos de colas
Más detallesCarrera: INB Participantes. Representante de las academias de ingeniería industrial de. Academias Ingeniería Industrial.
1.- DATOS DE LA ASIGNATURA Nombre de la asignatura: Carrera: Clave de la asignatura: Horas teoría-horas práctica-créditos Investigación de Operaciones II Ingeniería Industrial INB-0412 4-0-8 2.- HISTORIA
Más detallesALGORITMOS GENÉTICOS: ALGUNOS RESULTADOS DE CONVERGENCIA
Mosaicos Matemáticos No. 11 Diciembre, 23. Nivel Superior ALGORITMOS GENÉTICOS: ALGUNOS RESULTADOS DE CONVERGENCIA Mario Alberto Villalobos Arias Departamento de Matemáticas Centro de Investigación y de
Más detallesDada f : [a, b] R R, continua, se plantea el problema de encontrar ceros de f, es decir raíces de la ecuación
Tema 8 Ceros de funciones Versión: 23 de abril de 2009 8.1 Introducción Dada f : [a, b] R R, continua, se plantea el problema de encontrar ceros de f, es decir raíces de la ecuación f(x) = 0. (8.1) La
Más detallesPROGRAMA DE CURSO. Código Nombre INVESTIGACIÓN DE OPERACIONES Nombre en Inglés OPERATIONS RESEARCH SCT Auxiliar. Personal
PROGRAMA DE CURSO Código Nombre IN 3702 INVESTIGACIÓN DE OPERACIONES Nombre en Inglés OPERATIONS RESEARCH es Horas de Horas Docencia Horas de Trabajo SCT Docentes Cátedra Auxiliar Personal 6 10 3.0 2.0
Más detallesPROGRAMACIÓN NO LINEAL INTRODUCCIÓN
PROGRAMACIÓN NO LINEAL Conceptos generales INTRODUCCIÓN Una suposición importante de programación lineal es que todas sus funciones Función objetivo y funciones de restricción son lineales. Aunque, en
Más detallesAño Académico 2009 INGENIERÍA INDUSTRIAL E INGENIERÍA DE SISTEMAS
Año Académico 2009 INGENIERÍA INDUSTRIAL E INGENIERÍA DE SISTEMAS Investigación de operaciones I UNIDAD Unidad I: Programación lineal Conjuntos convexos, propiedades. Solución gráfica del problema bidimensional
Más detallesCadenas de Markov Tiempo Discreto. Modelado y Análisis de Redes de Telecomunicaciones
Cadenas de Markov Tiempo Discreto Modelado y Análisis de Redes de Telecomunicaciones Motivación Ejemplo 1 Sea un enrutador al que arriban paquetes de otros (varios) routers Cuando más de un paquete llega
Más detallesMODELOS DE INVESTIGACION DE OPERACIONES
MODELOS DE INVESTIGACION DE OPERACIONES CARACTERÍSTICAS Los modelos se dividen en determinísticos (no probabilisticos) y estocásticos (probilisticos). Hay otros modelos híbridos porque incluyen las dos
Más detallesSon una clase particular de los algoritmos evolutivos.
Algoritmos Genéticos (AGs) Los AGs son técnicas de resolución para problemas de Búsqueda Optimización Aprendizaje en máquinas Son una clase particular de los algoritmos evolutivos. Los AGs intentan resolver
Más detallesAprendizaje por Refuerzos
Aprendizaje por Refuerzos Teoría y Aplicaciones en Robó8ca, Neurociencia y Psicología Carlos Greg Diuk Department of Psychology Princeton Neuroscience Ins8tute Princeton University Resumen final Estudiamos
Más detallesFacultad de Física. Métodos Numéricos
Facultad de Física Métodos Numéricos Dr. Antonio Marín Hernández Centro de Investigación en Inteligencia Artificial Universidad Veracruzana Sebastían Camacho # 5 Xalapa, Veracruz lineales 1. Método de
Más detallesx 1 3 f) x e lim x lim + 2 lim lim log x lim x 1 (x 1)(x 4) lim x 1 (x 2)(x 5) (x 2)(x 3) 1. Calcular los siguientes límites no indeterminados 1 :
+ ln 4 + f + 5 EJERCICIOS de LÍMITES DE FUNCIONES y CONTINUIDAD. Calcular los siguientes límites no indeterminados : 4 + + 4 f) e log g) 0, + 4 i) 0+ + 4 e) j) 4. Dada la gráfica de la figura, indicar
Más detallesLINEAS DE ESPERA. En diferentes ocaciones de la vida, la mayoria de las personas que viven en la sociedad moderna han esperado
LINEAS DE ESPERA 1.- INTRODUCCION: En diferentes ocaciones de la vida, la mayoria de las personas que viven en la sociedad moderna han esperado en una fila para recibir algún servicio. Esperar podría incluir
Más detallesProgramación y Métodos Numéricos Errores de de redondeo en en la la representación de de números reales: INTRODUCCIÓN Y MOTIVACIÓN
Programación y Métodos Numéricos Errores de de redondeo en en la la representación de de números reales: INTRODUCCIÓN Y MOTIVACIÓN Carlos Conde LázaroL Arturo Hidalgo LópezL Alfredo López L Benito Febrero,
Más detallesBúsqueda en línea y Búsqueda multiagente
Búsqueda en línea y Búsqueda multiagente Ingeniería Informática, 4º Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani 1 Tema 2: Agentes basados en Búsqueda Resumen: 2. Agentes basados
Más detallesResolviendo Problemas Buscando Soluciones. Tomás Arredondo Vidal 16/6/2010
Resolviendo Problemas Buscando Soluciones Tomás Arredondo Vidal 16/6/2010 Resolviendo Problemas Buscando Soluciones Contenidos Agentes que resuelven problemas Tipos de problemas Formulación de problemas
Más detallesRedes de Petri Estocásticas (II)
Redes de Petri Estocásticas (II) Carlos Aguirre Universidad Autonoma de Madrid, Dpto Ingenieria Informatica Redes Estocásticas Formalmente una red de Petri estocástica es por tanto una 7 upla SPN=(P,T,I(),O(),H(),W(),Mo)
Más detallesCAPITULO 1: PERSPECTIVE GENERAL DE LA
CONTENIDO CAPITULO 1: PERSPECTIVE GENERAL DE LA INVESTIGACION DE OPERACIONES 1 1.1 Modelos matemáticos de investigación de operaciones. 1 1.2 Técnicas de investigación de operaciones 3 1.3 Modelado de
Más detallesBases Formales de la Computación: Sesión 3. Modelos Ocultos de Markov
Bases Formales de la Computación: Sesión 3. Prof. Gloria Inés Alvarez V. Departamento de Ciencias e Ingeniería de la Computación Pontificia Universidad Javeriana Cali Periodo 2008-2 Contenido 1 Introducción
Más detallesTutorada por Dra. Dña. Eva Onaindía De La Rivaherrera
Departamento de Sistemas Informáticos y Computación SIMPLIFICACIÓN DE LOS PROCESOS DE DECISIÓN DE MARKOV MEDIANTE REGLAMENTACIÓN DE ACCIONES Y PRIORIZACIÓN DE ESTADOS Presentada por María de Guadalupe
Más detallesInventarios: qué son?
Inventarios Inventarios: qué son? Definición contable: registro documental de los bienes y demás objetos pertenecientes a una persona física, a una organización o comunidad. Debe aparecer dentro del activo
Más detallesMétodo de recuperación n de Theis
La manera mas conveniente de analizar conceptualmente la prueba de recarga, es pensar en la razón n de bombeo como constante a lo largo del periodo de medición. Al l termino de cualquier prueba de bombeo,
Más detallesÁlgebra Lineal Ma1010
Álgebra Lineal Ma1010 Métodos Iterativos para Resolver Sistemas Lineales Departamento de Matemáticas ITESM Métodos Iterativos para Resolver Sistemas Lineales Álgebra Lineal - p. 1/30 En esta lectura veremos
Más detallesUNIVERSIDAD DE GUADALAJARA
UNIVERSIDAD DE GUADALAJARA FORMATO GENERAL PROGRAMA DE ASIGNATURA NOMBRE DE MATERIA INVESTIGACIÓN DE OPERACIONES II CÓDIGO DE MATERIA MC 110 DEPARTAMENTO CIENCIAS BIOLÓGICAS ÁREA DE FORMACIÓN BÁSICA PARTICULAR
Más detallesBoletín de ejercicios 3
Boletín de ejercicios 3 Thomas Philippon 19 de abril, 2002 1 Riqueza humana, riqueza económica y consumo El objetivo que se persigue consiste en obtener las fórmulas de la página 13 del tema 2. Se trata
Más detallesIA Robótica. Agente y Entorno. Instituto de Computación Facultad de Ingeniería Universidad de la República
IA Robótica Agente y Entorno Instituto de Computación Facultad de Ingeniería Universidad de la República Agentes Introducción Paradigma Estructura Programas Introducción (1/4) Agente: es todo aquello que
Más detallesECONOMÍA MATEMÁTICA INTERMEDIA
MATEMÁTICA INTERMEDIA Clave : ECO794 Créditos : 3 Tipo : Obligatorio Semestre : 2014-1 Horario : Miércoles 7:00-10:00pm (G1) Requisitos : Ninguno Jueves 7:00-10:00pm (G2) Sábado 8:00-9:30pm (PD) Profesor/a
Más detallesModelo de cambios de régimen en el traspaso de las tasas de interés
Modelo de cambios de régimen en el traspaso de las tasas de interés (Regime switching in interest rate pass-through and dynamic bank modelling with risks) Alberto Humala XXIII Encuentro de Economistas
Más detallesEstado 3.2 (coste = 9)
Búsqueda heurística Fernando Berzal, berzal@acm.org Búsqueda heurística Búsqueda primero el mejor p.ej. búsqueda de coste uniforme [UCS] Heurísticas Búsqueda greedy El algoritmo A* Heurísticas admisibles
Más detallesTema 2 Resolución de EcuacionesNo Lineales
Tema 2 Resolución de Ecuaciones No Lineales E.T.S.I. Informática Indice Introducción 1 Introducción 2 Algoritmo del método de Bisección Análisis del 3 4 5 6 Algoritmo de los métodos iterativos Interpretación
Más detallesPráctica IV: Métodos de Newton-Raphson y de la secante, para encontrar las raíces de una función.
Práctica IV: Métodos de Newton-Raphson y de la secante, para encontrar las raíces de una función. Se suele llamar método de Newton-Raphson al método de Newton cuando se utiliza para calcular los ceros
Más detalles1.3. El teorema de los valores intermedios
Ingeniería Matemática FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS UNIVERSIDAD DE CHILE Cálculo Diferencial e Integral 07-2 Importante: Visita regularmente http://www.dim.uchile.cl/calculo. Ahí encontrarás
Más detallesSISTEMAS DE APOYO A LA TOMA DE DECISIONES : DSS y EIS
IIC3712 GESTIÓN de las TEC. de INFORMACIÓN SISTEMAS DE APOYO A LA TOMA DE DECISIONES : DSS y EIS Ignacio Casas R. Escuela de Ingeniería Pontificia Universidad Católica de Chile Mayo, 2002 Qué es la Toma
Más detallesFundamentos de la programación lineal. Función Objetivo (F.O.): Para seleccionar qué función objetivo debe elegirse se toma en cuenta lo siguiente:
Fundamentos de la programación lineal Se llama programación lineal al conjunto de técnicas matemáticas que pretenden resolver la situación siguiente: Optimizar (maximizar o minimizar) una función objetivo,
Más detallesPreliminares Interpolación INTERPOLACIÓN Y APROXIMACIÓN POLINOMIAL
INTERPOLACIÓN Y APROXIMACIÓN POLINOMIAL Contenido Preliminares 1 Preliminares Teorema 2 Contenido Preliminares Teorema 1 Preliminares Teorema 2 Teorema Preliminares Teorema Teorema: Serie de Taylor Supongamos
Más detallesPlanificación dinámica de tareas
dit UPM Planificación dinámica de tareas Juan Antonio de la Puente DIT/UPM Copyright 2007, Juan Antonio de la Puente Sistemas dinámicos Hay sistemas de tiempo real en los que no se conocen de antemano
Más detallesCAPÍTULO 6 PROGRAMACIÓN DINÁMICA. Programación Dinámica
CAPÍTULO 6 PROGRAMACIÓN DINÁMICA Programación Dinámica Programación Dinámica En muchos casos las decisiones del pasado afectan los escenarios del futuro. En estos casos se pueden tomar 2 opciones: asumir
Más detallesCálculo Numérico. Introducción a la teoría de errores. Cá álculo umérico Tema 0:
Cálculo Numérico Tema 0: Problema Introducción a la teoría de errores Tipos de errores en un proceso numérico de resolución de un problema. Errores absoluto y relativo. Número de cifras exactas. Error
Más detallesANÁLISIS BAJO INCERTIDUMBRE DE LA ESTABILIDAD DE LA DEUDA PÚBLICA EN GUATEMALA
ANÁLISIS BAJO INCERTIDUMBRE DE LA ESTABILIDAD DE LA DEUDA PÚBLICA EN GUATEMALA MAYO DE 2014 Contenido Hechos estilizados Modelo Mendoza-Oviedo Modelo García-Rigobon Conclusiones PRODUCTO INTERNO BRUTO
Más detallesInteligencia Artificial
Algoritmos genéticos Bases En la naturaleza todos los seres vivos se enfrentan a problemas que deben resolver con éxito, como conseguir más luz solar o conseguir comida. La Computación Evolutiva interpreta
Más detallesProf. Pérez Rivas Lisbeth Carolina
Ingeniería de Sistemas Investigación de Operaciones Prof. Pérez Rivas Lisbeth Carolina Investigación de Operaciones Es una rama de las Matemáticas consistente en el uso de modelos matemáticos, estadística
Más detallesDefinición de la integral de Riemann (Esto forma parte del Tema 1)
de de de Riemann (Esto forma parte del Tema 1) Departmento de Análise Matemática Facultade de Matemáticas Universidade de Santiago de Compostela Santiago, 2011 Esquema de Objetivos del tema: Esquema de
Más detallesCONTENIDO SEMBLANZA DE LOS AUTORES DE LOS ESCRITORES DE CASOS..
CONTENIDO SEMBLANZA DE LOS AUTORES DE LOS ESCRITORES DE CASOS.. PREFACIO. xix xxi xxiii CAPITULO I Introducción. 1 1.1 Orígenes de la investigación de operaciones. 1 1.2 Naturaleza de la investigación
Más detallesCuál es el campo de estudio de la prueba de hipótesis?
ESTIMACIÓN Establecer generalizaciones acerca de una población a partir de una muestra es el campo de estudio de la inferencia estadística. La inferencia estadística se divide en estimación y prueba de
Más detallesFórmulas de Cuadratura Optimales en Variedades Integrales
Divulgaciones Matemáticas Vol. 12 No. 224, pp. 139 148 Fórmulas de Cuadratura Optimales en Variedades Integrales Optimal Quadrature Formulas in Integral Varieties Yohan Díaz Ferrer ydiazf@yahoo.es Lelis
Más detallesProblemas de VC para EDVC elaborados por C. Mora, Tema 4
Problemas de VC para EDVC elaborados por C. Mora, Tema 4 Ejercicio Determinar las funciones enteras f para las que Solución f( + w) = f()f(w), w C. En primer lugar, f(0) = f(0 + 0) = f(0)f(0) = f(0) 2,
Más detallesFlujos de redes (Network Flows NF)
Fluos de redes (Network Flows NF). Terminología. Árbol generador mínimo. Camino mínimo 4. Fluo máximo 5. Fluo de coste mínimo TEORÍA DE GRAFOS. OPTIMIZACIÓN EN REDES Terminología Red o grafo (G) Nodos
Más detalles(V2.0) SILABO CS261T.
Sociedad Peruana de Computación Facultad de Computación Programa Profesional de (Ciencia de la Computación) (V2.0) SILABO CS261T. Inteligencia Artificial (Obligatorio) 2010-1 0. DATOS GENERALES 0.1 CARRERA
Más detallesFigura 1: Esquema de las tablas simplex de inicio y general.
RELACIONES PRIMAL-DUAL Los cambios que se hacen en el modelo original de programación lineal afectan a los elementos de la tabla óptima actual el que se tenga en el momento, que a su vez puede afectar
Más detallesPrimer Cuatrimestre Año 2015 PROBLEMAS TEMA III.
UNIVERSIDAD CARLOS III. MICROECONOMÍA IV. Primer Cuatrimestre Año 2015 PROBLEMAS TEMA III. (1) Consideremos una economía sin incertidumbre con un único bien. Hay dos tipos de agentes con funciones de utilidad
Más detallesInventarios.
Inventarios http://humberto-r-alvarez-a.webs.com Inventarios Los inventarios tienen una gran importancia siempre y cuando estos añadan valor a los procesos. La existencia de los inventarios añade valor
Más detallesUNIDAD TEMÁTICA XIII
FUNCIONES DE UNA SOLA VARIABLE UNIDAD TEMÁTICA XIII XIII.1 INTRODUCCIÓN Las funciones de una variable son las más simples dentro del análisis funcional, y mediante ellas se puede describir muchos problemas
Más detallesAgentes que resuelven problemas
Agentes que resuelven problemas 1. Formulación de meta (decidir que estados son objetivo) y del problema (decidir que acciones y estados se van a considerar) 2. Buscar una solución (examinar posibles acciones
Más detallesESTADISTICA INFERENCIAL DR. JORGE ACUÑA A.
ESTADISTICA INFERENCIAL DR. JORGE ACUÑA A. 1 PROBABILIDAD Probabilidad de un evento es la posibilidad relativa de que este ocurra al realizar el experimento Es la frecuencia de que algo ocurra dividido
Más detallesPara verificar que el sistema converge se deberán cumplir con las siguientes condiciones en las formulas con derivadas parciales: + 1
MAT 5 B Sistemas de ecuaciones no lineales EJERCICIOS RESUELTOS. Resuelva el siguiente sistema de ecuaciones no lineales, utilizando el método de punto fijo multivariable: x cos x x SOLUCIÓN x 8 x +. +
Más detalles2. Sistemas de ecuaciones lineales
2 Sistemas de ecuaciones lineales 2 Ejercicios resueltos Ejercicio 2 Estudiar el número de condición de Frobenius de la matriz a b A a + ε b Solución: El determinante de A es A ab + ba + ε b ε Si b 0 y
Más detallesINDICE. Parte 1 Modelamiento y optimización 1. Introducción al análisis y construcción de modelos
INDICE Parte 1 Modelamiento y optimización 1. Introducción al análisis y construcción de modelos 3 Ejemplo motivador. Modelo de operaciones de la guardia costera Decisiones Abstracción y simplificación
Más detallesUna implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché. Resumen
Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché Alicia Marcela Printista, Marcelo Luis Errecalde, Cecilia Inés Montoya Proyecto UNSL Nº 338403 1 Departamento
Más detallesSimulación de utilización dupla palacamión
UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO DE INGENIERÍA CIVIL DE MINAS SEMESTRE PRIMAVERA 203 SIMULACIÓN DE PROCESOS MINEROS MI5072- Informe tarea Simulación de utilización
Más detallesMÉTODO DE DIFERENCIAS FINITAS (FDM)
MÉTODO DE DIFERENCIAS FINITAS (FDM) MÉTODO DE DIFERENCIAS FINITAS (FDM) Cambia ecuaciones diferenciales ecuaciones en diferencias finitas a Relaciona el valor de la variable dependiente en un punto a valores
Más detallesProgramación NO Lineal (PNL) Optimización sin restricciones
Programación NO Lineal (PNL) Optimización sin restricciones Ejemplos de los problemas que se aplica la programación NO Lineal: Problema de transporte con descuentos por cantidad : El precio unitario de
Más detallesTema 3: El Método Simplex. Algoritmo de las Dos Fases.
Tema 3: El Método Simplex Algoritmo de las Dos Fases 31 Motivación Gráfica del método Simplex 32 El método Simplex 33 El método Simplex en Formato Tabla 34 Casos especiales en la aplicación del algoritmo
Más detallesIntroducción a la Administración de Riesgo en Proyectos Gustavo Vinueza Director Soluciones Personalizadas
Introducción a la Administración de Riesgo en Proyectos con @RISK Gustavo Vinueza Director Soluciones Personalizadas gvinueza@palisade.com Agenda» Riesgo en Cronogramas Tradicional vs Estocástico Registro
Más detallesEstadística Descriptiva
Estadística Descriptiva 1 Sesión No. 6 Nombre: Estadística descriptiva Contextualización Las representaciones graficas tienen una gran importancia para la comprensión de los diferentes tipos de datos utilizados
Más detallesIntroducción a la Programación Dinámica. El Problema de la Mochila
Tema 1 Introducción a la Programación Dinámica. El Problema de la Mochila La programación dinámica no es un algoritmo. Es más bien un principio general aplicable a diversos problemas de optimización que
Más detallesPROBLEMAS DE OPTIMIZACIÓN CON RESTRICCIONES. PROBLEMA DE PROGRAMACIÓN NO- LINEAL (NLP).
PROBLEMAS DE OPTIMIZACIÓN CON RESTRICCIONES. PROBLEMA DE PROGRAMACIÓN NO- LINEAL (NLP. Optimización con restricciones La presencia de restricciones reduce la región en la cual buscamos el óptimo. Los criterios
Más detallesSeries numéricas y de potencias. 24 de Noviembre de 2014
Cálculo Series numéricas y de potencias 24 de Noviembre de 2014 Series numéricas y de potencias Series numéricas Sucesiones de números reales Concepto de serie de números reales. Propiedades Criterios
Más detallesMETODOS ESTADÍSTICOS
METODOS ESTADÍSTICOS Introducción. Uno de los objetivos de la asignatura de Hidrología, es mostrar a los alumnos, las herramientas de cálculo utilizadas en Hidrología Aplicada para diseño de Obras Hidráulicas.
Más detallesTema 8. Las inversiones y su selección. La rentabilidad de las inversiones
Tema 8. Las inversiones y su selección. La rentabilidad de las inversiones - Tipos de inversiones - Variables fundamentales que definen un plan de inversión - Rentabilidad esperada y requerida. - Riesgo
Más detallesUNIVERSIDAD AUTÓNOMA DE CHIAPAS FACULTAD DE INGENIERÍA CAMPUS I PROBABILIDAD Y ESTADÍSTICA
UNIVERSIDAD AUTÓNOMA DE CHIAPAS FACULTAD DE INGENIERÍA CAMPUS I PROBABILIDAD Y ESTADÍSTICA NIVEL: LICENCIATURA CRÉDITOS: 9 CLAVE: ICAD24.500919 HORAS TEORÍA: 4.5 SEMESTRE: CUARTO HORAS PRÁCTICA: 0 REQUISITOS:
Más detallesa) LLamamos x al número de collares e y al número de pulseras. Las restricciones son: x + y 50 2x + y 80 x, y 0
Nuria Torrado Robles Departamento de Estadística Universidad Carlos III de Madrid Hoja, ejercicios de programación lineal, curso 2010 2011. 1. Un artesano fabrica collares y pulseras. Hacer un collar le
Más detallesMODELIZACION 01. Universidad Nacional de La Pampa Facultad de Ciencias Económicas y Jurídicas 18 - Métodos Cuantitativos para la Administración
Bibliografía Mathur y Solow; Investigación de Operaciones - El arte de la toma de decisiones. Ed. Prentice Hall Anderson, Sweeney y Williams; Introducción a los modelos cuantitativos para Administración.
Más detallesPráctica 2: Periodicidad
Práctica 2: Periodicidad Apellidos, nombre Apellidos, nombre Grupo Puesto Fecha El objetivo de esta práctica es explorar las utilidades de representación gráfica de MATLAB para observar las especiales
Más detallesEstéreo dinámico. Estéreo dinámico
Estéreo dinámico 1 Vectores locales de desplazamiento Dada una secuencia de imagenes Tomadas a intervalos Movimiento absoluto: movimiento independiente de la cámara Movimiento relativo: movimiento debido
Más detallesSÍLABO DE OPTIMIZACIÓN ECONÓMICA
I. DATOS GENERALES CÓDIGO CARÁCTER CRÉDITOS 4 A0328 PERIODO ACADÉMICO 2016 PRERREQUISITO SÍLABO DE OPTIMIZACIÓN ECONÓMICA Obligatorio Economía Matemática HORAS Teóricas: 2 Prácticas: 4 II. SUMILLA DE LA
Más detallesComplejidad - Problemas NP-Completos. Algoritmos y Estructuras de Datos III
Complejidad - Problemas NP-Completos Algoritmos y Estructuras de Datos III Teoría de Complejidad Un algoritmo eficiente es un algoritmo de complejidad polinomial. Un problema está bien resuelto si se conocen
Más detallesTraductores Push Down
Push Down Extensión de Autómatas Universidad de Cantabria Outline El Problema 1 El Problema 2 3 El Problema Hemos estudiado anteriormente los autómatas con pila y hemos visto su relación con los lenguajes
Más detallesProgramación Dinámica
Programación Dinámica Adaptado de Algorithm Design Goodrich and Tamassia Programación Dinámica 1 Calculando la serie de Fibonacci 1,1,2,3,5,8,13,21,. fib(n) = 1 si n = 0,1 fib(n 1) + fib(n 2) o.c. Programación
Más detallesTeorema Central del Límite (1)
Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico
Más detallesSistemas de ecuaciones no lineales
Práctica 6 Sistemas de ecuaciones no lineales En esta práctica revisaremos algunos métodos básicos para la resolución numérica de sistemas de ecuaciones no lineales 61 Método iterativo del punto fijo Partimos
Más detallesSOLUCIÓN A LA ECUACIÓN EN DIFERENCIAS FINITAS. Hernández Cruz G. Berenice.
SOLUCIÓN A LA ECUACIÓN EN DIFERENCIAS FINITAS Hernández Cruz G. Berenice. SOLUCIÓN A LA ECUACIÓN EN DIFERENCIAS FINITAS La solución de diferencias finitas es ocupada en los análisis numéricos, por ejemplo:
Más detallesTema X: LÍMITES Y CONTINUIDAD DE FUNCIONES X.2. Límites. Tema X: LÍMITES Y CONTINUIDAD DE FUNCIONES X.2. Límites
Tema X: LÍMITES Y CONTINUIDAD DE FUNCIONES X.2. Límites 1. Definición de límite DEF. Sea f : A R R y a A Se dice que l R es el límite de f cuando x tiende a a, si para todo entorno de l, existe un entorno
Más detallesMÉTODOS NUMÉRICOS PARA INGENIERÍA ERROR GUIÓN PARA EL TEMA CONCEPTOS BÁSICOS
ERROR GUIÓN PARA EL TEMA CONCEPTOS BÁSICOS REPASO de conceptos de dígito significativo y de orden, para números en notación decimal. Para señalar la diferencia entre el concepto de dígito significativo
Más detallesCálculo de bisección inversa mediante mínimos cuadrados
www.topoedu.es Los mejores recursos especializados en topografía y geodesia, nunca vistos hasta ahora. Hojas técnicas de cálculo: Cálculo de bisección inversa mediante mínimos cuadrados Versión 1. Febrero
Más detallesConvergencia y existencia de la serie de Fourier
A Convergencia y existencia de la serie de Fourier A.1. Convergencia de la serie de Fourier* Posiblemente una de las mayores controversias respecto al desarrollo de Fourier fue su afirmación que cualquier
Más detallesCálculo de puntos ATR de Darmon en curvas elípticas no geométricamente modulares
Cálculo de puntos ATR de Darmon en curvas elípticas no geométricamente modulares Xevi Guitart 1 Marc Masdeu 2 1 Universitat Politècnica de Catalunya and Max Planck Institute for Mathematics 2 Columbia
Más detalles1: INTRODUCCIÓN AL USO DE LA HOJA DE CALCULO EXCEL COMO HERRAMIENTA PARA DESARROLLAR PROBLEMAS EN INGENIERÍA. SOLVER, REGRESION LINEAL MULTIPLE
Practica 1: INTRODUCCIÓN AL USO DE LA HOJA DE CALCULO EXCEL COMO HERRAMIENTA PARA DESARROLLAR PROBLEMAS EN INGENIERÍA. SOLVER, REGRESION LINEAL MULTIPLE I. INTRODUCCION Las planillas de cálculo se han
Más detalles1. Convergencia en medida
FACULTAD CS. FÍSICAS Y MATEMÁTICAS UNIVERSIDAD DE CHILE MA3801 Teoría de la Medida. Semestre 2009-02 Profesor: Jaime San Martín Auxiliares: Andrés Fielbaum y Cristóbal Guzmán Clase auxiliar 7 21 de Septiembre
Más detalles2.3 Clasificación de modelos matemáticos.
2.3 Clasificación de modelos matemáticos. Qué es un modelo? Un modelo es una representación ideal de un sistema y la forma en que este opera. El objetivo es analizar el comportamiento del sistema o bien
Más detallesBúsqueda con adversario
Búsqueda con adversario José Luis Ruiz Reina José Antonio Alonso Jiménez Franciso J. Martín Mateos María José Hidalgo Doblado Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla
Más detallesResolución de problemas de búsqueda
Resolución de problemas de búsqueda Memoria de Prácticas de Segunda Entrega 26 de noviembre de 2007 Autores: Mariano Cabrero Canosa cicanosa@udc.es Elena Hernández Pereira elena@udc.es Directorio de entrega:
Más detalles