Aprendizaje por refuerzo
|
|
- Alejandro Naranjo Acuña
- hace 8 años
- Vistas:
Transcripción
1 Inteligencia Artificial Aprendizaje por refuerzo Ing. Sup. en Informática, 4º Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani
2 Aprendizaje Resumen: 3. Aprendizaje automático 3.1 Introducción al aprendizaje automático 3.2 Árboles de decisión 3.3 Redes neuronales 3.4 Algoritmos genéticos 3.5 Aprendizaje por refuerzo
3 Problema: Aprendizaje por refuerzo Cómo puede un agente autónomo, que percibe su entorno y actúa en ello, aprender a seleccionar las acciones óptimas que hay que ejecutar en cada estado para alcanzar sus objetivos? Ejemplo 1: un robot que aprende a navegar en su entorno El robot tiene sensores para observar las características de su entorno (estado) El robot puede moverse, coger objetos, etc., modificando así el estado de su entorno (acciones) El robot quiere aprender un mapeado estado acción para alcanzar sus objetivos (política de control) Ejemplo 2: un agente software que aprende a jugar al tres en raya El agente percibe la configuración del tablero (estado) El agente puede colocar sus fichas (acciones) El agente quiere aprender, para cada configuración del tablero, donde colocar su próxima ficha (política de control)
4 Suposición: Aprendizaje por refuerzo Los objetivos se pueden expresar a través de una función (reward) que asigna un valor numérico para cada acción que el agente ejecuta en cada estado Valores numéricos positivos informan al agente que la acción que acaba de ejecutar ha sido buena, mientras que valores negativos informan al agente que la acción que acaba de ejecutar ha sido mala
5 Aprendizaje por refuerzo El entorno transita en un nuevo estado y devuelve un valor que define cómo de buena fue la última acción El agente ejecuta acciones en su entorno El agente utiliza esta información para aprender la política de control, que determina la siguiente acción a ejecutar
6 Aprendizaje por refuerzo a 0 a 1 s 0 s 1 s 2 a 2 r 0 r 1 r 2 Objetivo: aprender a seleccionar las acciones que maximizan r 0 + γ r 1 + γ 2 r γ <1
7 Proceso de Markov Aprendizaje por refuerzo El agente percibe un conjunto S de estados de su entorno y posee un conjunto A de acciones disponibles En cada tiempo t, el agente percibe el estado actual s t, selecciona la acción a t y la ejecuta El entorno proporciona el reward r t = r(s t, a t ) y transita en el estado s t+1 = δ(s t, a t ). Suposición: Las funciones r y δ dependen solo del estado actual y del acción actual (proceso sin memoria) En general, el agente no conoce la forma funcional de r y δ, sólo descubre posibles valores interactuando con el entorno Las funciones r y δ pueden ser no deterministas. Ej: P(δ(s, a) = s ) = 0.7, P(δ(s, a) = s ) = 0.2, P(δ(s, a) = s ) = 0.1 Las funciones r y δ tienen que ser estacionarias. Las probabilidades no varían a lo largo del aprendizaje
8 Formalización del problema: Aprendizaje por refuerzo El agente quiere aprender la política π : S A que produzca el mayor reward acumulado en el tiempo, a partir de cualquier estado s t r t + γ r t+1 + γ 2 r t+2 + = Σ γ i r t+i = V π (s t ) i=0 V π ( s t ): reward acumulado que se consigue siguiendo la política π a partir de un estado inicial s t (i.e., utilidad de s t ) γ es una constante (0 γ < 1) que determina la importancia relativa de los reward inmediatos respecto a los rewards futuros. Si γ = 0, el agente es miope y solo maximiza los rewards inmediatos Si γ 1 el agente es más precavido
9 Aprendizaje por refuerzo Similitudes respecto a aprendizaje supervisado: Se trata de aproximar una función π : S A donde S es el conjunto de estados y A es el conjunto de acciones Diferencias respecto a aprendizaje supervisado: El agente no dispone de información de entrenamiento tipo < s, π * (s) >, donde π * (s) es la política óptima que se quiere aprender, sino de información del tipo <s, a, r>, donde r es el reward inmediato que se recibe al ejecutar a en s El entorno no dice al agente en el estado s 6 deberías haber ejecutado la acción a 3 en vez que la acción a 9, sino le dice en el estado s 6 la ejecución de la acción a 9 vale 34.5 El problema de la exploración: la información disponible depende de las acciones ejecutadas, por lo tanto el agente tiene que explorar el espacio de acciones, balanceando la ejecución de acciones que se sabe ser buenas y de acciones que nunca se han probado
10 Aprendizaje por refuerzo Ejemplo: Estados = cuadrados Transiciones = flechas (con reward) Estado arriba-derecha = objetivo +100
11 Ejemplo: valores de V * (s) Aprendizaje por refuerzo V * (3,1) V * (3,2) 89 γ = 0.9 V * (3,1)=100+γ 0+ =100 V * (3,2)=+γ 100+ =89 V * (3,3)=+γ ()+γ =79.1 Podemos ver como V * (s t ) = max[ r(s t,a) + γ V * (δ(s t+1,a)) ] a Є A V * (3,3) 79.1
12 Aprendizaje por refuerzo El objetivo del agente es aprender una función de evaluación numérica que implemente la política óptima. Entonces, vamos a aprender V * (s), de manera que el agente siempre preferirá s 1 a s 2 si V * (s 1 ) > V * (s 2 ) El problema es que el agente puede elegir entre acciones y no entre estados π * (s) = argmax[ r(s,a) + γ V * (δ(s,a)) ] = a argmax Q * (s, a) = a argmax [r(s,a) + γ max(q * (δ(s,a),a )] a a La acción óptima en el estado s es la acción a que maximiza la suma del reward inmediato r(s, a) con el reward acumulado del estado sucesor, V*(δ(s, a)), descontado por el factor γ
13 Aprendizaje por refuerzo Aprender la función Q * (s, a) corresponde a aprender la política óptima π, sin necesidad de conocer r y δ La política óptima consistirá en evaluar las posibles acciones disponibles en el estado s y seleccionar la acción a que maximiza Q * (s, a) En un determinado estado s, el valor de Q * (s, a), para cada a, resume en un único valor toda la información necesaria para determinar el reward acumulado que el agente ganará en el futuro si selecciona el acción a s t s t 44 s t a t = D Q(s t, a t ) = 41 Q(s t, a t ) = max(q(s t+1, a t+1 ))= = + 45 = 44 Sólo si δ(s,a) es determinista!
14 Ejemplo: valores de Q * (s,a) Aprendizaje por refuerzo γ = 0.9 Q * (3,1,U)=100+γ 0=100 Q * (3,2,U)=+γ 100=89 Q * (3,2,L)=+γ 79.1=70.2 Recordamos que Q * (s t,a) = r(s t,a) + γ V * (δ(s t+1,a))
15 Ejemplo: política óptima π (s) Aprendizaje por refuerzo
16 Aprendizaje por refuerzo: algoritmo general 01: for all (s, a) do 02: Q(s, a) inicializar // Q(s,a) es la estimación inicial de Q * (s,a) 03: end for 04: s observar estado entorno 05: a seleccionar acción // Política de selección de acciones 06: while s!= estado terminal do 07: ejecutar a 08: r reward 09: s nuevo estado 10: a seleccionar siguiente acción 11: Q(s, a) actualizar // Varias maneras de actualizar Q(s, a) 12: s s 13: a a 14: end while
17 Q-learning para entornos deterministas 01: for all (s, a) do 02: Q(s, a) inicializar // Q(s,a) es la estimación inicial de Q * (s,a) 03: end for 04: s observar estado entorno 05: a seleccionar acción // Política de selección de acciones 06: while s!= estado terminal do 07: ejecutar a 08: r reward 09: s nuevo estado 10: a seleccionar siguiente acción 11: Q(s, a) r + γ max Q(s, b) 12: s s 13: a a 14: end while b
18 Aprendizaje por refuerzo: Q-learning Que pasa si el entorno no es determinista? No puedo actualizar Q(s,a) con r + max(q(s,a )), por que sería como confiar que ejecutando la acción a en el estado s siempre se transita en el estado s Hay que actualizar Q(s,a) con una parte de esta información nueva que acabo de descubrir
19 Q-learning para entornos no deterministas 01: for all (s, a) do 02: Q(s, a) inicializar // Q(s,a) es la estimación inicial de Q * (s,a) 03: end for 04: s observar estado entorno 05: a seleccionar acción // Política de selección de acciones 06: while s!= estado terminal do 07: ejecutar a 08: r reward 09: s nuevo estado 10: a seleccionar siguiente acción 11: Q(s, a) Q(s, a) + α [r + γ max Q(s, b) Q(s,a)] 12: s s // 0<α <1: learning step 13: a a 14: end while b
20 La formula Aprendizaje por refuerzo: Q-learning Q(s, a) Q(s, a) + α [ r + γ max Q(s, b) - Q(s, a) ] estimación actualizada vieja estimación nueva informaciónvieja estimación b es muy recurrente en el aprendizaje por refuerzo α representa la porción de la diferencia entre la nueva información y la vieja estimación que se añade a la vieja estimación
21 Aprendizaje por refuerzo: Q-learning Q-learning garantiza la convergencia de Q(s, a) a Q * (s, a) si El entorno se puede modelar como un MDP En cada actualización i de Q(s,a) el learning step α es tal que α i = y α i2 < i=0 i=0 Ejemplo: α = 1/n(s,a), donde n(s,a) es el número de veces que se ha actualizado el valor Q(s,a) Cada pareja (s, a) es visitada un número infinito de veces El entorno es estacionario (es decir, la probabilidad de transitar de s a s ejecutando la acción a no varía en el tiempo)
22 Aprendizaje por refuerzo: Q-learning El agente necesita una política para seleccionar las acciones a ejecutar en un determinado estado s Política greedy P(s, a) = 1 si a=argmax Q(s, b) b 0 en caso contrario Hay riesgo de explotar demasiado acciones buenas, descubiertas al principio del aprendizaje, y no considerar acciones potencialmente mejores
23 Política ε-greedy Aprendizaje por refuerzo: Q-learning P(s, a) = 1 ε si a=argmax Q(s, b) b ε/( Α 1) en caso contrario Explora más que una política greedy Si Q(s, a 1 ) >> Q(s, a 2 ), las acciones a 1 y a 2 tienen la misma probabilidad de ser seleccionadas.
24 Política soft-max Aprendizaje por refuerzo: Q-learning P(s, a) = eq(s, a)/t eq(s, b)/t b Є A El parámetro Τ (temperatura) determina el grado de exploración Si Τ, todas las acciones son equiprobables Si Τ 0, la política soft-max se convierte en la política greedy Generalmente se reduce Τ con el tiempo, para garantizar la convergencia No siempre es fácil definir Τ, porque depende del orden de magnitud de Q(s, a)
25 Aprendizaje por refuerzo: Q-learning Q(s, a) se puede inicializar de manera pesimista (todo a 0) o de manera optimista, es decir, con valores mayores a los rewards esperados La inicialización optimista favorece la exploración ( porque?) s t a t = D Q(s t, a t ) = s t s t Q(s t, a t ) = max(q(s t+1, a t+1 ))= = + 9 = 8
26 SARSA para entornos no deterministas 01: for all (s, a) do 02: Q(s, a) inicializar // Q(s,a) es la estimación inicial de Q * (s,a) 03: end for 04: s observar estado entorno 05: a seleccionar acción // Política de selección de acciones 06: while s!= estado terminal do 07: ejecutar a 08: r reward 09: s nuevo estado 10: a seleccionar siguiente acción 11: Q(s, a) Q(s, a) + α [r + γ Q(s, a ) Q(s,a)] 12: s s // 0<α <1: learning step 13: a a 14: end while
27 Aprendizaje por refuerzo: SARSA La actualización de Q(s, a) depende de la quíntupla <s, a, r, s, a >, que da origen al nombre SARSA SARSA es un algoritmo on-policy, porque sigue y aprende la política de selección de acciones (que se basa en los valores Q(s, a) ) al mismo tiempo El valor Q(s, a) se actualiza usando el valor Q(s, a ) de la acción a que el agente ejecutará en la siguiente iteración. Q-learning es un algoritmo off-policy, porque aprende la política de selección de acciones independientemente de las acciones que el agente ejecuta El valor Q(s, a) se actualiza usando el valor max Q(s, b), aunque el b agente puede que ejecute una acción diferente de max Q(s, b) en la b siguiente iteración.
28 Q-learning vs SARSA Camino aprendido por SARSA Camino aprendido por Q-learning
29 Q-learning vs SARSA
30 Conclusión El aprendizaje puede ocurrir tanto de manera online como de manera offline. A ser posible, aprender la política óptima de manera offline y aplicarla en el problema real
31 Conclusión Uno de los mejores resultados: TD-Gammon [Tesauro 1995] Aprender a jugar al Backgammon Rewards: +100 si la acción que se ejecuta gana la partida 00 si la acción que se ejecuta pierde la partida 0 para todas las otras acciones Proceso de aprendizaje: 1.5 millones de partidas jugadas contra sí Proceso de aprendizaje: 1.5 millones de partidas jugadas contra sí mismo (!!!)
32 Conclusión Un algoritmo de aprendizaje por refuerzo, en su versión más simple, tiene que almacenar (por ejemplo en una tabla) un valor Q(s,a) para cada pareja estado-acción El ajedrez tiene estados!!!!! Representación compacta de los estados (p.e., red neuronal) Problemas con estados parcialmente observables Extensiones para espacios de estados y acciones continuos Aprender también la función de transición δ: SxA S (aprender el modelo del entorno) Reutilizar la función Q(s,a), que se ha aprendido para un determinado problema, para otro problema similar
CAPÍTULO 4: ALGORITMOS DE APRENDIZAJE
Capítulo 4 Algoritmos de Aprendizaje 26 CAPÍTULO 4: ALGORITMOS DE APRENDIZAJE En este capítulo se proporcionan las descripciones matemáticas de los principales algoritmos de aprendizaje para redes neuronales:
Más detallesAplicación de técnicas de aprendizaje automático sobre juegos
Escola Tècnica Superior d Enginyeria Informàtica Universitat Politècnica de València Aplicación de técnicas de aprendizaje automático sobre juegos Trabajo Fin de Grado Grado en Ingeniería Informática Autor:
Más detallesUNIDAD 4 PROCESOS DE MARKOV
UNIDAD 4 PROCESOS DE MARKOV Anteriormente se han cubierto modelos estáticos, esto es, modelos cuyos parámetros permanecen sin cambio a través del tiempo. Con excepción de programación dinámica donde se
Más detallesInteligencia Artificial Búsqueda entre adversarios
Inteligencia Artificial Búsqueda entre adversarios Primavera 27 profesor: Luigi Ceccaroni Juegos En los entornos multiagente (cooperativos o competitivos), cualquier agente tiene que considerar las acciones
Más detallesMétodos de Inteligencia Artificial
Métodos de Inteligencia Artificial L. Enrique Sucar (INAOE) esucar@inaoep.mx ccc.inaoep.mx/esucar Tecnologías de Información UPAEP Agentes Inteligentes Definición de Agente Tipos de agentes: Agentes con
Más detallesTema 5. Variables aleatorias discretas
Tema 5. Variables aleatorias discretas Resumen del tema 5.1. Definición de variable aleatoria discreta 5.1.1. Variables aleatorias Una variable aleatoria es una función que asigna un número a cada suceso
Más detallesOTHELLO MANUAL DEL USUARIO
OTHELLO MANUAL DEL USUARIO Enero, 1999 Pedro Pablo Gómez Martín Marco Antonio Gómez Martín Francisco Javier Cabello Torres 1 EL OTHELLO. CÓMO JUGAR El Othello es un juego para dos personas. Se juega sobre
Más detallesPuedes Desarrollar Tu Inteligencia
Puedes desarrollar tu Inteligencia (Actividad-Opción A) Puedes Desarrollar Tu Inteligencia Una nueva investigación demuestra que el cerebro puede desarrollarse como un músculo Muchas personas piensan que
Más detallesAprendizaje Automatizado
Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto
Más detallesLABORATORIO Nº 2 GUÍA PARA REALIZAR FORMULAS EN EXCEL
OBJETIVO Mejorar el nivel de comprensión y el manejo de las destrezas del estudiante para utilizar formulas en Microsoft Excel 2010. 1) DEFINICIÓN Una fórmula de Excel es un código especial que introducimos
Más detallesVECTORES. Módulo, dirección y sentido de un vector fijo En un vector fijo se llama módulo del mismo a la longitud del segmento que lo define.
VECTORES El estudio de los vectores es uno de tantos conocimientos de las matemáticas que provienen de la física. En esta ciencia se distingue entre magnitudes escalares y magnitudes vectoriales. Se llaman
Más detallesEste documento ha sido generado para facilitar la impresión de los contenidos. Los enlaces a otras páginas no serán funcionales.
Este documento ha sido generado para facilitar la impresión de los contenidos. Los enlaces a otras páginas no serán funcionales. Introducción Por qué La Geometría? La Geometría tiene como objetivo fundamental
Más detallesFORMACIÓN DE EQUIPOS DE E-LEARNING 2.0 MÓDULO DE DISEÑO Y PRODUCCIÓN DE MATERIALES UNIDAD 6 B
141 1 FORMACIÓN DE EQUIPOS DE E-LEARNING 2.0 Unidad 6 B 142 2 Índice SEGUIMIENTO DE PERSONAS 1 INFORMES 2 143 3 SEGUIMIENTO DE PERSONAS E INFORMES EN MOODLE El seguimiento de los participantes en Moodle
Más detallesEstrategias en Juegos
Estrategias en Juegos Reglas comunes a todos los juegos, salvo que se indique lo contrario: Torres Los juegos son para dos jugadores. Cada jugador mueve por turnos, según las reglas del juego. No puede
Más detallesI.1 Las siguientes afirmaciones son ciertas o falsas. Si una afirmación es cierta, ofrezca una explicación. Si es falsa ponga un contraejemplo.
Teoría de Juegos Examen de enero de 2013 Nombre Grupo: Tiene dos horas y media para completar el examen I Preguntas cortas (20 puntos) I1 Las siguientes afirmaciones son ciertas o falsas Si una afirmación
Más detallesTEMA 1. Introducción
TEMA 1. Introducción Francisco José Ribadas Pena, Santiago Fernández Lanza Modelos de Razonamiento y Aprendizaje 5 o Informática ribadas@uvigo.es, sflanza@uvigo.es 28 de enero de 2013 1.1 Aprendizaje automático
Más detallesUNIVERSIDAD DE ATACAMA FACULTAD DE INGENIERÍA / DEPARTAMENTO DE MATEMÁTICA
UNIVERSIDAD DE ATACAMA FACULTAD DE INGENIERÍA / DEPARTAMENTO DE MATEMÁTICA ESTADÍSTICA Y PROBABILIDADES GUÍA 2: PROBABILIDADES Profesor: Hugo S. Salinas Segundo Semestre 2010 1. Describir el espacio muestral
Más detallesManual de usuario. Tramitación de inspecciones periódicas de ascensores: La visión de las empresas conservadoras
Tramitación de inspecciones periódicas de ascensores: La visión de las empresas conservadoras 7 de Enero de 2008 Índice 1. INTRODUCCIÓN 3 2. SECUENCIAS PRINCIPALES A REALIZAR 4 2.1. FLUJO BASICO DE SECUENCIAS
Más detallesOncoBarómetro, Imagen social de las personas con cáncer. Resumen ejecutivo - 2013
OncoBarómetro, Imagen social de las personas con cáncer Resumen ejecutivo - 2013 1 El cáncer no es solo una enfermedad médica, sino también una realidad social. Sin duda, conocer dicha vertiente social
Más detallesResolución de Problemas
Introducción Resolución de Problemas La resolución de problemas es una capacidad que consideramos inteligente Somos capaces de resolver problemas muy diferentes Encontrar el camino en un laberinto Resolver
Más detallesPermutaciones y el Juego del 15
Boletín de la Asociación Matemática Venezolana, Vol. XII, No. 2 (2005) 259 DIVULGACIÓN MATEMÁTICA José Heber Nieto Permutaciones y el Juego del 15 Resumen En este trabajo se utilizan conceptos elementales
Más detallesSesión 3 - Movimiento Diferencial
Sesión 3 - Movimiento Diferencial Qué aprenderemos en esta sesión? Para entender como nuestro robot se va a desplazar por cualquier superficie, debemos aprender la manera en que lo hace, por eso, en esta
Más detallesJuegos Repetidos. Tema 2: Juegos repetidos un número infinito de veces. Universidad Carlos III de Madrid
Juegos Repetidos Tema : Juegos repetidos un número infinito de veces Universidad Carlos III de Madrid Sabemos que Si se juega un juego de etapa con un único EN un número finito de veces, haciendo inducción
Más detallesLÍMITES Y CONTINUIDAD
UNIDAD 5 LÍMITES Y CONTINUIDAD Páginas 0 y Describe las siguientes ramas: a) f () b) f () no eiste c) f () d) f () + e) f () f) f () + g) f () h) f () no eiste; f () 0 i) f () + f () + j) f () 5 4 f ()
Más detallesCentro de Capacitación en Informática
Fórmulas y Funciones Las fórmulas constituyen el núcleo de cualquier hoja de cálculo, y por tanto de Excel. Mediante fórmulas, se llevan a cabo todos los cálculos que se necesitan en una hoja de cálculo.
Más detallesdecisiones En términos de margen, cómo comparar el maíz temprano y el maíz tardío? nº 89 18 de agosto de 2015
nº 89 18 de agosto de 2015 En términos de margen, cómo comparar el maíz temprano y el maíz tardío? Con el objetivo de analizar los resultados esperables del maíz en esta campaña, y poder adelantarnos en
Más detallesJuegos Dinámicos: Info Completa. Tema 05. Profesor: Carlos R. Pitta. Análisis de Sectores Económicos
Universidad Austral de Chile Escuela de Ingeniería Comercial Análisis de Sectores Económicos Tema 05 Juegos Dinámicos: Info Completa Profesor: Carlos R. Pitta Análisis de Sectores Económicos, Prof. Carlos
Más detallesLección 4: Suma y resta de números racionales
GUÍA DE MATEMÁTICAS II Lección : Suma y resta de números racionales En esta lección recordaremos cómo sumar y restar números racionales. Como los racionales pueden estar representados como fracción o decimal,
Más detallesLiderazgo se genera en el lenguaje
Liderazgo se genera en el lenguaje Para nosotros, un buen punto de partida para comprender el liderazgo está en el reconocimiento de que éste se da en el lenguaje. El liderazgo es un fenómeno producido
Más detallesIntroducción a la Valoración de Empresas: Los Distintos Flujos de Caja
Introducción a la Valoración de Empresas: Los Distintos Flujos de Caja 2013 Instituto Europeo de Posgrado Contenido 1. Introducción 1.1 Análisis Detallado de los Diferentes Flujos de Caja de una Empresa
Más detallesx : N Q 1 x(1) = x 1 2 x(2) = x 2 3 x(3) = x 3
3 Sucesiones - Fernando Sánchez - - Cálculo I de números racionales 03 10 2015 Los números reales son aproximaciones que se van haciendo con números racionales. Estas aproximaciones se llaman sucesiones
Más detallesLlamamos potencia a todo producto de factores iguales. Por ejemplo: 3 4 = 3 3 3 3
1. NÚMEROS NATURALES POTENCIAS DE UN NÚMERO NATURAL Llamamos potencia a todo producto de factores iguales. Por ejemplo: 3 4 = 3 3 3 3 El factor que se repite es la base, y el número de veces que se repite
Más detallesFunciones, x, y, gráficos
Funciones, x, y, gráficos Vamos a ver los siguientes temas: funciones, definición, dominio, codominio, imágenes, gráficos, y algo más. Recordemos el concepto de función: Una función es una relación entre
Más detallesActividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos.
Apéndice C. Glosario A Actividades de coordinación entre grupos. Son dinámicas y canales de comunicación cuyo objetivo es facilitar el trabajo entre los distintos equipos del proyecto. Actividades integradas
Más detallesTema 5. Aproximación funcional local: Polinomio de Taylor. 5.1 Polinomio de Taylor
Tema 5 Aproximación funcional local: Polinomio de Taylor Teoría Los polinomios son las funciones reales más fáciles de evaluar; por esta razón, cuando una función resulta difícil de evaluar con exactitud,
Más detallesEste capítulo describirá la metodología usada para realizar la evaluación de la aplicación
Capítulo V. Evaluación de la aplicación móvil de RoX Este capítulo describirá la metodología usada para realizar la evaluación de la aplicación móvil de RoX, qué tipo de sujetos de prueba se usaron en
Más detallesResumen Charla: La Importancia de la Inteligencia Socio-Emocional (ISE) en la Industria Turística. Acciones diferentes para resultados diferentes
Resumen Charla: La Importancia de la Inteligencia Socio-Emocional (ISE) en la Industria Turística Acciones diferentes para resultados diferentes AEPT, Madrid, 13 de Octubre 2010 Somos profesionales formados
Más detallesJuegos. Esquema. Introducción: juegos como búsqueda Decisiones perfectas Decisiones imperfectas Poda α β
Juegos Transparencias IA (F29) M.Marcos, 2002 (Figuras c S.Russell & P.Norvig, 1998) 1 Esquema Introducción: juegos como búsqueda Decisiones perfectas Decisiones imperfectas Poda α β Transparencias IA
Más detallesHerramienta Solver. Activar Excel Solver
Herramienta Solver Introducción: Solver forma parte de una serie de comandos a veces denominados herramientas de análisis Y si. Con Solver, puede encontrar un valor óptimo (mínimo o máximo) para una fórmula
Más detallesTRABAJO POTENCIA Y ENERGÍA
TRABAJO POTENCIA Y ENERGÍA TRABAJO, POTENCIA Y ENERGÍA Todos habitualmente utilizamos palabras como trabajo, potencia o energía. En esta unidad precisaremos su significado en el contexto de la física;
Más detallesUna invitación al estudio de las cadenas de Markov
Una invitación al estudio de las cadenas de Markov Víctor RIVERO Centro de Investigación en Matemáticas A. C. Taller de solución de problemas de probabilidad, 21-25 de Enero de 2008. 1/ 1 Introducción
Más detallesManual de usuario de Solmicro BI. Página 1
Manual de usuario de Solmicro BI Página 1 Índice 1. Estructura general del sistema, 2. Estructura de presentación de la información, 3. Acceso a Solmicro BI y los diferentes cuadros de mando, 4. Partes
Más detallesJuegos deterministas. Ajedrez, damas, Go, Othello. barquitos
Árboles de juegos Análisis y Diseño de Algoritmos Tipos de juegos Juegos deterministas Juegos de azar Con información perfecta Con información imperfecta Ajedrez, damas, Go, Othello barquitos Backgammon,
Más detallesÍndice Introducción Números Polinomios Funciones y su Representación. Curso 0: Matemáticas y sus Aplicaciones Tema 1. Números, Polinomios y Funciones
Curso 0: Matemáticas y sus Aplicaciones Tema 1. Números, Polinomios y Funciones Leandro Marín Dpto. de Matemática Aplicada Universidad de Murcia 2012 1 Números 2 Polinomios 3 Funciones y su Representación
Más detallesBANCOS. Manejo de Bancos. Como crear una ficha de Banco? Como modificar los datos de una ficha de Banco? Como borrar una ficha de Banco?
BANCOS El Sistema de Gestión Administrativa permite el manejo de los movimientos bancarios. Seleccionada la opción de Bancos, el sistema presentara las siguientes opciones. Manejo de Bancos Manejo de movimientos
Más detallesFunciones vectoriales de variable vectorial. Son aplicaciones entre espacios eucĺıdeos, IR n, f : X IR n Y IR m
Funciones vectoriales de variable vectorial Son aplicaciones entre espacios eucĺıdeos, IR n, f : X IR n Y IR m x y x = (x 1, x 2,, x n ), y = (y 1, y 2,, y m ) e y j = f j (x 1, x 2,, x n ), 1 j n n =
Más detallesLa ventana de Microsoft Excel
Actividad N 1 Conceptos básicos de Planilla de Cálculo La ventana del Microsoft Excel y sus partes. Movimiento del cursor. Tipos de datos. Metodología de trabajo con planillas. La ventana de Microsoft
Más detallesV.4 Incertidumbre, Métodos Probabilísticos de Análisis de Alternativas
. Incertidumbre Nadie puede predecir el futuro. Sólo es posible formular hipótesis más o menos fundadas. Es un futuro que contiene un número indeterminado de resultados posibles, ninguno de los cuales
Más detallesMANUAL DE AYUDA HERRAMIENTA DE APROVISIONAMIENTO
MANUAL DE AYUDA HERRAMIENTA DE APROVISIONAMIENTO Fecha última revisión: Marzo 2016 INDICE DE CONTENIDOS HERRAMIENTA DE APROVISIONAMIENTO... 2 1. QUÉ ES LA HERRAMIENTA DE APROVISIONAMIENTO... 2 HERRAMIENTA
Más detallesd s = 2 Experimento 3
Experimento 3 ANÁLISIS DEL MOVIMIENTO EN UNA DIMENSIÓN Objetivos 1. Establecer la relación entre la posición y la velocidad de un cuerpo en movimiento 2. Calcular la velocidad como el cambio de posición
Más detallesMANUAL DE USUARIOS DEL MODULO DE EVALUACIÓN DE DESEMPEÑO SISTEMA DE ADMINISTRACIÓN DE SERVIDORES PÚBLICOS (SASP)
MINISTERIO DE ADMINISTRACIÓN PÚBLICA (MAP) Dirección de Tecnología de la Información y Comunicación MANUAL DE USUARIOS DEL MODULO DE EVALUACIÓN DE DESEMPEÑO SISTEMA DE ADMINISTRACIÓN DE SERVIDORES PÚBLICOS
Más detallesBúsqueda Heurística IV
Búsqueda Heurística IV Pedro Meseguer IIIA-CSIC Bellaterra, Spain pedro@iiia.csic.es 2 jugadores Búsqueda para juegos Perfecta información: cada jugador conoce toda la información del contrario no hay
Más detallesMATERIAL DE LECTURA 2014-2
MATERIAL DE LECTURA 2014-2 Parte de esta lectura ( pp 1-4) ha sido extraída del Libro : Contabilidad General Autor: Cevallos, Erly ( 2012),pp 157-160. solo para efectos didácticos. CPC: Mg.. José Henry
Más detallesTema 6: Ecuaciones e inecuaciones.
Tema 6: Ecuaciones e inecuaciones. Ejercicio 1. Encontrar, tanteando, alguna solución de cada una de las siguientes ecuaciones: 3 a) + 5 = 69 Probamos para =,3,4,... = = 3 3 = 4 4 3 3 3 + 5 = 13. + 5 =
Más detallesLa partida suele ser a 1.000 puntos, aunque ambos jugadores pueden determinar una puntuación diferente de antemano.
La Belote es un juego que ha alcanzado una gran popularidad en Francia por ser relativamente sencillo y muy atractivo. Objetivo del juego Cada jugador anunciará las combinaciones que tenga en las cartas
Más detallesComputación I Representación Interna Curso 2011
Computación I Representación Interna Curso 2011 Facultad de Ingeniería Universidad de la República Temario Representación de Números Enteros Representación de Punto Fijo Enteros sin signo Binarios puros
Más detallesTeoría de las decisiones y de los juegos 2007-2008 Grupo 51 Ejercicios - Tema 3 Juegos dinámicos con información completa (0, 2) 2 D (3, 0) 1 B I
Teoría de las decisiones y de los juegos 007-008 rupo 5 Ejercicios - Tema 3 Juegos dinámicos con información completa. Considere el siguiente juego en su forma extensiva. I (0, ) D (3, 0) I (, ) D (, 3)
Más detallesTRABAJO COOPERATIVO EN ROBOTS
SEMINARIO Diseño y construcción de microrrobots TRABAJO COOPERATIVO EN ROBOTS Autor: Luis De Santiago Rodrigo 3º Ingeniería de Telecomunicación 1.-ÍNDICE E INTRODUCCIÓN Éste trabajo pretende ser una pequeña
Más detallesMATEMÁTICAS APLICADAS A LAS C.C. SOCIALES
MATEMÁTICAS APLICADAS A LAS C.C. SOCIALES CAPÍTULO 7 Curso preparatorio de la prueba de acceso a la universidad para mayores de 25 años curso 2010/11 Nuria Torrado Robles Departamento de Estadística Universidad
Más detallesGestión de Permisos. Documento de Construcción. Copyright 2014 Bizagi
Gestión de Permisos Documento de Construcción Gestión de Permisos 1 Tabla De Contenido Descripción del Proceso... 3 Factores Importantes En La Construcción Del Proceso... 4 Modelo de Datos... 4 Principales
Más detallesModificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere.
UNIVERSIDAD DE CARABOBO FACULTAD DE CIENCIA Y TECNOLOGÍA DIRECCION DE EXTENSION COORDINACION DE PASANTIAS Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere. Pasante:
Más detallesEscuela Politécnica Superior de Ingeniería Departamento de Ingeniería Informática
Escuela Politécnica Superior de Ingeniería Departamento de Ingeniería Informática Fundamentos de la informática 2. Algoritmos, diagramas de flujo y pseudocódigo Contenido Algoritmos Diagramas de flujo
Más detallesPUNTAJE AUDIT-C (suma puntaje de preguntas 1-3)
AUDIT Test de identicación de trastornos por consumo de alcohol Lea las preguntas tal como están escritas. Registre las respuestas cuidadosamente. Empiece el AUDIT diciendo "Ahora voy a hacerle algunas
Más detallesMATEMÁTICAS CON LA HOJA DE CÁLCULO
MATEMÁTICAS CON LA HOJA DE CÁLCULO Podemos dar a esta aplicación un uso práctico en el aula de Matemáticas en varios sentidos: Como potente calculadora: sucesiones, límites, tablas estadísticas, parámetros
Más detallesSoluciones a los problemas Olimpiada de Matemáticas Fase local Extremadura Enero de 2015
Olimpiada atemática Española RSE Soluciones a los problemas Olimpiada de atemáticas Fase local Extremadura Enero de 2015 1. lrededor de una mesa circular están sentadas seis personas. ada una lleva un
Más detallesREMUNERACIÓN ADICIONAL POR PROYECTOS I+D+I CON FINANCIACIÓN EXTERNA Y ACTIVIDADES AFINES. DOCENCIA ADICIONAL
REMUNERACIÓN ADICIONAL POR PROYECTOS I+D+I CON FINANCIACIÓN EXTERNA Y ACTIVIDADES AFINES. DOCENCIA ADICIONAL (Aprobado por la Junta de Gobierno en la sesión celebrada el 26 de septiembre de 2003 y modificado
Más detallesEL ÚNICO Sistema Inalámbrico de Supervisión para Hotel
Patended System EL ÚNICO Sistema Inalámbrico de Supervisión para Hotel El sistema de control de BE ENERGY Hotel Control System (HCS) genera un entorno multifuncional inalámbrico, para gestionar, supervisar
Más detallesCAPITULO 3 REDES HIBRIDAS-COMPLEJAS. 3.1 Descripción de la Red Híbrida Compleja (HCNN)
CAPITULO 3 REDES HIBRIDAS-COMPLEJAS 3.1 Descripción de la Red Híbrida Compleja (HCNN) La predicción de eventos caóticos que se presentan en un mundo que nos rodea es de gran interés. Especialmente en aquellos
Más detallesUNIVERSIDAD DE ATACAMA
UNIVERSIDAD DE ATACAMA FACULTAD DE INGENIERÍA / DEPARTAMENTO DE MATEMÁTICA ESTADÍSTICA Y PROBABILIDAD GUÍA DE TRABAJO 2 Profesor: Hugo S. Salinas. Primer Semestre 2010 1. La dureza Rockwell de un metal
Más detallesUniversidad Carlos III de Madrid Teoría de Juegos Lista de Ejercicios de Juegos Repetidos y Bayesianos
Sesión 1: 1, 2, 3, 4 Sesión 2: 5, 6, 8, 9 Universidad Carlos III de Madrid Teoría de Juegos Lista de Ejercicios de Juegos Repetidos y Bayesianos 1. Considere el siguiente juego en forma normal: Jugadora
Más detallesSergio Peñalba Lopez NIA: 100021533
Autor: Sergio Peñalba Lopez NIA: 100021533 INTRODUCCIÓN CodeRuler es un juego en el que se simula un reino medieval en el que los jugadores deben competir manejando una serie de elementos programables,
Más detallesENSEÑA A TU HIJO HABILIDADES SOCIALES Y A SOLUCIONAR SUS PROBLEMAS
ENSEÑA A TU HIJO HABILIDADES SOCIALES Y A SOLUCIONAR SUS PROBLEMAS En el desarrollo del niño, se considera fundamental el proceso de socialización, y para ello es necesario tener un buen repertorio de
Más detallesTema : ELECTRÓNICA DIGITAL
(La Herradura Granada) Departamento de TECNOLOGÍA Tema : ELECTRÓNICA DIGITAL.- Introducción. 2.- Representación de operadores lógicos. 3.- Álgebra de Boole. 3..- Operadores básicos. 3.2.- Función lógica
Más detallesPráctica 7. Problemas de diseño de topologías de red con herramienta Net2Plan
TEORÍA DE REDES DE TELECOMUNICACIONES Grado en Ingeniería Telemática Grado en Ingeniería en Sistemas de Telecomunicación Curso 2012-2013 Práctica 7. Problemas de diseño de topologías de red con herramienta
Más detallesLECCIÓN 10 DASHBOARD. Cómo añadir Gráficos al Dashboard?
LECCIÓN 10 DASHBOARD Cómo añadir Gráficos al Dashboard? Agregar Gráficos al Dashboard es muy fácil, simplemente debemos ingresar al Dashboard que hayamos creado, y en el navegador de configuración en la
Más detallesMANUAL DE USUARIO. Sistema de Administración de Proyectos de Vinculación con la Colectividad (SAPVC) MANUAL DE USUARIO DOCENTE
PAGINA: 1 / 17 MANUAL DE USUARIO DOCENTE SISTEMA DE ADMINISTRACIÓN DE PROYECTOS DE VINCULACIÓN CON LA COLECTIVIDAD (SAPVC) UPSE PAGINA: 2 / 17 ÍNDICE 1 Introducción... 3 2 Generalidades del Sistema...
Más detallesDiseño Estructurado de Algoritmos
Diseño Estructurado de Algoritmos 1 Sesión No. 5 Nombre: Primitivas para el diseño de instrucciones. Segunda parte. Objetivo de la sesión: Al concluir la sesión el estudiante identificará las diferentes
Más detallesIntroducción a los certificados digitales
Sergio Talens-Oliag InfoCentre (http://www.infocentre.gva.es/) stalens@infocentre.gva.es Introducción Los certificados digitales son el equivalente digital del DNI, en lo que a la autentificación de individuos
Más detallesReto presencial 1. Juegos de todo el mundo
Reto presencial 1 Juegos de todo el mundo ÍNDICE PRESENTACIÓN... 3 DESCRIPCIÓN DE LA SESIÓN... 3 1. Título de la actividad... 3 2. Actividad... 3 3. Objetivos... 4 4. Materiales que tenemos que utilizar...
Más detallesDescomposición factorial de polinomios
Descomposición factorial de polinomios Contenidos del tema Introducción Sacar factor común Productos notables Fórmula de la ecuación de segundo grado Método de Ruffini y Teorema del Resto Combinación de
Más detallesMACROECONOMÍA II Licenciatura en Administración y Dirección de Empresas Marzo 2004
MACROECONOMÍA II Licenciatura en Administración y Dirección de Empresas Marzo 2004 EL TIO DE CAMBIO REAL El tipo de cambio nominal expresa el precio de una moneda en términos de otra. or ejemplo, el tipo
Más detallesSelectividad Septiembre 2009 SEPTIEMBRE 2009. Opción A
SEPTIEMBRE 2009 Opción A 1.- Como cada año, el inicio del curso académico, una tienda de material escolar prepara una oferta de 600 cuadernos, 500 carpetas y 400 bolígrafos para los alumnos de un IES,
Más detalles_ Antología de Física I. Unidad II Vectores. Elaboró: Ing. Víctor H. Alcalá-Octaviano
24 Unidad II Vectores 2.1 Magnitudes escalares y vectoriales Unidad II. VECTORES Para muchas magnitudes físicas basta con indicar su valor para que estén perfectamente definidas y estas son las denominadas
Más detallesINCREMENTOS CAPÍTULO 2 2.1 CONCEPTO
CAPÍTULO INCREMENTOS. CONCEPTO Supóngase que se tiene una función cualquiera, por ejemplo x, a la cual se le asigna arbitrariamente cualquier valor inicial como x = 3, de donde corresponde que 9. Se quiere
Más detallesFundamentos de Investigación de Operaciones Investigación de Operaciones 1
Fundamentos de Investigación de Operaciones Investigación de Operaciones 1 1 de agosto de 2003 1. Introducción Cualquier modelo de una situación es una simplificación de la situación real. Por lo tanto,
Más detallesANÁLISIS DE UN JUEGO DE CARTAS: LAS SIETE Y MEDIA
ANÁLISIS DE UN JUEGO DE CARTAS: LAS SIETE Y MEDIA MaMaEuSch (Management Mathematics for European School) http://www.mathematik.uni-kl.de/~mamaeusch/ Modelos matemáticos orientados a la educación Clases
Más detallesUnidad III: Programación no lineal
Unidad III: Programación no lineal 3.1 Conceptos básicos de problemas de programación no lineal Programación no lineal (PNL) es el proceso de resolución de un sistema de igualdades y desigualdades sujetas
Más detallesProbabilidad: problemas resueltos
Probabilidad: problemas resueltos BENITO J. GONZÁLEZ RODRÍGUEZ (bjglez@ull.es) DOMINGO HERNÁNDEZ ABREU (dhabreu@ull.es) MATEO M. JIMÉNEZ PAIZ (mjimenez@ull.es) M. ISABEL MARRERO RODRÍGUEZ (imarrero@ull.es)
Más detallesClase de apoyo de matemáticas Ángulos Escuela 765 Lago Puelo Provincia de Chubut
Clase de apoyo de matemáticas Ángulos Escuela 765 Lago Puelo Provincia de Chubut Este texto intenta ser un complemento de las clases de apoyo de matemáticas que se están realizando en la escuela 765 de
Más detallesEstructuras de Datos y Algoritmos. Árboles de Expresión
Estructuras de Datos y Algoritmos Árboles de Expresión Año 2014 Introducción Los avances tecnológicos producen día a día una gran cantidad de información que debe ser almacenada y procesada en forma eficiente.
Más detallesTema 1: Fundamentos de lógica, teoría de conjuntos y estructuras algebraicas: Apéndice
Tema 1: Fundamentos de lógica, teoría de conjuntos y estructuras algebraicas: Apéndice 1 Polinomios Dedicaremos este apartado al repaso de los polinomios. Se define R[x] ={a 0 + a 1 x + a 2 x 2 +... +
Más detallesCASO PRÁCTICO DISTRIBUCIÓN DE COSTES
CASO PRÁCTICO DISTRIBUCIÓN DE COSTES Nuestra empresa tiene centros de distribución en tres ciudades europeas: Zaragoza, Milán y Burdeos. Hemos solicitado a los responsables de cada uno de los centros que
Más detallesFigure 16-1: Phase H: Architecture Change Management
Fase H Administración del cambio en la Arquitectura Figure 16-1: Phase H: Architecture Change Management Objetivos Los objetivos de la Fase H son: Asegurarse de que el ciclo de vida de arquitectura se
Más detallesCAPÍTULO 5. 5.3 La Distribución Normal
CAPÍTULO 5 5.3 La Distribución Normal Si una variable aleatoria X tiene una distribución Normal y queremos calcular la probabilidad de que X caiga entre dos valores a y b entonces, debemos hallar el área
Más detalles16.36: Ingeniería de sistemas de comunicación. Clase 15: ProtocolosARQ. Eytan Modiano
16.36: Ingeniería de sistemas de comunicación Clase 15: ProtocolosARQ Eytan Modiano Solicitud de repetición automática (ARQ) Divide archivos de gran tamaño en paquetes ARCHIVO PKT H PKT H PKT H Comprueba
Más detallesOrientación para el profesor
Nombre de la actividad: JUEGOS Y JUGUETES Los juguetes más sofisticados no necesariamente son los más divertidos. Hay muchos objetos que se pueden convertir en maravillosos juguetes si promovemos en los
Más detallesTema 4: Ahorro óptimo y crecimiento económico
Tema 4: Ahorro óptimo y crecimiento económico Introducción Relación entre el capital por trabajador y el consumo per capita en el estado estacionario: la regla de oro de acumulación del capital Horizontes
Más detallesLOS QUE VINIERON ANTES DE MÍ
National Aeronautics and Space Administration LOS QUE VINIERON ANTES DE MÍ Sección para el Estudiante Nombre del Estudiante Objetivos de la Lección Esta lección mostrará los beneficios de aprender de las
Más detalles