- PDF Free Download

Documentos relacionados

Algoritmos: Diseño de algoritmos por inducción

Matrices. Definiciones básicas de matrices. José de Jesús Angel Angel.

Cómo?: Resolviendo el sistema lineal homógeneo que satisfacen las componentes de cualquier vector de S. x4 = x 1 x 3 = x 2 x 1

Resolución de Problemas

Ecuaciones de primer grado con dos incógnitas

1. Objetivos. 2. Idea Principal. Teoría de Autómatas y Lenguajes Formales. Boletín de Autoevaluación 3: Cómo se minimiza un AFD?.

3.- DETERMINANTES. a 11 a 22 a 12 a 21

Sistemas de Numeración

Text Mining: Distancia de Levenshtein

Tema 7: Optimización sobre Redes Muchos de los problemas de Investigación Operativa pueden modelizarse y resolverse sobre un grafo: conjunto de

Introducción a la Teoría de Grafos

TEMA 2: Representación de la Información en las computadoras

Matrices equivalentes. El método de Gauss

Base de datos en Excel

MODELOS DE RECUPERACION

1 v 1 v 2. = u 1v 1 + u 2 v u n v n. v n. y v = u u = u u u2 n.

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases.

Análisis de componentes principales

Apuntes de Grafos. 1. Definiciones

CURSO CERO. Departamento de Matemáticas. Profesor: Raúl Martín Martín Sesiones 18 y 19 de Septiembre

Curso cero Matemáticas en informática :

Ingeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007

Un grafo G es un par (V,E) donde V es un conjunto (llamado conjunto de vértices) y E un subconjunto de VxV (conjunto de aristas).

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros.

Universidad Nacional de Quilmes Ing. en Automatización y Control Industrial Cátedra: Visión Artificial Agosto de 2005

Tema 6: Morfología. Primera parte

H E R R A M I E N T A S D E A N Á L I S I S D E D A T O S HERRAMIENTAS DE ANÁLISIS DE DATOS

Práctica 5. Curso

BREVE MANUAL DE SOLVER

Informática Bioingeniería

SISTEMAS NUMERICOS CAMILO ANDREY NEIRA IBAÑEZ UNINSANGIL INTRODUCTORIO A LA INGENIERIA LOGICA Y PROGRAMACION

Tecnologías en la Educación Matemática. Expresiones. Datos. Expresiones Aritméticas. Expresiones Aritméticas 19/08/2014

Matrices invertibles. La inversa de una matriz

Un programa entero de dos variables Jueves, 4 de abril. La región factible. Por qué programación entera? Variables 0-1

Matrices Invertibles y Elementos de Álgebra Matricial

3. Equivalencia y congruencia de matrices.

Ampliación de Estructuras de Datos

Algoritmos sobre Grafos

Sistemas de amortización

Análisis de los datos

Codd propuso estos tres lenguajes como base teórica de cualquier lenguaje que quisiera cumplir con los requisitos formales del modelo.

Tema 07. LÍMITES Y CONTINUIDAD DE FUNCIONES

Comenzando con MATLAB

PROYECTO DE LA REAL ACADEMIA DE CIENCIAS Estímulo del talento matemático

Tema 6. Reutilización de código. Programación Programación - Tema 6: Reutilización de código

Tema 2: Modelo Entidad-Relación(ER)

Definición Dados dos números naturales m y n, una matriz de orden o dimensión m n es una tabla numérica rectangular con m filas y n columnas.

Ahora podemos comparar fácilmente las cantidades de cada tamaño que se vende. Estos valores de la matriz se denominan elementos.

ANÁLISIS DE BALANCES CON EL NUEVO PGC DE 2008

Capítulo 12: Indexación y asociación

Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología

Lección 4: Suma y resta de números racionales

TABLA DE DECISION. Consideremos la siguiente tabla, expresada en forma genérica, como ejemplo y establezcamos la manera en que debe leerse.

Complejidad - Problemas NP-Completos. Algoritmos y Estructuras de Datos III

Subespacios vectoriales en R n

EJERCICIOS DE MATEMÁTICAS I HOJA 4. Ejercicio 1. Se consideran los vectores

Ejemplos de conversión de reales a enteros

SISTEMAS INTELIGENTES

E 1 E 2 E 2 E 3 E 4 E 5 2E 4

Tema 2. Espacios Vectoriales Introducción

PROGRAMACIÓN LINEAL Introducción Inecuaciones lineales con 2 variables

Copia de Seguridad en windows

Hoja1!C4. Hoja1!$C$4. Fila

FICHERO MUESTRA Pág. 1

Estructuras algebraicas

FICHEROS Y BASES DE DATOS (E44) 3º INGENIERÍA EN INFORMÁTICA. Tema 8. Elementos Básicos

ETSIINGENIO 2009 DIBUJO DE GRAFOS MEDIANTE ALGORITMOS GENÉTICOS

Tema 7: Programación con Matlab

Lección 24: Lenguaje algebraico y sustituciones

CAPITULO 4. Requerimientos, Análisis y Diseño. El presente capítulo explica los pasos que se realizaron antes de implementar

Redes de Kohonen y la Determinación Genética de las Clases

x y 8000 x + y a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas.

Tema 3. Medidas de tendencia central Introducción. Contenido

1. Lección 5 - Comparación y Sustitución de capitales

Programación I: Funciones y módulos

INTRODUCCIÓN A LA PROBABILIDAD.

Programación de Sistemas

GENERACIÓN DE ANTICIPOS DE CRÉDITO

Álgebra Relacional. Unidad 5

Espacios generados, dependencia lineal y bases

ETS Caminos Santander. Curso Ejercicios de introducción a la programación.

ANÁLISIS SEMÁNTICO. Especificación formal: Semántica Operacional, semántica denotacional, semántica Axiomática, Gramáticas con Atributos.

2014 Néstor A. Jiménez J. Derechos reservados. Celular

1. Producto escalar, métrica y norma asociada

GENERACIÓN DE TRANSFERENCIAS

Módulo 9 Sistema matemático y operaciones binarias

Sistemas de numeración

Árboles AVL. Laboratorio de Programación II

1. Ecuaciones no lineales

Apuntes de Matemática Discreta 7. Relaciones de Orden

Unidad de trabajo 2: INFORMÁTICA BÁSICA (primera parte)

Capitán de fragata ingeniero AGUSTÍN E. GONZÁLEZ MORALES. ÁLGEBRA PARA INGENIEROS (Solucionario)

TEMA 8.- DISEÑO TEORICO DE BASES DE DATOS RELACIONALES. 1. TEORÍA DE LAS DEPENDENCIAS FUNCIONALES

Colegio Salesiano Don Bosco Academia Reparación Y Soporte Técnico V Bachillerato Autor: Luis Orozco. Subneteo

Sistemas Digitales Ingeniería Técnica en Informática de Sistemas Curso Aritmética binaria

Tutorial de Subneteo Clase A, B, C - Ejercicios de Subnetting CCNA 1

Bases de datos en Excel

EJERCICIOS SOBRE : DIVISIBILIDAD

Transcripción:

Análisis y Diseño de Algoritmos Introducción Elementos de la programación dinámica Principio de optimalidad de Bellman Definición recursiva de la solución óptima Cálculo de la solución óptima Ejemplos Multiplicación encadenada de matrices Subsecuencia de mayor longitud (LCS) Selección de actividades con pesos Problema de la mochila Caminos mínimos: Algoritmos de Floyd y Bellman-Ford Distancia de edición Aplicaciones

Esta técnica se aplica sobre problemas que presentan las siguientes características: Subproblemas optimales: La solución óptima a un problema puede ser definida en función de soluciones óptimas a subproblemas de tamaño menor. Solapamiento entre subproblemas: Al plantear la solución recursiva del problema, un mismo problema se resuelve más de una vez. 2 Enfoque ascendente (bottom-up): Primero se calculan las soluciones óptimas para problemas de tamaño pequeño. Luego, utilizando dichas soluciones, encuentra soluciones a problemas de mayor tamaño. Clave: Memorización Almacenar las soluciones de los subproblemas en alguna estructura de datos para reutilizarlas posteriormente. De esa forma, se consigue un algoritmo más eficiente que la fuerza bruta, que resuelve el mismo subproblema una y otra vez. 3

Memorización Para evitar calcular lo mismo varias veces: Cuando se calcula una solución, ésta se almacena. Antes de realizar una llamada recursiva para un subproblema Q, se comprueba si la solución ha sido obtenida previamente: Si no ha sido obtenida, se hace la llamada recursiva y, antes de devolver la solución, ésta se almacena. Si ya ha sido previamente calculada, se recupera la solución directamente (no hace falta calcularla). Usualmente, se utiliza una matriz que se rellena conforme las soluciones a los subproblemas son calculados (espacio vs. tiempo). 4 Uso de la programación dinámica:. Caracterizar la estructura de una solución óptima. 2. Definir de forma recursiva la solución óptima. 2. 3. Calcular la solución óptima de forma ascendente. 4. Construir la solución óptima a partir de los datos almacenados al obtener soluciones parciales. 5

Estrategias de diseño Algoritmos greedy: Se construye la solución incrementalmente, utilizando un criterio de optimización local. Programación dinámica: Se descompone el problema en subproblemas solapados y se va construyendo la solución con las soluciones de esos subproblemas. Divide y vencerás: Se descompone el problema en subproblemas independientes y se combinan las soluciones de esos subproblemas. 6 Principio de Optimalidad Para poder emplear programación dinámica, una secuencia óptima debe cumplir la condición de que cada una de sus subsecuencias también sea óptima: Dado un problema P con n elementos, si la secuencia óptima es e e 2...e k...e n entonces: e e 2...e k es solución al problema P considerando los k primeros elementos. k+...e n es solución al problema P considerando los elementos desde k+ hasta n. e k+

Principio de Optimalidad En otras palabras: La solución óptima de cualquier instancia no trivial de un problema es una combinación de las soluciones óptimas de sus subproblemas. Se busca la solución óptima a un problema como un proceso de decisión multietápico. Se toma una decisión en cada paso, pero ésta depende de las soluciones a los subproblemas que lo componen. 8 Principio de Optimalidad Un poco de historia: Bellman, años 5 Enfoque está inspirado en la teoría de control: Se obtiene la política óptima para un problema de control con n etapas basándose en una política óptima para un problema similar, pero de n- etapas. Etimología: Programación dinámica = Planificación temporal En una época hostil a la investigación matemática, Bellman buscó un nombre llamativo que evitase posibles confrontaciones: it's impossible to use dynamic in a pejorative sense something not even a Congressman could object to Richard E. Bellman: Eye of the Hurricane: An Autobiography 9

Principio de Optimalidad Principio de Optimalidad de Bellman [Bellman, R.E.: Dynamic Programming. Princeton University Press, 95] Una política óptima tiene la propiedad de que, sean cuales sea el estado inicial y la decisión inicial, las decisiones restantes deben constituir una solucíón óptima con respecto al estado resultante de la primera decisión. En Informática, un problema que puede descomponerse de esta forma se dice que presenta subestructuras optimales (la base de los algoritmos greedy y de la programación dinámica). ). Principio de Optimalidad Principio de Optimalidad de Bellman [Bellman, R.E.: Dynamic Programming. Princeton University Press, 95] El principio de optimalidad se verifica si toda solución óptima a un problema está compuesta por soluciones óptimas de sus subproblemas. Ojo! El principio de optimalidad no nos dice que, si tenemos las soluciones óptimas de los subproblemas, entonces podamos combinarlas para obtener la solución óptima del problema original

Principio de Optimalidad Principio de Optimalidad de Bellman [Bellman, R.E.: Dynamic Programming. Princeton University Press, 95] Ejemplo: Cambio en monedas La solución óptima para. euros es.5 +.2 euros. La solución óptima para.6 euros es.5 +. euros. La solución óptima para.3 euros no es (.5 + 2) + (.5 +.) euros. Sin embargo, sí que existe alguna forma de descomponer.3 euros de tal forma que las soluciones óptimas a los subproblemas nos den una solución óptima (p.ej... y.2 euros). 2 Definición del problema Para aplicar programación dinámica:. Se comprueba que se cumple el principio de optimalidad de Bellman, para lo que hay que encontrar la estructura de la solución. 2. Se define recursivamente la solución óptima del problema (en función de los valores de las soluciones para subproblemas de menor tamaño). 3

y cálculo de la solución óptima 3. Se calcula el valor de la solución óptima utilizando un enfoque ascendente: Se determina el conjunto de subproblemas que hay que resolver (el tamaño de la tabla). Se identifican los subproblemas con una solución trivial (casos base). Se van calculando los valores de soluciones más complejas a partir de los valores previamente calculados. 4. Se determina la solución óptima a partir de los datos almacenados en la tabla. 4 Ejemplos Sucesión de Fibonacci fib( n) = fib( n ) + fib( n 2) Implementación recursiva: O(ϕ n ) Implementación usando programación dinámica: Θ(n) if (n == ) return ; else if (n == ) return ; else { previo = ; actual = ; for (i=; i<n; i++) { fib = previo + actual; previo = actual; actual = fib; return actual; 5

Ejemplos Números combinatorios: Combinaciones de n sobre p Implementación inmediata n p = n! p!( n p)! Implementación usando programación dinámica Triángulo de Pascal n n n = + p p p 6 Ejemplos Números combinatorios: Combinaciones de n sobre p n n n = + p p p Orden de eficiencia: Θ(np)

Ejemplos Números combinatorios: Combinaciones de n sobre p int combinaciones (int n, int p) { for (i=; i<=n; i++) { for (j=; j<=min(i,p); j++) { if ((j==) (j==i)) c[i][j] = else return c[n][p]; c[i][j] = c[i-][j ]+c[i-][j]; ][j]; n n n = + p p p Orden de eficiencia: Θ(np) en tiempo, Θ(np) en espacio. 8 Ejemplos Números combinatorios: Combinaciones de n sobre p int combinaciones (int n, int p) { b[] = ; for (i=; i<=n; i++) { b[i] = ; for (j=i ; j>; j--) { b[j] += b[j ]; return b[p]; n n n = + p p p Orden de eficiencia: Θ(np) en tiempo, Θ(n) en espacio. 9

Devolver el cambio Existen casos para los que no se puede aplicar el algoritmo greedy (por ejemplo, devolver 8 peniques con monedas de 6, 4 y penique). Definición recursiva de la solución cambio({ m,..., mi, C) cambio({ m,..., mi, C) = min + cambio({ m,..., mi, C mi ) Cálculo de la solución con programación dinámica: Orden de eficiencia proporcional al tamaño de la tabla, O(Cn), donde n es el número de monedas distintas. 2 Devolver el cambio cambio({ m,..., m, C) i = cambio({ m,..., mi, C) min + cambio({ m,..., mi, C mi ) 2 3 4 5 6 8 { 2 3 4 5 6 8 {,4 2 3 2 3 4 2 {,4,6 2 3 2 2 2 m={,4,6, C=8 Solución: 2 monedas, S={4,4. 2

Multiplicación encadenada de matrices Propiedad asociativa del producto de matrices: Dadas las matrices A (x), A 2 (x5) y A 3 (5x5), (A A 2 )A 3 implica 5 multiplicaciones A (A 2 A 3 ) implica 5 multiplicaciones Parentizaciones posibles: = n P( n) k= P( k) P( n k) si si n= n> 4 n n Ω 2 22 Multiplicación encadenada de matrices Si cada matriz A k tiene un tamaño p k- p k, el número de multiplicaciones necesario será: m (, n ) = m (, k ) + m ( k +, n ) + p p p k n A x A 2 x A 3 x x A k x A k+ x A k+2 x x A n De forma general: m( i, j) = mi (, k) + m( k+, j) + pi p k p j 23

Multiplicación encadenada de matrices Matriz A k de tamaño p k- p k Definición recursiva de la solución óptima: Si i=j, entonces mi (, j) = Si i j, entonces { mi (, k) + m( k+, j) + p p p m( i, j) = min i i k< j k j A x A 2 x A 3 x x A k x A k+ x A k+2 x x A n 24 Multiplicación encadenada de matrices Implementación: Tenemos n 2 subproblemas distintos m(i,j i,j). Para calcular m(i,j i,j) necesitamos los valores almacenados en la fila i y en la columna j { mi (, k) + m( k+, j) + p p p m( i, j) = min i i k< j Para calcular cada valor necesitamos O(n), por lo que el algoritmo resultante es de orden O(n 3 ). k j 25

Multiplicación encadenada de matrices Implementación: for (i=; i<=n; i++) m[i,i i,i] = ; for (s=2; s<=n; l++) for (i=; i<=n-s+; i++) { j = i+s-; m[i,j i,j] = ; for (k=i; k<=j-; k++) { q = m[i,k] + m[k+,j] + p[i-]*p[k]p[j] if (q < m[i,j]) { m[i,j i,j] = q; s[i,j i,j] = k; 26 Multiplicación encadenada de matrices Implementación: // Suponiendo que hemos calculado previamente s[i,j] MultiplicaCadenaMatrices (A, i, j) { if (j>i) { x = MultplicaCadenaMatrices (A, i, s[i,j]); y = MultplicaCadenaMatrices (A, s[i,j]+, j); return MultiplicaMatrices(x, y); else { return A[i]; 2

Subsecuencia de mayor longitud (LCS) Problema: Comparar dos cadenas y encontrar la subsecuencia común de mayor longitud. Ejemplo: Cadenas: X = (A B C B D A B), Y = (B D C A B A), Subsecuencia común de mayor longitud: LCS = (B C B A) X = ( A B C B D A B ) Y = ( B D C A B A ) 28 Subsecuencia de mayor longitud (LCS) Un algoritmo de fuerza bruta compararía cualquier subsecuencia de X con los símbolos de Y: Si X =m, Y =n, entonces hay 2 m subsecuencias de X que debemos comparar con Y (n comparaciones), por lo que nuestro algoritmo sería de orden O(n2 m ). Sin embargo, LCS tiene subestructuras optimales: Si buscamos la LCS para pares de prefijos de X e Y, podemos calcular la solución de nuestro problema 29

Subsecuencia de mayor longitud (LCS) Si buscamos la LCS para pares de prefijos de X e Y, podemos calcular la solución de nuestro problema X i Prefijo de X de longitud i. Y j Prefijo de Y de longitud j. c(i,j i,j) Longitud de la LCS para X i e Y j. c( i, c( i, j ) + j) = max{ c( i, j), c( i, j ) si x[ i] = y[ j] enotrocaso La longitud de la subsecuencia de mayor longitud (LCS) de X e Y será c(m,n m,n), con X =m, Y =n. 3 Subsecuencia de mayor longitud (LCS) Definición recursiva de la solución: Caso base: c(,) = c(,j) = c(i,) = Cálculo recursivo: (Subcadena vacía) (LCS de la cadena vacía y cualquier otra cadena) Primer caso (x[i]=y[j]=s): Se emparejan ambos símbolos y la LCS aumenta de longitud: LCS(X i,y j )= LCS(X i-,y j- )+{s. Segundo caso (x[i] y[j]): No se pueden emparejar los símbolos x[i] e y[j], por lo que LCS(X i,y j ) será la mejor entre LCS(X i-,y j ) y LCS(X i,y j- ). ). 3

Subsecuencia de mayor longitud (LCS) Implementación iterativa del algoritmo: int[][] LCS (X, Y) { for (i=; i<=x.length; i++) c[i][]=; // Y for (j=; j<=t.length; j++) c[][j]=; // X for (i=; i<=x.length; i++) // X i for (j=; j<=y.length; j++) // Y j if ( X[i] == Y[j] ) c[i][j] = c[i-][j-] + ; else c[i][j] = max ( c[i-][j], c[i][j-] ); return c; 32 Subsecuencia de mayor longitud (LCS) Ejemplo: X = (A B C B), Y = (B D C A B), Y j B D C A B 2 3 4 5 X i A B 2 C 3 B 4 for (i=; i<=x.length; i++) c[i][]=; // Y for (j=; j<=t.length; j++) c[][j]=; // X 33

Subsecuencia de mayor longitud (LCS) Ejemplo: X = (A B C B), Y = (B D C A B), Y j B D C A B 2 3 4 5 X i A B 2 C 3 B 4 if ( X[i] == Y[j] ) c[i][j] = c[i-][j-] + ; else c[i][j] = max ( c[i-][j], c[i][j-] ); 34 Subsecuencia de mayor longitud (LCS) Ejemplo: X = (A B C B), Y = (B D C A B), Y j B D C A B 2 3 4 5 X i A B 2 C 3 B 4 if ( X[i] == Y[j] ) c[i][j] = c[i-][j-] + ; else c[i][j] = max ( c[i-][j], c[i][j-] ); 35

Subsecuencia de mayor longitud (LCS) Ejemplo: X = (A B C B), Y = (B D C A B), Y j B D C A B 2 3 4 5 X i A B 2 C 3 B 4 if ( X[i] == Y[j] ) c[i][j] = c[i-][j-] + ; else c[i][j] = max ( c[i-][j], c[i][j-] ); 36 Subsecuencia de mayor longitud (LCS) Ejemplo: X = (A B C B), Y = (B D C A B), LCS = (B C B) X = ( A B C B ) Y = ( B D C A B ) Y j B D C A B 2 3 4 5 X i A B 2 2 C 3 2 2 2 B 4 2 2 3 NOTA: A partir del valor c[i][j] podemos determinar cómo se calculó éste y encontrar la LCS hacia atrás 3

Selección de actividades con pesos Enunciado del problema Dado un conjunto C de n tareas o actividades, con s i = tiempo de comienzo de la actividad i f i = tiempo de finalización de la actividad i v i = valor (o peso) de la actividad i encontrar el subconjunto S de actividades compatibles de peso máximo (esto es, un conjunto de actividades que no se solapen en el tiempo y que, además, nos proporcione un valor máximo). 38 Selección de actividades con pesos Recordatorio Existe un algoritmo greedy para este problema cuando todas las actividades tienen el mismo valor (elegir las actividades en orden creciente de hora de finalización). Sin embargo, el algoritmo greedy no funciona en general: valor = 999 b valor = a 39

Selección de actividades con pesos Observación Si, como en el algoritmo greedy, ordenamos las actividades por su hora de finalización 2 3 4 5 6 8 Tiempo 4 Selección de actividades con pesos Observación podemos definir p(j) como el mayor índice i<j tal que la actividad i es compatible con la actividad j p()= p(2)= p(3)= p(4)= p(5)= p(6)=2 p()=3 p(8)=5 Tiempo 4

Selección de actividades con pesos Definición recursiva de la solución OPT( j) = max{ v( j) + OPT( p( j)), OPT ( j ) si si j j = > Caso : Se elige la actividad j. No se pueden escoger actividades incompatibles >p(j). La solución incluirá la solución óptima para p(j). Caso 2: No se elige la actividad j. La solución coincidirá con la solución óptima para las primeras (j-) actividades. 42 Selección de actividades con pesos Implementación iterativa del algoritmo SelecciónActividadesConPesos (C: actividades): S { Ordenar C según tiempo de finalización; // O(n log n) Calcular p[]..p[n]; // O(n log n) mejor[] = ; for (i=; i<=n, i++) mejor[i] = max ( valor[i]+mejor[p[i]], mejor[i-] ); // O() // O(n) return Solución(mejor); // O(n) 43

El problema de la mochila / Tenemos un conjunto S de n objetos, en el que cada objeto i tiene un beneficio b i y un peso w i positivos. Objetivo: Seleccionar los elementos que nos garantizan un beneficio máximo pero pero con un peso global menor o igual que W. 44 El problema de la mochila / Dado el conjunto S de n objetos, sea S k el conjunto de los k primeros objetos (de a k): Podemos definir B(k,w k,w) como la ganancia de la mejor solución obtenida a partir de los elementos de S k para una mochila de capacidad w. Ahora bien, la mejor selección de elementos del conjunto S k para una mochila de tamaño w se puede definir en función de selecciones de elementos de S k- para mochilas de menor capacidad 45

El problema de la mochila / Cómo calculamos B(k,w)? O bien la mejor opción para S k coincide con la mejor selección de elementos de S k- con peso máximo w (el beneficio máximo para S k coincide con el de S k- ), o bien es es el resultado de añadir el objeto k a la mejor selección de elementos de S k- con peso máximo w w k (el beneficio para S k será el beneficio que se obtenía en S k- para una mochila de capacidad w w k más el beneficio b k asociado al objeto k). 46 El problema de la mochila / Definición recursiva de B(k,w): B( k, w) = B( k B( k, w), w w k ) + b k si si x x k k = = Para resolver el problema de la mochila nos quedaremos con el máximo de ambos valores: B ( k, w) = max{ B( k, w), B( k, w w k ) + bk 4

El problema de la mochila / Cálculo ascendente de B(k,w) usando una matriz B de tamaño (n+) x (W+): int[][] knapsack (W, w[..n], b[..n]) { for (p=; p<=w; p++) B[][p]=; for (k=; k<=n; k++) { for (p=; p<w[k]; p++) B[k][p] = B[k-][p]; for (p=w[k]; p<=w; w++) B[k][p] = max ( B[k-][p w[k]]+b[k], B[k-][p] ); return B; 48 El problema de la mochila / Cómo calculamos la solución óptima a partir de B(k,w)? Calculamos la solución para B[k][w] utilizando el siguiente algoritmo: Si B[k][w] == B[k-][w], entonces el objeto k no se selecciona y se seleccionan los objetos correspondientes a la solución óptima para k- objetos y una mochila de capacidad w: la solución para B[k-][w]. Si B[k][w]!= B[k-][w], se selecciona el objeto k y los objetos correspondientes a la solución óptima para k- objetos y una mochila de capacidad w-w[k]: w[k]: la solución para B[k-][w-w[k]]. w[k]]. 49

El problema de la mochila / Eficiencia del algoritmo Tiempo de ejecución: Θ(n W) Pseudopolinómico (no es polinómico sobre el tamaño de la entrada; esto es, sobre el número de objetos). El problema de la mochila es NP. NOTA: Existe un algoritmo polinómico de orden O(n 2 v*) que proporciona una solución aproximada al.% del óptimo [Kleinberg & Tardos, sección.8: Arbitrarily Good Approximations: The Knapsack Problem ]. 5 El problema de la mochila / Ejemplo Mochila de tamaño W= Número de objetos n=5 Solución óptima {3,4 Objeto 2 3 4 5 Valor Peso 6 2 8 5 22 6 28 2 3 4 5 6 8 9 φ { {, 2 {, 2, 3 {, 2, 3, 4 {, 2, 3, 4, 5 6 6 6 6 8 8 8 9 22 22 24 24 28 25 28 29 25 29 34 25 29 35 25 4 4 5

Caminos mínimos: Algoritmo de Floyd Problema: Calcular el camino más corto que une cada par de vértices de un grafo, considerando que no hay pesos negativos. Posibles soluciones: Por fuerza bruta (de orden exponencial). Aplicar el algoritmo de Dijkstra para cada vértice. Algoritmo de Floyd (programación dinámica). 52 Caminos mínimos: Algoritmo de Floyd Definición recursiva de la solución: D k (i,j):: Camino más corto de i a j usando sólo los k primeros vértices del grafo como puntos intermedios. Expresión recursiva: D k ( i, j) = min{ Dk ( i, j), Dk ( i, k) + Dk ( k, j) Caso base: D ( i, j) = c ij 53

Caminos mínimos: Algoritmo de Floyd Algoritmo de Floyd (962): Θ(V 3 ) for (i=; i<n; i++) for (j=; j<n; j++) D[i][j] = coste(i,j); for (k=; k<n; k++) for (i=; i<n; i++) for (j=; j<n; j++) if (D[i][k] + D[k][j] < D[i][j] ) D[i][j] = D[i][k] + D[k][j]; D k ( i, j) = min{ Dk ( i, j), Dk ( i, k) + Dk ( k, j) 54 Caminos mínimos: Algoritmo de Bellman-Ford Si sólo nos interesan los caminos mínimos desde un vértice concreto del grafo G(V,E), podemos utilizar el algoritmo greedy de Dijkstra, de orden O(E log V), siempre y cuando tengamos pesos no negativos. El algoritmo de Dijkstra no funciona con pesos negativos: Ojo! s 2 t Tampoco podemos sumarle una constante a cada peso. 55 3-6

Caminos mínimos: Algoritmo de Bellman-Ford Si tenemos pesos negativos, podemos utilizar el algoritmo de Bellman-Ford, basado en programación dinámica y de orden O(EV),, siempre y cuando no tengamos ciclos de peso negativo: Di ( w) = min{ D ( w), min { D ( v) + c i i ( v, w) E vw si i= en otro caso NOTA: : Si un camino de s a t incluye un ciclo de peso negativo, no existe un camino más corto de s a t (y, en cualquier caso, Bellman-Ford tampoco encontraría el camino simple más corto). 56 Caminos mínimos: Algoritmo de Bellman-Ford Algoritmo de Bellman-Ford: Θ(EV) foreach v V { D[v] = ; predecesor[v] = null; D[s] = ; for (i=; i<n; i++) { foreach (v, w) E { if (D[v] + coste(v,w) < D[w]) { D[w] = D[v] + coste(v,w); predecesor[w] = v; 5

Distancia de edición También conocida como distancia Levenshtein, mide la diferencia entre dos cadenas s y t como el número mínimo de operaciones de edición que hay que realizar para convertir una cadena en otra: d( data mining, data minino ) = d( efecto, defecto ) = d( poda, boda ) = d( night, natch ) ) = d( natch, noche natch, noche ) ) = 3 Aplicaciones: Correctores ortográficos, reconocimiento de voz, detección de plagios, análisis de ADN Para datos binarios: Distancia de Hamming. 58 Distancia de edición Definición recursiva de la solución d( i, d( i, j ) j) = + min{ d( i, j), d( i, j ), d( i, j ) si si s[ i] = t[ j] s[ i] t[ j] CASOS Mismo carácter: Inserción: Borrado: Modificación: d(i-,j-) ) + d(i-,j) + d(i,j-) + d(i-,j,j-) ) 59

Distancia de edición int LevenshteinDistance (string s[..m], string t[..n]) { for (i=; i<=m; i++) d[i,]=i; for (j=; j<=n; j++) d[,j]=j; for (j=; j<=n; j++) for (i=; i<=m; i++) if (s[i]==t[j]) d[i,j i,j] = d[i-, j-] else d[i,j i,j] = + min(d[i-,j],d[i,j-],d[i-,j-]); ]); return d[m,n m,n]; d( i, d( i, j ) j) = + min{ d( i, j), d( i, j ), d( i, j ) si si s[ i] = t[ j] s[ i] t[ j] 6 Aplicaciones Distancia entre dos series temporales: O(n 2 ) DTW [Dynamic Time Warping] Análisis sintáctico: O(n 3 ) Algoritmo CKY [Cocke-Kasami-Younger] Algoritmo de Earley Algoritmo de Viterbi: HMMs [Hidden Markov Models] Decodificación de señales (p.ej. modems, GSM, wi-fi) Procesamiento del lenguaje natural Bioinformática Optimización de consultas en bases de datos relacionales Comparación de ficheros con diff 6