Tema 2 Conjuntos convexos José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid
Contenidos del tema 2 Conjuntos convexos. Propiedades básicas y ejemplos. Cierre e interior de un conjunto convexo. Teorema de la proyección. Teoremas de separación. Caracterización de puntos extremos y direcciones extremas de S = {x : Ax = b, x 0}. Teorema de representación.
Conjuntos afines y convexos y = θx 1 + (1 θ)x 2 = x 2 + θ(x 1 x 2 ), x 1, x 2 R n. 22 2 Convex sets PSfrag replacements θ = 1.2 x 1 θ = 1 θ = 0.6 x 2 θ = 0 θ = 0.2 Figure 2.1 The line passing through x 1 and x 2 is described parametrically by θx 1 + (1 θ)x 2, where θ varies over R. The line segment between x 1 and x 2, which corresponds to θ between 0 and 1, is shown darker. Conjunto afín: si x 1, x 2 S, entonces θx 1 + (1 θ)x 2 S, para todo θ R. an affine set contains every affine combination of its points: If C is an affine set, x 1,..., x k C, and θ 1 + + θ k = 1, then the point θ 1 x 1 + + θ k x k also belongs to C. θx 1 + (1 θ)x 2 S, para todo θ [0, 1]. If C is an affine set and x 0 C, then the set Conjunto convexo: si x 1, x 2 S, entonces
Ejemplos de conjuntos convexos Hiperplanos: S = {x : p x = α}, donde p R n, α R. Semiespacios: S = {x : p x α}, donde p R n, α R. Intersección arbitraria de convexos: Si S i es convexo para todo i I, entonces S = I i=1 S i es un conjunto convexo. Un poliedro (intersección finita de semiespacios) es un conjunto convexo. Por ejemplo, S = {x : Ax b, x 0} es un conjunto convexo. Una bola B( x, r) = {x R n : x x < r} es un conjunto convexo (para cualquier norma).
Combinaciones afines Combinación afín de x 1,..., x k R n : donde λ 1 + + λ k = 1. y = λ 1 x 1 + + λ k x k, Cierre afín de S: { k afin(s) = λ i x i : x i S, i=1 } k λ i = 1. i=1 Un conjunto es afín si y solo S = afin(s). Un conjunto es afín si y solo si es la traslación de un subespacio vectorial (único) La dimensión afín de un conjunto es la dimensión de su cierre afín (que a su vez es la dimensión del correspondiente subespacio vectorial).
Combinaciones convexas y cierre convexo Combinación convexa de x 1,..., x k R n : y = λ 1 x 1 + + λ k x k, donde λ 1 + + λ k = 1 y λ i 0, para todo i = 1,..., n. Cierre convexo de S: { k conv(s) = λ i x i : x i S, λ i 0, i=1 } k λ i = 1. i=1 Un conjunto S es convexo si y solo si S = conv(s). conv(s) es el menor conjunto convexo que contiene a S.
Cierre convexo 2 1 0 1 2 2 1 0 1 2 2 1 0 1 2 2 1 0 1 2
Teorema de Carathéodory Cualquier punto del cierre convexo de un conjunto de R n se puede poner como combinación lineal convexa de a lo más n + 1 puntos del conjunto. Teorema: Sea S R n. Si x conv(s), entonces x = n+1 i=1 λ ix i, con n+1 i=1 λ i = 1, λ i 0, x i S, para todo i = 1,..., n + 1. Demostración: Sea x conv(s), entonces x = k i=1 λ i x i, con k i=1 λ i = 1, λ i > 0, x i S. 1. Si k n + 1, hemos terminado. 2. Si k > n + 1, x 2 x 1,..., x k x 1 son linealmente dependientes. 3. Existen µ i (alguno estrictamente positivo) tales que k i=1 µ i x i = 0. 4. Tenemos que x = k i=1 (λ i αµ i )x i, donde α = min{λ j /µ j : µ j > 0} := λ r /µ r > 0. 5. Hemos conseguido expresar x como combinación convexa de k 1 elementos. Volvemos al paso 1. En un número finito de iteraciones habremos terminado.
Interior relativo Sea S R n un convexo cuyo cierre afín es afin(s). El interior relativo de S se define como el conjunto de puntos x S tales que existe r > 0 con B(x, r) afin(s) S. Cuál es el interior relativo de {x R 3 : 1 x 1 1, 1 x 2 1, x 3 = 0}? Teorema: Un conjunto convexo no vacío en R n tiene interior relativo no vacío. Teorema: El interior de un conjunto convexo en R n es vacío si y solo si el conjunto está contenido en un hiperplano de R n.
Cierre e interior de un conjunto convexo Lema: Sea S R n un conjunto convexo con int(s). Sea x 1 S, x 2 int(s). Entonces, θx 1 + (1 θ)x 2 int(s), para todo θ [0, 1). Demostración: Sea y = θx 1 + (1 θ)x 2. 1. Existe ɛ > 0 tal que B(x 2, ɛ) S. 2. Sea ỹ B(y, η), con η = ɛ(1 θ). 3. Como x 1 S, existe x 1 S tal que x 1 x 1 < η ỹ y θ 4. Sea x 2 = (ỹ θ x 1 )/(1 θ) ỹ = θ x 1 + (1 θ) x 2. 5. Se verifica x 2 x 2 = y θx 1 ỹ + θ x 1 1 θ y ỹ + θ x 1 x 1 < η. 1 1 θ ( y ỹ + θ x 1 x 1 ) < η 1 θ = ɛ. 6. Por 1 y 5, x 2 S. Por 4, ỹ S. Como B(y, η) S, y int(s).
Cierre e interior de un conjunto convexo 1. Si S R n es convexo, entonces tanto int(s) como S son conjuntos convexos. 2. Si S R n es convexo, entonces int(s) = int( S). Si además int(s), entonces S = int(s). 3. Si S R n es convexo, entonces S = S.
Teorema de la proyección Teorema: Sea S R n un conjunto convexo, no vacío y cerrado. Sea y R n. Existe un único x S (la proyección de y sobre S) tal que y x y x, para todo x S. Además, x es la proyección de y sobre S si y solo si (y x) (x x) 0. (1) Cómo queda la condición (??) cuando S es un conjunto afín? La aplicación P : R n S, que a cada y le hace corresponder su proyección P(y) sobre S, es continua.
Teorema del hiperplano separador Teorema: Sea S R n un conjunto convexo, no vacío y cerrado. Sea y / S. Entonces existe p R n, p 0, y α R tales que p x α, para todo x S. p y > α Demostración: 1. Sea x la proyección de y sobre S. 2. Se verifica (y x) (x x) 0, para todo x S. 3. Definimos p = y x y α = p x. Comprobamos que cumplen las condiciones requeridas: Si x S, p x = (y x) (x x) + α α. p y = (y x) (y x) + α = y x 2 + α > α.
Teorema del hiperplano soporte Teorema: Sea S R n un conjunto convexo con interior no vacío. Sea x S, la frontera de S. Entonces existe p R n, p 0, tal que p (x x) 0, para todo x S. Demostración: 1. x / int(s) = int( S). 2. Para todo k N, existe y k B( x, 1/k) S c 3. Existe p k R n, p k = 1, con pk y k > pk x para todo x S. 4. Tenemos y k x. Para una subsucesión, p k p con p = 1. 5. Tomando ĺımites en 3, p (x x) 0, para todo x S.
Separación de dos convexos disjuntos Teorema: Sean S 1, S 2 R n conjuntos convexos, no vacíos, tales que S 1 S 2 =. Entonces existe p R n, p 0, tal que inf{p x : x S 1 } sup{p x : x S 2 }. Demostración: La idea es considerar S = {x R n : x = x 1 x 2, x 1 S 1, x 2 S 2 } y aplicar los teoremas de separación.
Teoremas de la alternativa Teorema (Gordan): Sea A una matriz m n. Uno y solo uno de los sistemas siguientes tiene solución: Ax < 0 para algún x R n. A p = 0, p 0 y p 0 para algún p R m. Demostración: (1) tiene solución (2) no la tiene. Sea x la solución de (1) y supongamos que p fuese una solución de (2). Consideramos p A x. (1) no tiene solución (2) sí la tiene. Los conjuntos S 1 = {z R m : z = Ax, x R n } y S 2 = {z R m : z < 0} son convexos, no vacíos y disjuntos. Existe p 0 con p Ax p z para x R n y z < 0. Se demuestra que p resuelve (2).
Teoremas de la alternativa Ejemplo: Existen x 1, x 2 y x 3 tales que x 1 + x 2 + x 3 < 0, x 1 > 0 y 2x 1 x 2 x 3 < 0? Teorema (Farkas): Sea A una matriz m n y c R n. Uno y solo unos de los sistemas siguientes tiene solución: 1. Ax 0 y c x > 0 para algún x R n. 2. A y = c, y 0 para algún y R m. Demostración: Ejercicio Probar que (1) no tiene solución cuando (2) sí la tiene es muy fácil. Cuando (2) no tiene solución considera S = {x R n : x = A y, y 0} y observa que c / S.
Teorema de representación de poliedros Los resultados hasta el final del tema se refieren al poliedro S = {x : Ax = b, x 0}, el conjunto factible de un problema de optimización lineal (en forma estándar). Suponemos que A es una matriz m n (m < n) con rango r(a) = m. Vamos a representar los puntos de S en términos de los puntos extremos (vértices) de S y sus direcciones extremas. Cualquier punto de S se puede expresar como una combinación convexa de sus puntos extremos más una combinación lineal positiva de sus direcciones extremas.
Soluciones factibles básicas Podemos dividir las columnas de A es dos grupos B y N, donde B es m m con r(b) = m. Ax = b (B, N) ( xb x N ) = b Bx B + Nx n = b Si hacemos x N = 0, x B = B 1 b y se verifica B 1 b 0, obtenemos unos puntos especiales de S que se llaman soluciones factibles básicas. Algunas soluciones del sistema compatible indeterminado Ax = b, con r(a) = r(a, b) = m < n se consiguen fijando n m incógnitas como 0 y despejando las m incógnitas restantes. Si estas soluciones son no negativas, son soluciones factibles básicas.
Puntos extremos Definición: Sea S R n un conjunto convexo no vacío. Se dice que x S es un punto extremo de S si x = λx 1 + (1 λ)x 2, con x 1, x 2 S, λ (0, 1), implica que x = x 1 = x 2. Es decir, x es un punto extremo si no está en el interior (relativo) del segmento definido por otros dos puntos del conjunto. Piensa ejemplos de conjuntos convexos: con un único punto extremo, con un número finito mayor que uno de puntos extremos, con infinitos puntos extremos, sin puntos extremos.
Direcciones extremas Definición: Sea S R n un conjunto convexo no vacío. Se dice que d R n, d 0, es una dirección de S si para todo x S y para todo λ 0, se cumple x + λd S. Qué condiciones caracterizan las direcciones de S = {x : Ax = b, x 0}? Definición: Sea S R n un conjunto convexo no vacío. Se dice que d R n, d 0, es una dirección extrema de S si d = λ 1 d 1 + λ 2 d 2, con d 1, d 2 direcciones de S, λ 1, λ 2 > 0, implica que d 1 = αd 2, para algún α > 0. Piensa ejemplos de conjuntos convexos: con dos direcciones extremas, con una única dirección extrema, sin direcciones extremas.
Caracterización de puntos extremos Teorema: x es un punto extremo de S si y solo si x es una solución factible básica. Demostración: ( ) Ejercicio. Demostramos ( ). 1. Reordenando las coordenadas x = (x 1,..., x k, 0,..., 0), con x i > 0. Spg. k 1 (el caso x = 0 es trivial). 2. Reordenamos igual las columnas de A: A = (a 1,..., a k, resto de columnas). 3. Veamos que a 1,..., a k son linealmente independientes. Si no fuera así existiría un vector λ 0 tal que Aλ = 0. 4. Para α > 0 suficientemente pequeño, x 1 = x + αλ y x 2 = x αλ pertenecen a S x = ( x 1 + x 2 )/2 no es punto extremo. 5. Si k < m, añadimos columnas de manera que las columnas de B = (a 1,..., a k, a k+1,..., a m) formen una base.
Caracterización de puntos extremos La demostración implica que un punto extremo no puede tener más de m coordenadas estrictamente positivas. El recíproco no es cierto (veremos algún ejemplo más adelante en los ejercicios). Si una solución factible básica tiene k < m coordenadas estrictamente positivas se llama solución factible básica degenerada. En el caso degenerado puede haber dos bases distintas B y B que representen el mismo punto extremo ( por qué?).
Caracterización de puntos extremos Teorema: El número de puntos extremos de S es finito ( Por qué?) Teorema: S tiene al menos un punto extremo. (La demostración es muy parecida a la del teorema de Carathéodory.) Ejemplo: Obtener las soluciones factibles básicas del problema: minimizar x 1 + 2x 2 s.a. x 1 + 2x 2 2 2x 1 + x 2 1 x 1 0 x 2 0
Caracterización de direcciones extremas Es fácil demostrar que d es una dirección de S si y solo si Ad = 0 y d 0. El resultado siguiente caracteriza las direcciones extremas: Teorema: d R n es una dirección extrema de S si y solo si A = (B, N), donde B es una matriz m m básica, de manera que B 1 a j 0 para alguna de las columnas de N y d = α ( B 1 a j e j ) para algún α > 0, donde e j R n m es un vector de ceros salvo un 1 en la posición correspondiente a a j. Demostración: ( ) Ejercicio. ( ) No la hacemos. Es totalmente análoga a la del teorema de caracterización de puntos extremos. Ejemplo: Calcula las direcciones extremas del conjunto S = {(x 1, x 2 ) R 2 : x 2 x 1 1, x 2 2, x 1 0, x 2 0}.
Teorema de representación Teorema: Sean x 1,..., x k los puntos extremos de S y sean d 1,..., d l sus direcciones extremas. Entonces, x S x = k l λ i x i + µ j d j, i=1 j=1 donde λ i 0, µ j 0, k i=1 λ i = 1. Consecuencias: Si S es acotado, cualquier punto de S es combinación lineal convexa de sus puntos extremos. S tiene al menos una dirección extrema si y solo si S no es acotado. Es el número de direcciones extremas siempre un número finito?
Demostración del teorema de representación k l C = {x R n : x = λ i x i + µ j d j, λ i 0, µ j 0, i=1 j=1 k λ i = 1} i=1 C C es convexo y cerrado. C S Para probar S C, supongamos que existe z S con z / C. Existe p R n (p 0) y α R tales que p z > α y p x α para todo x C. Como consecuencia, p d j 0 y p x i α p z > p x i, i = 1,..., k. Sea x el punto extremo tal que p x = max i p x i. Consideramos la partición A = (B, N) en parte básica y no básica correspondiente a x. Se comprueba 0 < p z p x = (p N p B B 1 N)z N, lo que implica que para algún j > m se tiene z j > 0 y p j p B B 1 a j > 0. Se demuestra que y j := B 1 a j 0. (Por reducción al absurdo ya que si y j 0, entonces d j = ( y ) j e es una dirección extrema y por tanto pj p j B B 1 a j 0.)
Demostración del teorema de representación Definimos el vector x = donde b = B 1 b y α = min { b i y ij : y ij > 0 Comprobamos x S, x r = 0, x j > 0. ( b ) ( yj ) + α, 0 e j } := b r y rj > 0. Las columnas a 1, a 2,..., a r 1, a r+1, a j son linealmente independientes, es decir, x es un punto extremo de S. Pero p x = p x + α(p j p B B 1 a j ) > p x. Una contradicción ya que habíamos supuesto p x = max i p x i.