1. Funciones diferenciables

Documentos relacionados
todos los puntos de U, y las funciones df : U R m son continuas en x, entonces F es diferenciable en x.

Continuidad y Continuidad Uniforme. Aplicaciones lineales continuas.

Lección 2: Funciones vectoriales: límite y. continuidad. Diferenciabilidad de campos

Capítulo VI. Diferenciabilidad de funciones de varias variables

CÁLCULO II Funciones de varias variables

La Diferencial de Fréchet

2.11. Diferencial de funciones vectoriales.

UNIVERSIDAD CARLOS III DE MADRID MATEMÁTICAS PARA LA ECONOMÍA II PROBLEMAS (SOLUCIONES ) HOJA 3: Derivadas parciales y diferenciación.

2. Continuidad y derivabilidad. Aplicaciones

Función diferenciable Regla de la cadena (2 variables) Regla de la cadena (vectorial) Diferenciabilidad

1. Medida Exterior. Medida de Lebesgue en R n

1. Funciones Medibles

2. Cálculo diferencial de funciones de varias variables. Mayo, 2009

La derivada como razón de cambio instantánea

Regla de la Cadena. df(x + tv) t=0

FUNCIONES HOLOMORFAS. LAS ECUACIONES DE CAUCHY-RIEMANN Y ALGUNAS DE SUS CONSECUENCIAS

58 7. ESPACIOS COCIENTE

1. Derivadas direccionales y derivadas parciales En este apartado generalizaremos la noción de derivada introducida para las funciones

Espacios vectoriales reales.

Funciones reales de varias variables.

Teorema de la Función Implícita

1. Sucesiones. Sucesiones. Compacidad. {( 1) n, n N} = { 1, 1, 1, 1, 1, 1,... } es una sucesión de elementos del conjunto { 1, 1}, y la familia

Derivada y diferencial

Plano tangente a una superficie y a una superficie de nivel, derivada direccional y regla de la cadena

PROPUESTA A. 3A. a) Despeja X en la ecuación matricial X A B = 2X donde A, B y X son matrices cuadradas

TEORIA MATEMATICAS 5 PRIMER PARCIAL

Funciones Reales de Varias Variables

DERIV. DE UNA FUNC. EN UN PUNTO

1. DIFERENCIABILIDAD EN VARIAS VARIABLES

Normas Equivalentes. Espacios Normados de Dimensión Finita

6 Vectores. Dependencia e independencia lineal.

x (0) si f (x) = 2s 1, s > 1 d) f 3. Analizar la existencia de derivadas laterales y de derivada en a = 0, para las siguientes funciones:

Coordinación de Matemáticas III (MAT 023) x a. Además, diremos que f es continua en U si f es continua en cada punto de U.

3. Funciones de varias variables

LECCIÓN 8: ECUACIONES DIFERENCIALES ORDINARIAS DE PRIMER ORDEN EXACTAS

May 4, 2012 CAPÍTULO 5: OPTIMIZACIÓN

Unidad IV. 4.1 Conceptos de incremento y de razón de cambio. La derivada de una función.

Funciones de Clase C 1

Diferenciales de Orden Superior

1. Lección 9 - Continuidad y Derivabilidad

Aplicaciones de las derivadas. El teorema del valor medio

MATEMÁTICAS: PAU 2016 JUNIO CASTILLA Y LEÓN

4.2 Tasas de Variación. Sea la función f: Se llama tasa de variación media de la función f en el intervalo [a, b] al cociente:

Parte II. Cálculo Diferencial para Funciones de Varias Variables Reales

Producto Escalar. AMD Grado en Ingeniería Informática. AMD Grado en Ingeniería Informática (UM) Producto Escalar 1 / 31

Cálculo en varias variables

Derivación de funciones de varias variables.

Espacios Vectoriales Euclídeos. Métodos de los mínimos cuadrados

(3 p.) 3) Se considera la superficie z = z(x, y) definida implícitamente por la ecuación. 3x 2 z x 2 y 2 + 2z 3 3yz = 15.

Aplicaciones Lineales

PROPUESTA A. c) Demuestra, usando el Teorema de Rolle, que la ecuación anterior no puede tener más de tres raíces reales distintas.

Tema 6: Derivada de una función

Espacios topológicos. 3.1 Espacio topológico

Tema 3: Espacios vectoriales

Ayudantía 7. r sin θ sin θ r cos θ. = cos θ. ] (F (p)) z x2 + y 2 + z 2 ] = [ 2 0 ]. , i {1,..., n}

Funciones Inversas. Derivada de funciones inversas

DERIVADA DE UNA FUNCIÓN

* e e Propiedades de la potenciación.

Teorema de Hahn-Banach

FUNCIONES VECTORIALES DE VARIABLE ESCALAR

un conjunto cuyos elementos denominaremos vectores y denotaremos por es un espacio vectorial si verifica las siguientes propiedades:

2. El Teorema del Valor Medio

10. Series de potencias

x, y = x 0 y 0 + x 1 y 1 + x 2 y 2 + x 3 y 3. Es fácil ver que verifica 1. Es simétrica. x, y = y, x para todo x, y R 4.

6. Teoría de Cauchy local.

Definición 11.1 Sea f : A E F una aplicación r-veces diferenciable en un punto a A. o

FUNCIONES DE DOS VARIABLES

a ij x i x j = [x] t B A+At ) t = At +(A t ) t = At +A x i x j + a ij + a ji x j x i = s ij x i x j + s ji x j x i 2

MODELACION EN VARIABLES DE ESTADO

DERIVADAS DE FUNCIONES DE VARIAS VARIABLES. Curvas Paramétricas. Dada una curva paramétrica

PRUEBAS DE ACCESO A LA UNIVERSIDAD PARA ALUMNOS DE BACHILLERATO LOE Septiembre 2013 MATEMÁTICAS II. CÓDIGO 158

2 x

Teoremas de Convergencia

UNIVERSIDADES PÚBLICAS DE LA COMUNIDAD DE MADRID PRUEBA DE ACCESO A LAS ENSEÑANZAS UNIVERSITARIAS OFICIALES DE GRADO MATERIA: MATEMÁTICAS II

Funciones Reales de Varias Variables

TEMA 3: CONTINUIDAD DE FUNCIONES

Tema 2: Teorema de estructura de los grupos abelianos finitamente generados.

1. Construcción de la Integral

Variable Compleja I. Maite Fernández Unzieta Universidad de Guanajuato Enero Junio Eugenio Daniel Flores Alatorre

Opción A Ejercicio 1 opción A, modelo 5 Septiembre Reserva_ tan(x) - sen(x) [2 5 puntos] Calcula lim

Coordinación de Matemática I (MAT021) Taller 10

Tema 7: Derivada de una función

CÁLCULO DIFERENCIAL Muestras de examen

Matriz asociada a una transformación lineal respecto a un par de bases

Podemos pues formular los dos problemas anteriores en términos de matrices.

Funciones elementales

PROPUESTA A. b) Para el valor de a obtenido, calcula los puntos de inflexión de la función f(x). (1 25 puntos)

Termodinámica. 1. Introducción. Transformaciones de Legendre Potenciales Termodinámicos

1. Espacio vectorial. Subespacios vectoriales

Ayudantía Regla de la Cadena. Pontificia Universidad Católica de Chile Facultad de Matemáticas Departamento de Matemática

Transcripción:

1. diferenciables Volvamos sobre el significado de la derivada de una función real de una variable real, Como vimos en el capítulo anterior, f : (a, b) R derivable en x 0, equivale a que f(x) f(x 0 ) = f (x 0 ) x x 0 x x 0 lo que a su vez equivale a que f(x) f(x 0 ) f (x 0 )(x x 0 ) x x 0 x x 0 = x x0 f(x) y(x) x x 0 = 0 donde y(x) = f(x 0 ) + f (x 0 )(x x 0 ) es la ecuación de la recta tangente a la gráfica de f en x 0.

f(x 0 ) f(x) y(x) x 0 x Con cualquier recta y(x) = f(x 0 ) + m(x x 0 ) que pase por el punto (x 0, f(x 0 ) y tenga pendiente m, el ĺımite f(x) y(x) x x 0 x x 0 es una indeterminación del tipo 0/0, pero sólo en el caso de la recta tangente, el valor del ĺımite es cero. En el caso de funciones de dos variables, para que el plano generado por las rectas tangentes en las direcciones de los ejes sea de verdad un plano tangente a la gráfica de f en x 0 se necesita que

y f(x, y) f(x 0, y 0 ) df (x dx 0, y 0 )(x x 0 ) df (x dy 0, y 0 )(y y 0 ) (x,y) (x 0,y 0 ) (x, y) (x 0, y 0 ) z(x, y) = f(x 0, y 0 ) + df dx (x 0, y 0 )(x x 0 ) + df dy (x 0, y 0 )(y y 0 ) es la ecuación del plano tangente Esta fórmula se puede generalizar para funciones vectoriales de n variables, buscando la ecuación de un subespacio afín de dimensión n en R m, que pase por F ( x 0 ) que sea tangente a F. Llamando { v 1,..., v n } a la familia de los vectores directores del subespacio, su ecuación es de la forma x = F (x 0 ) + h 1 v 1 + + h n v n donde h 1,..., h n son números reales. Escribiendo las coordenadas de cada vector, ponemos v i = (v i1,..., v im ) para cada i entre 1 y n, y la ecuación anterior queda x 1. x m = f 1 (x 0 ). f m (x 0 ) + v 11... v n1..... v 1m... v nm h 1. h n = 0

La aplicaciónl : R n R m definida por v 11... v n1 L(h 1,..., h n ) =..... v 1m... v nm h 1. h n es una aplicación lineal de R n en R m, asociada al espacio afín, de modo que la ecuación del subespacio se puede escribir x = F (x 0 ) + L( h); h R n La descripción anaĺıtica del hecho de que este subespacio afín sea tangente a la imagen de F en x 0 se expresa de la siguiente manera F ( x 0 + h) F ( x 0 ) L( h) h 0 h = 0 o para que se parezca más a las ecuaciones anteriores de la recta y el plano tangente, llamando x = x 0 + h F ( x) F ( x 0 ) L( x x 0 ) x x 0 x x 0 = 0

Definición (Función diferenciable). Sea U un abierto de R n, F : U R m una función, y x 0 U un punto de U. Se dice que F es diferenciable en x 0 si existe una aplicación lineal L x0 : R n R m que verifica F ( x 0 + h) F ( x 0 ) L x0 ( h) h 0 h = 0 ( R m ) Esta aplicación lineal se denomina diferencial de F en x 0, y se denota por df (x 0 )

Observaciones: 1. df (x 0 ) está bien definida, en el sentido de que si existe alguna aplicación lineal cumpliendo la condición de arriba, es única. En efecto, supongamos que además de L x0 hay otra aplicación lineal L de R n en R m, L L x0, que verifica también Entonces F (x 0 + h) F (x 0 ) L(h) h 0 h F (x 0 + h) F (x 0 ) L(h) h 0 h = 0 y pasando todo al mismo lado de la igualdad ( F (x0 + h) F (x 0 ) L(h) h 0 h de donde, operando, queda L(h) L x0 (h) h 0 h = 0 = h 0 F (x 0 + h) F (x 0 ) L x0 (h) h F (x 0 + h) F (x 0 ) L x0 (h) h = 0 ) = 0

Ahora bien, si L L x0, existe algún vector v 0 en R n tal que L(v) L x0 (v). Consideramos la sucesión v n = v/n, que es una sucesión que tiende a cero, y L(v n ) L x0 (v n ) v n = 1 L(v) 1 L n n x 0 (v) 1 v n = L(v) L x0(v) v es constante, y no tiende a cero cuando n tiende a infinito, lo que es una contradicción. Así que necesariamente tienen que ser L y L x0 iguales. 2. Llamando x = x 0 + h, la condición de diferenciabilidad es equivalente a F ( x) F ( x 0 ) L( x x 0 ) x x 0 x x 0 = 0 3. Si n = m = 1, f : R R es diferenciable en x 0 si y sólo si es derivable. La aplicación lineal df(x 0 ) en una aplicación de R en R, que tiene asociada una matriz 1 1. El único coeficiente de la matriz de df(x 0 ) es exactamente la derivada f (x 0 ) En efecto, si f es diferenciable en x 0, la aplicación df(x 0 ) es una aplicación lineal de R en R, que tiene una matriz 1 1 con un sólo elemento a, de modo que df(x 0 ) : R R h (a)(h) = ah

Entonces al escribir la condición de diferenciabilidad, queda f(x 0 + h) f(x 0 ) df(x 0 )(h) h 0 h = h 0 f(x 0 + h) f(x 0 ) ah h = 0 Esto equivale a que f(x 0 + h) f(x 0 ) ah h 0 h = 0 es decir, f es derivable en x 0 y f (x 0 ) = a 4. En el caso general f : R n R m, la matriz asociada a df (x 0 ) es una matriz (m n) de m filas y n columnas. Las columnas de la matriz son los transformados de los elementos de la base canónica de R n. De otra forma, escribiendo las componentes de la aplicación df (x 0 )(h) = (l 1 (h),..., l m (h)), las funciones componentes l i : R n R son lineales, y tienen asociadas matrices (1 n) de una sola fila, que se corresponden con las filas de la matriz de df (x 0 )

Ejemplo 1. Una función constante F : U R m, F (x) = y 0 para todo x U es diferenciable, y df (x) = 0 en cualquier punto de U En efecto, si calculamos el cociente F (x + h) F (x) df (x)(h) h = y 0 y 0 0 h = 0 luego trivialmente el ĺımite tiende a cero cuando h tiende a 0 Ejemplo 2. Una función lineal F : R n R m es diferenciable en todo punto x R n, y df (x) = F En este caso, si utilizamos que F es lineal en el numerador del cociente F (x + h) F (x) df (x)(h) h = F (x) + F (h) F (x) F (h) h = 0 y también tiende a cero cuando h tiende a 0. Por ejemplo, F (x, y) = (x + y, 3x, 2y x), F es una función lineal de R 2 en R 3, que se puede escribir en forma matricial como f(x, y) = 1 1 3 0 1 2 ( x y )

F es diferenciable en cualquier punto, y 1 1 df (x, y) = 3 0 1 2 para todo (x, y) en R 2 En general, será más difícil saber si una función es o no diferenciable en un punto. En primer lugar, sería necesario saber cuál podría ser la aplicación lineal que cumpla la condición de diferenciabilidad, y en segundo lugar, comprobar que de verdad cumple esa condición. Para dar el primer paso, y calcular cuál puede ser la diferencial de una función en un punto, utilizaremos los teoremas siguientes.

Teorema. Sea U un conjunto abierto de R n, x 0 un punto de U y F : U R m una función. F es diferenciable en x 0 si y sólo si cada una de sus funciones componentes f i es diferenciable en x 0. Además entonces para cada i entre 1 y m, df i (x 0 ) = df (x 0 ) i (la diferencial de la componente i-ésima de F es la componente i-ésima de la diferencial de F ) Demostración: Si L es una aplicación lineal de R n en R m, de componentes L = (l 1,..., l m ), tenemos F (x) F (x 0 ) L(x x 0 ) = x x 0 ( f1 (x) f 1 (x 0 ) l 1 (x x 0 ) =,..., f ) m(x) f m (x 0 ) l m (x x 0 ) x x 0 x x 0 Si F es diferenciable en x 0, existe una aplicación L = df (x 0 ) de modo que ese cociente tiende a cero cuando x tiende a x 0, con lo que cada una de sus coordenadas tiende a cero, y por tanto cada función f i es diferenciable en x 0, y su diferencial es df i (x 0 ) = l i = df (x 0 ) i Recíprocamente, si cada f i es diferenciable, existen aplicaciones l i = df i (x 0 ) de modo que en el cociente anterior cada una de las coordenadas tiende a cero cuando x tiende a x 0. Entonces F es diferenciable en x 0, y su diferencial es la aplicación L = (df 1 (x 0 ),..., df m (x 0 ))

Teorema ( diferenciables y derivadas direccionales). Sea U un conjunto abierto de R n, x 0 un punto de U y F : U R m. Si F es diferenciable en x 0, entonces existen todas las derivadas direccionales de F en x 0, y d v F (x 0 ) = df (x 0 )(v) para todo v R n \ {0} Demostración: Sabemos que F (x 0 + h) F (x 0 ) df (x 0 )(h) h 0 h = 0 Sea entonces v R n \ {0}, y consideremos los vectores h = tv. Cuando t tiende a cero, se

tiene luego 0 = F (x 0 + tv) F (x 0 ) df (x 0 )(tv) = t 0 tv = F (x 0 + tv) F (x 0 ) df (x 0 )(tv) = t 0 tv = 1 v F (x 0 + tv) F (x 0 ) df (x 0 )(tv) = t 0 t = 1 v F (x 0 + tv) F (x 0 ) tdf (x 0 )(v) t 0 t = = 1 ( v F (x0 + tv) F (x 0 ) t 0 df (x 0 )(v)) t F (x 0 + tv) F (x 0 ) = df (x 0 )(v) t 0 t es decir, existe la derivada de F en x 0 en la dirección de v, y vale d v F (x 0 ) = df (x 0 )(v) Observaciones: El recíproco del teorema anterior no es cierto: puede ocurrir que una función no sea diferenciable en un punto x 0, pero sí existan todas las derivadas direccionales en ese punto.

Como consecuencia de los teoremas anteriores, podemos saber para una función F cuál es la única aplicación que puede ser su diferencial, si es que es diferenciable:

Teorema. Sea U un conjunto abierto de R n, x 0 un punto de U, y F : U R m. Si F es diferenciable en x 0, la matriz asociada a df (x 0 ) es df 1 df 1 dx 1 (x 0 )... dx n (x 0 )..... df m df dx 1 (x 0 )... m dx n (x 0 ) Demostración: La matriz asociada a df (x 0 ) está formada por las imágenes de los vectores de la base canónica de R n, colocados en columnas, df (x 0 )(e i ). Ahora bien, según el teorema anterior, df (x 0 )(e i ) = d ei F (x 0 ) = df dx i (x 0 ) = ( df 1 dx i (x 0 ),..., df m dx i (x 0 )) Definición (Matriz Jacobiana y Gradiente). La matriz df 1 df dx 1 (x 0 )... 1 dx n (x 0 )..... df m df dx 1 (x 0 )... m dx n (x 0 )

se llama Matriz Jacobiana de F en x 0. Como una aplicación lineal tiene unívocamente asociada una matriz, suele identificarse la aplicación lineal df (x 0 ) con la matriz Jacobiana, aunque hay que tener cierta precaución, ya que puede ocurrir que exista la matriz (que existan las derivadas direccionales en las direcciones de los ejes de coordenadas) pero que la función no sea diferenciable, en cuyo caso la aplicación lineal definida por esa matriz no sería la diferencial de F en x 0. En el caso m = 1, la matriz tiene una sola fila, ya que F tiene una única componente, y df(x 0 ) = ( df df (x 0 ),..., (x 0 )) dx 1 dx n es un vector, que se llama Gradiente de f en x 0, y se denota por f(x 0 ) Mirando otra vez la matriz Jacobiana de F en x 0, las columnas son los vectores derivadas parciales de F en x 0, y las filas son los gradientes de las funciones componentes de F df 1 df 1 dx 1 (x 0 )... dx n (x 0 )..... df m df dx 1 (x 0 )... m dx n (x 0 ) = ( df dx 1 (x 0 )... df dx n (x 0 ) ) = f 1 (x 0 ). f m (x 0 )

Ejemplo 3. Calcular las derivadas parciales de la función { xy si x 2 + y 2 0 fx, y) = x 2 +y 2 0 si x 2 + y 2 = 0 y estudiar si es diferenciable en (0, 0)

Calculamos las derivadas de f en (0, 0) df f((0, 0) + t(1, 0)) f(0, 0) (0, 0) = dx t 0 t = t 0 f(t, 0) f(0, 0) t = = t 0 0 0 t df f((0, 0) + t(0, 1)) f(0, 0) (0, 0) = dy t 0 t f(0, t) f(0, 0) = t 0 t = 0 0 = t 0 t = 0 = 0 Si f es diferenciable en (0, 0), la diferencial tiene que ser ( ) df df df(0, 0) = (0, 0), (0, 0) = (0, 0) dx dy Hay que comprobar que Ahora bien f(x, y) f(0, 0) df(0, 0)(x, y) (x,y) (0,0) (x, y) f(x, y) f(0, 0) df(0, 0)(x, y) (x, y) = = 0 xy x 2 +y 2 0 0 x2 + y 2 = xy (x 2 + y 2 ) 3/2

no tiene ĺımite cuando (x, y) tiende a (0, 0): por ejemplo, si tomamos puntos de la recta y = x con x 0 queda x 2 2 3/2 x = 1 3 2 3/2 x que tiende a infinito cuando x tiende a cero. Por tanto f no es diferenciable en (0, 0) En muchos casos, no será necesario estudiar directamente la diferenciabilidad de una función utilizando la definición, sino que podremos utilizar la estructura del conjunto de las funciones diferenciables; como ocurre con el estudio de la continuidad de funciones, el conjunto de las funciones diferenciables forma un espacio vectorial: la suma de funciones diferenciables en un punto, o el producto de una función diferenciable por un número, es también diferenciable. Proposición. Sea U un conjunto abierto de R n, x 0 un punto de U, y F : U R m, G : U R m dos funciones diferenciables en x 0. Entonces F + G es diferenciable en x 0, y d(f + G)(x 0 ) = df (x 0 ) + dg(x 0 ), y para todo a R, af es diferenciable en x 0 y d(af )(x = ) = adf (x 0 ) La demostración se deja como ejercicio. Además en el caso de funciones escalares (de U en R), el producto de funciones diferenciables es diferenciables, y si el denominador no se anula, el cociente es diferenciable. Estos dos

resultados se demuestran como casos particulares de un teorema más general, y más importante: la composición de funciones diferenciables es diferenciable.

2. Lema 1. Sea U un abierto de R n, y F : U R m diferenciable en un punto x 0 U. a) Existe una constante M 0 > 0 tal que df (x 0 )( h) M 0 h para todo h R n. b) Para cada ɛ > 0 existe δ > 0 tal que si h < δ entonces F (x 0 + h) F (x 0 ) df (x 0 )( h) ɛ h c) Existen dos constantes M 1 > 0 y δ 1 > 0 tal que si h < δ 1 entonces F (x 0 + h) F (x 0 ) M 1 h Demostración: El apartado (a) es consecuencia de que df (x 0 ) es una aplicación lineal de R n en R m, y por tanto continua. Para el apartado (b), de la definición de función diferenciable se deduce que para cada ɛ > 0 existe un δ > 0 tal que si 0 < h δ entonces F ( x 0 + h) F ( x 0 ) df ( x 0 )( h) ɛ h

luego F (x 0 + h) F (x 0 ) df (x 0 )( h) ɛ h si 0 < h < δ, y evidentemente también si h = 0 Ahora, de (a) y (b) se deduce tomando por ejemplo ɛ = 1, que existe δ 1 > 0 tal que F (x 0 + h) F (x 0 ) si h < δ 1 F (x 0 + h) F (x 0 ) df (x 0 )( h) + df (x 0 )( h) ɛ h + df (x 0 )( h) (1 + M 0 ) h = M 1 h Observaciones: Si llamamos x = x 0 + h, las desigualdades anteriores quedarían de la forma a) Existe una constante M 0 > 0 tal que df (x 0 )(x x 0 ) M 0 x x 0 para todo x R n. b) Para cada ɛ > 0 existe δ > 0 tal que si x x 0 < δ entonces F (x) F (x 0 ) df (x 0 )(x x 0 ) ɛ x x 0 c) Existen dos constantes M 1 > 0 y δ 1 > 0 tal que si x x 0 < δ 1 entonces F (x) F (x 0 ) M 1 x x 0 Como consecuencia se obtiene de forma inmediata otro importante resultado:

Teorema. Sea U un abierto de R n, x 0 un punto de U y F : U R m. Si F es diferenciable en x 0, entonces es continua en x 0. Demostración: Aplicando el lema anterior, sabemos que existen dos constantes δ 1 y M 1 tales que si x x 0 δ 1. F (x) F (x 0 ) M 1 x x 0 Entonces dado ɛ > 0 basta tomar δ = min{δ 1, ɛ/m 1 }, y evidentemente si x x 0 δ entonces ɛ F (x) F (x 0 ) M 1 x x 0 M 1 = ɛ M 1 luego F es continua en x 0

Observaciones: El recíproco de este resultado es falso: hay funciones continuas en un punto, que no son diferenciables en ese punto, como hay funciones continuas de una variable real que no son derivables en un punto. Hay incluso funciones continuas en un intervalo que no son derivables en ningún punto del intervalo.

Teorema (). Sea U abierto de R n, F : U R m diferenciable en x 0 U; sea V abierto en R m tal que F ( x 0 ) V ; y sea G : V R p diferenciable en F ( x 0 ). Entonces H = G F : U R p es diferenciable en x 0, y dh( x 0 ) = dg(f ( x 0 )) df ( x 0 ) Demostración: Hay que demostrar que H( x 0 + h) H( x 0 ) dg(f ( x 0 )) df ( x 0 )( h) h 0 h Operando en el numerador, podemos escribir (Saltar al final de la demostración) H( x 0 + h) H( x 0 ) dh( x 0 )( h) = = G(F ( x 0 + h)) G(F ( x 0 )) dg(f ( x 0 )) df ( x 0 )( h) = = G(F ( x 0 ) + [F ( x 0 + h) F ( x 0 )]) G(F ( x 0 )) dg(f ( x 0 )) df ( x 0 )( h) = = 0 poniendo K = F ( x 0 + h) F ( x 0 ), sumando y restando dg(f ( x 0 ))( K), aplicando la desigualdad triangular de las normas, y la linealidad de dg(f ( x 0 )),

= G(F ( x 0 ) + K) G(F ( x 0 )) dg(f ( x 0 ))( K)+ +dg(f ( x 0 ))( K) dg(f ( x 0 ))(df ( x 0 ( h)) G(F ( x 0 ) + K) G(F ( x 0 )) dg(f ( x 0 ))( K) + + dg(f ( x 0 ))( K) dg(f ( x 0 )) df ( x 0 )( h) = = G(F ( x 0 ) + K) G(F ( x 0 )) dg(f ( x 0 ))( K) }{{} N 1 + = N 1 + N 2 = N dg(f ( x 0 ))[ K df ( x 0 )( h)] = }{{} N 2 Sea ahora ɛ > 0. Como F es diferenciable en x 0, por la propiedad (c) del lema anterior existen δ 1 > 0, M 1 > 0, tales que si h < δ 1, entonces (i) F ( x 0 + h) F ( x 0 ) M 1 h Como G es diferenciable en F ( x 0 ), existe una constante M 0 > 0 tal que para todo j R m (apartado (a) del lema anterior aplicado a G en F (x 0 )) (ii) dg(f (x 0 ))( j) M 0 j

y existe δ 2 > 0 tal que si j < δ 2, entonces (apartado (b) del lema anterior aplicado a G en F (x 0 )) (iii) G(F ( x 0 ) + j) G(F ( x 0 )) dg(f ( x 0 ))( j) ɛ 2M 1 j También por ser F diferenciable en x 0 existe δ 3 > 0 tal que si h < δ 3, entonces (apartado (b) del lema anterior) (iv) F ( x 0 + h) F ( x 0 ) df ( x 0 )( h) ɛ 2M 0 h Definimos δ 0 = min{δ 1, δ 2 M 1, δ 3 }. Si 0 < h < δ 0, se tiene: Por (i), K = F ( x 0 + h) F ( x 0 ) M 1 h M 1 δ 2 M 1 = δ 2 Por (iii) aplicado a j = K, en el primer sumando de (N)obtenemos N 1 = G(F ( x 0 ) + K) G(F ( x 0 )) dg(f ( x 0 ))( K) (por (i) otra vez) ɛ 2M 1 M 1 h = ɛ 2 h ɛ 2M 1 K

Y por (ii) y (iv), en el segundo sumando de (N) queda N 2 = dg(f ( x 0 ))( K df ( x 0 )( h)) M 0 K df ( x 0 )( h) = = M 0 F ( x 0 + h) F ( x 0 ) df ( x 0 )( h) M 0 ɛ 2M 0 h ɛ 2 h Luego si 0 < h < δ 0 se tiene H( x 0 + h) H( x 0 ) dg(f ( x 0 )) df ( x 0 )( h) lo que prueba el resultado. (Volver al enunciado) h ɛ

Utilizando la regla de la cadena podemos demostrar fácilmente el siguiente resultado: Teorema. Sea U abierto de R n, y f : U R, g : U R dos funciones diferenciables en un punto x 0 U. Entonces a) el producto fg es diferenciable en x 0, y d(fg)(x 0 ) = g(x 0 )df(x 0 ) + f(x 0 )dg(x 0 ) b) y si g(x 0 ) 0, entonces el cociente f/g es diferenciable en x 0, y d(f/g)(x 0 ) = g(x 0)df(x 0 ) f(x 0 )dg(x 0 ) g 2 (x 0 ) Demostración: a) En primer lugar, consideremos la función h : R R definida por h(a) = a 2. Sabemos que esta función es derivable, y que h (a) = 2a para todo a R. Entonces h es diferenciable, y dh(a) : R R está definida por dh(a)(t) = (h (a))(t) = 2at para todo t R Sea ahora k(x) = h f(x) = f 2 (x). Aplicando la regla de la cadena, k(x) es diferenciable, y dk(x) = dh(f(x)) df(x), es decir, dk(x) = 2f(x)df(x)

Por último, como fg(x) = (f(x) + g(x))2 (f(x) g(x)) 2 4 f + g, f g son diferenciables, como acabamos de ver sus cuadrados (f + g) 2 = h (f + g) y (f g) 2 = h (f g) son diferenciables, y por tanto el producto fg es diferenciable. Además aplicando las reglas de derivación de la suma y el producto por un número, y la derivación del cuadrado, d(fg)(x 0 ) = = 1 4 {2(f(x 0) + g(x 0 ))d(f + g)(x 0 ) 2(f(x 0 ) g(x 0 ))d(f g)(x 0 )} = = 1 2 {f(x 0)df(x 0 ) + f(x 0 )dg(x 0 ) + g(x 0 )df(x 0 ) + g(x 0 )dg(x 0 ) f(x 0 )df(x 0 ) + f(x 0 )dg(x 0 ) + g(x 0 )df(x 0 ) g(x 0 )dg(x 0 )} = f(x 0 )dg(x 0 ) + g(x 0 )df(x 0 ) b) Se demuestra razonando análogamente utilizando la función h : R \ {0} R definida por h(x) = 1 x

Veamos para terminar algunos ejemplos y aplicaciones de la regla de la cadena: Ejemplo 4. Sean R n F R m g R diferenciables, y sea h = g F. Calcular dh dx i, para 1 i n Aplicando la regla de la cadena, dh(x) = dg(f (x)) df (x). Aquí g es una función de R m en R, es decir tiene un única componente y m variables, y = (y 1,..., y m ), de modo que la matriz de dg(f (x 0 )) tiene una sola fila (es el gradiente g(f (x 0 )) dg(f (x 0 )) = ( dg (F (x 0 )), dg ) dg (F (x 0 )),..., (F (x 0 )) dy 1 dy 2 dy m La función F : R n R m tiene en cambio m componentes y n variables. Si ponemos x = (x 1,..., x n ) y F = (f 1,..., f m ), la matriz de df (x 0 ) tiene m filas y n columnas: df (x 0 ) = df 1 dx 1 (x 0 ). df m dx 1 (x 0 ) df 1 df dx 2 (x 0 )... 1 dx n (x 0 )..... df m df dx 2 (x 0 )... m dx n (x 0 )

La matriz de la diferencial de h en (x 0 ) es el producto de las dos matrices: dh(x 0 ) = = = ( ) df 1 dg dx dg 1 (x 0 )... dx n (x 0 ) (F (x 0 )),..., (F (x 0 )). dy 1 dy.... m df m df dx 1 (x 0 )... m dx n (x 0 ) ( m j=1 dg dy j (F (x 0 )) df j dx 1 (x 0 ),..., m j=1 df 1 dg dy j (F (x 0 )) df j dx n (x 0 ) ) La coordenada i-ésima es la derivada parcial de h respecto de x i en x 0 dh m dg (x 0 ) = (F (x 0 )) df j (x 0 ) dx i dy j dx i j=1 Para recordar esta fórmula, puede utilizarse el siguiente criterio: la función g es función del vector y de m coordenadas y = (y 1,..., y m ). Al hacer la composición, la variable y se define como función a su vez de x = (x 1,..., x n ), y = F (x), de modo que la composición h = g F es función de x. Para obtener las derivadas parciales de h, la función g debe derivarse respecto de sus variables y = (y 1,..., y m ), y esas variables, expresadas como función de x, y = F (x), o y j = f j (x 1,..., x n ), son las que se deben derivar respecto de las variables x 1,..., x n

Ejemplo 5. Sea f : R 2 R una función diferenciable, y definamos la función g(x) = f(x, f(x, f(x, x))). Calcular g (x) Como f es una función de dos variables, escribimos f(u, v), de modo que df(u, v) = ( df df (u, v), (u, v)) du dv Ahora definimos una función de R en R 2, que a cada x R asocia un punto (u(x), v(x)), y consideramos la composición g(x) = f(u(x), v(x)); entonces g (x) = df df (u(x), v(x))du(x) + (u(x), v(x))dv du dx dv dx (x) En nuestro caso u(x) = x, luego du (x) = 1, y v(x) = f(x, f(x, x)), y sustituyendo en la dx ecuación queda g (x) = df df (x, f(x, f(x, x))) + (x, f(x, f(x, x)))dv du dv dx (x) Ahora tenemos que calcular dv (x); repitiendo la misma idea: dx [ ] dv df df df df (x) = (x, f(x, x)) + (x, f(x, x)) (x, x) + (x, x) dx du dv du dv

Luego g (x) = df du (x, f(x, f(x, x)))+ + df (x, f(x, f(x, x))) dv Ejemplo 6. Sean R n 1 i n y 1 j p. { df df (x, f(x, x)) + (x, f(x, x)) du dv F R m G R p [ ]} df df (x, x) + (x, x) du dv diferenciables, y sea H = G F. Calcular dh j dx i, para Basta tener en cuenta que la coordenada j-ésima de h, es h j = g j F, donde g j es la componente j-ésima de G. Entonces se puede aplicar la fórmula del ejemplo anterior. Ejemplo 7. Relación entre las transformaciones F : R 3 R 3 y las curvas en R 3 Sea c : R R 3 la trayectoria de un móvil en el espacio, c es una función continua y diferenciable. Y sea F : R 3 R 3 una función diferenciable. La composición g = F c es una nueva trayectoria en R 3 El vector tangente a g = F c en un punto t 0 es g (t 0 ) = (F c) (t 0 ) (matriz de la diferencial de g en t 0 ) y viene dado según la regla de la cadena por g (t 0 ) = df (c(t 0 ))(c (t 0 ))

c(t 0 ) c (t 0 ) c F F c(t 0 )=F (c(t 0 )) a t 0 b (F c) (t 0 )=df (c(t 0 ))(c (t 0 )) Es decir, la aplicación lineal df (c(t 0 )) transforma en vector derivada de c en t 0, en el vector derivada de F c en t 0

Ejemplo 8. Gradientes Hay dos propiedades de los gradientes que queremos destacar en este tema. En primer lugar, sea f : U R una función diferenciable en un punto x 0 de un abierto U R n. Consideremos las derivadas direccionales de f en x 0 según vectores de norma uno, d v f(x 0 ), con v = 1 d v f(x 0 ) = df(x 0 )(v) =< f(x 0 ), v >= f(x 0 ) v cos α donde α es el ángulo que forman f(x 0 ) y v. Entonces, la derivada direccional según vectores de norma uno será máxima cuando cos α = 1, es decir, cuando v tiene la misma dirección y el mismo sentido que f(x 0 ). Y será mínima cuando cos α = 1, es decir, cuando v y f(x 0 ) tengan la misma dirección y sentidos opuestos. Si estudiamos el módulo de las derivadas direccionales, será máxima en la dirección del gradiente f(x 0 ), en los dos sentidos, y será mínima en la dirección perpendicular al gradiente, en cuyo caso la derivada direccional valdrá cero. En segundo lugar, si N k = {(x, y, z) : f(x, y, z) = k} es un conjunto de nivel de f, y x 0 N k, entonces f(x 0 ) es ortogonal a N k, en el sentido de que para toda curva contenida en N k, que pase por x 0, el vector f(x 0 ) es perpendicular al vector tangente a la curva en x 0 (Mas adelante en el curso veremos que el conjunto de todos los vectores tangentes a las curvas contenidas en N k, en el punto x 0, es un espacio vectorial, el núcleo de df(x 0 ), que llamaremos espacio tangente a N k en x 0 )

En efecto, si G : (a, b) R 3 describe una curva contenida en N k, y t 0 es un punto de (a, b) tal que G(t 0 ) = x 0, entonces la composición h(t) = f G(t) = k de (a, b) en R, y aplicando la regla de la cadena N k 0 = h (t 0 ) = df(g(t 0 )) G (t 0 ) =< f(x 0 ), G (t 0 ) > G(t 0 ) G (t 0 ) f(g(t 0 ))