13. formas cuadraticas apunte de mancilla

Upload: pablo-canello

Post on 26-Feb-2018

219 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    1/24

    Formas cuadraticasNotas para los cursos 21 y 22 (J.L. Mancilla Aguilar)

    1. Formas Cuadraticas

    Despues de las funciones lineales, las formas cuadr aticas son las mas usuales en las aplicacio-nes ingenieriles. Aparecen en procesamiento de se nales, control, estadstica, fsica, en este ultimocaso modelando funciones de energa cinetica o potencial, etc.

    Una forma cuadratica en R n es una funci on Q : R n R que se puede expresar en la formaQ(x) = xT Ax

    con A R n n simetrica.Veamos algunos ejemplos:

    1. Q : R n R , Q(x) = x 2, es una forma cuadratica pues Q(x) = xT Ix .2. Sea Q : R 2 R , Q(x) = xT Ax con

    A = 4 00 3 .

    Un sencillo calculo muestra que Q(x) = 4 x21 + 3 x22.

    En general, si A R n n es diagonal se tiene queQ(x) = a11x21 + + ann x2n =

    1ina ii x2i .

    A este tipo de forma cuadratica se la denomina forma diagonal o sin productos cruzados .3. Consideremos ahora Q(x) = xT Ax con

    A =5 1 21 2 3

    2 3 1.

    Efectuando el producto matricial obtenemos

    Q(x) = 5 x21 + 1 x1x2 2x1x3+1 x2x1 2x22 + 3 x2x32x3x1 + 3 x3x2 1x23,

    que es la sumatoria de todos los posibles productos xi x j multiplicados por el correspon-diente coeciente a ij de la matriz A, en otras palabras,

    Q(x) =1i,j 3

    a ij x i x j .

    1

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    2/24

    Como la matriz A es simetrica y x i x j = x j x i , podemos reducir la expresion de Q(x) a

    Q(x) = 5 x21 + 2 1x1x2 2 2x1x32x22 + 2 3x2x3

    1x23

    con lo cual ahora s olo aparecen los terminos de la forma x i x j , con i j , multiplicados pora ii si i = j y por 2a ij si i = j , en otras palabrasQ(x) =

    1i3a ii x2i + 2

    1i

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    3/24

    En general, si Q : R n R esta denida por Q(x) = xT Bx , con B R n n no necesaria-mente simetrica, comoxT Bx = ( xT Bx )T = xT B T x 2Q(x) = xT Bx + xT B T x = xT (B + BT )x,

    se tiene que

    Q(x) = xT B + BT

    2x,

    y por lo tanto Q(x) es forma cuadr atica, ya que A = B + BT

    2 es simetrica.

    Las formas cuadraticas no son lineales pues, en general, no se cumple la relaci on Q(x + y) =Q(x) + Q(y) ni tampoco la igualdad Q(x ) = Q (x). Sin embargo las formas cuadr aticas tienenla siguiente propiedad:

    Q(x ) = ( x )T A(x ) = 2(xT Ax) = 2Q(x).

    Dada una forma cuadr atica Q(x) usualmente nos interesa conocer lo siguiente:Su signo, es decir, si Q(x) es siempre positiva o siempre negativa, o si toma valores positivosy negativos;

    la forma de sus conjuntos de nivel, esto es, dado c R , que clase de conjunto (curva sin = 2, supercie si n = 3) dene la ecuacion

    Q(x) = c;

    los valores maximo y mnimo que alcanza Q(x) cuando x vara entre los vectores unitarios,es decir, cuando

    x = 1.

    En lo que sigue responderemos esas preguntas. Pero antes veremos como mediante un cambiode variable lineal es posible transformar una forma cuadr atica con productos cruzados en unaque carece de estos, es decir, en una forma diagonal.

    1.1. Eliminaci on de productos cruzados

    Consideremos la forma cuadr atica Q(x) = xT Ax con A R n n simetrica. Con el objeto desimplicar la expresion de Q(x), es decir, de eliminar los terminos de la forma xi x j con i = j quecomplican el an alisis de la misma, consideremos el cambio de variable x = P y con P inversible.Entonces, si x = P y,

    Q(x) = xT Ax = ( P y)T A(P y) = yT (P T AP )y = Q(y).

    Como queremos que Q(y) este libre de productos cruzados, debemos elegir P de modo tal quela matriz D = P T AP sea diagonal. Pero ello siempre es posible dado que A, por ser simetrica,es diagonalizable ortogonalmente, es decir, existen P ortogonal y D diagonal tales que

    A = P DP T (D = P T AP ).

    3

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    4/24

    Entonces, tomando tal P (cuyas columnas son autovectores de A y forman una b.o.n. de R n ) yefectuando el cambio de variable x = P y, tenemos que

    Q(x) = Q(y) = yT Dy = 1y21 + + n y2n ,siendo 1, . . . , n los autovalores de A.

    Hemos demostrado el siguiente resultado.

    Teorema 1 ( Teorema de los ejes principales) Sea A R n n simetrica. Entonces existe un cambio de variable ortogonal x = P y ( P R n n es ortogonal) que transforma la forma cuadr atica Q(x) = xT Ax en una forma cuadr atica sin productos cruzados, es decir,

    Q(x) = Q(y) = yT Dy, si x = P y,

    con D R n n diagonal. Adem as, los elementos de la diagonal de D son los autovalores de A y las columnas de la matriz P son autovectores de A y forman una b.o.n de R n .

    Ejemplo 1 Apliquemos este resultado a la forma cuadr atica Q : R 2 R denida medianteQ(x) = x21 8x1x2 5x22. La matriz asociada es

    A = 1 44 5

    ,

    cuyos autovalores son 1 = 3 y 2 = 7. Entonces, seg un el Teorema de los ejes principales,existe un cambio de variable x = P y, con P ortogonal, tal queQ(x) = Q(y) = 3 y21 7y22 ,

    La matriz P debe diagonalizar ortogonalmente a la matriz A, esto es, A = P DP T con

    D = 3 00 7 .

    Teniendo en cuenta que

    S 1 = gen {[2 1]T } y S 2 = gen {[1 2]T },normalizando los generadores de los autoespacios obtenemos la base ortonormal

    B = 2 5

    1 5

    T

    , 1 5

    2 5

    T

    y, a partir de ella, denimos

    P = 2

    51

    51 52 5

    .

    El cambio de variable que hemos efectuamos para eliminar los productos cruzados puede serinterpretado geometricamente de la siguiente manera:Llamemos u1 al primer vector de la b.o.n. B ( que es la primera columna de P ) y u2 al segundovector de B (segunda columna de P ). Entonces, si x R 2 y x = P y tenemos que

    x = P y = [u1 u2][y1 y2]T = y1u1 + y2u2,

    4

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    5/24

    + x 1

    + y 1

    x21

    8 x 1 x 2 5 x 22 = 3 y 21 7 y 22

    x 1

    x 2

    y 1

    y 2

    u 1

    u 2

    + y 2+ x 2

    Figura 1:

    con lo cual y no es otra cosa que el vector de coordenadas de x en la base B , es decir, y = [x]B .Gr acamente, si ubicamos los vectores u1 y u2 en el plano x1x2 y trazamos un par de ejes y1,

    y2 siguiendo las direcciones de u1 y u2 respectivamente, tenemos que [ y1 y2]T son las coordenadasdel vector x respecto del sistema de ejes cartesianos y1y2, y que Q(y) = 3 y21 7y22 es el valor deQ(x) en funcion de las coordenadas de x en el sistema de coordenadas y1y2. (Ver gura 1.)

    Entonces, podemos interpretar geometricamente el cambio de variables x = P y que eliminalos productos cruzados, como la adopci on de un sistema de ejes cartesianos (elecci on de una b.o.nB ) en el cual la variable y representa las coordenadas de x respecto de ese sistema ( y = [x]B ),y la expresi on de Q(x) en terminos de esas coordenadas carece de productos cruzados. Por estaraz on a las rectas que generan las columnas de la matriz P se las denominan ejes principales dela forma cuadr atica Q. Es usual tomar P con det( P ) = 1, pues de esa manera el sistema de ejesortogonales denidos por las columnas de P se obtienen rotando el sistema de ejes cartesianooriginal.

    1.2. Clasicaci on de formas cuadraticas

    Denici on. Dada una forma cuadr atica Q : R n R decimos que Q es:a) Denida positiva (d.p.) si Q(x) > 0 x R n {0}.b) Semidenida positiva (s.d.p.) si Q(x) 0 x R n .c) Denida negativa (d.n.) si Q(x) < 0 x R n {0}.d) Semidenida negativa (s.d.n.) si Q(x) 0 x R n .e) Indenida si no es ninguna de las anteriores, es decir, si existen x y x tales que Q(x) > 0

    y Q(x ) < 0.

    5

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    6/24

    Notamos que toda forma cuadr atica Q d.p. (d.n.) es s.d.p. (s.d.n), pero que no vale la recpro-ca, y que Q es d.p. (s.d.p) si y s olo si Q es d.n. (s.d.n.).Denici on. Dada una matriz simetrica A R n n , decimos que A es denida positiva, se-midenida positiva, etc, si la forma cuadr atica asociada Q(x) = xT Ax es, respectivamente,denida positiva, semidenida positiva, etc.

    Veamos algunos ejemplos:

    1. Q : R 3 R , Q(x) = x21 + 2 x22 + 3 x23 es d.p., ya que siempre Q(x) 0, y Q(x) = 0 s olo six = 0.

    2. Q : R 3 R , Q(x) = x21 + 2 x22 es s.d.p., pues Q(x) 0 x R 3, pero Q([001]T ) = 0.3. Q : R 4 R , Q(x) = x21+2 x223x23 es indenida, pues Q([1000]T ) = 1 y Q([0010]T ) = 3.4. Por ultimo, Q : R 3 R , Q(x) = x21 2x22 3x23 es d.n. y Q : R 3 R , Q(x) = x21 2x23

    es s.d.n.De acuerdo con los ejemplos anteriores, cuando la forma cuadr atica carece de productos

    cruzados , es decir, cuando Q(x) = xT Dx con

    D =

    1 0 00 2 0... ... . . . ...0 0 n

    ,

    se tiene que Q es:

    d.p. si i > 0 para todo i;s.d.p. si i 0 para todo i;d.n. si i < 0 para todo i;

    s.d.n. si i 0 para todo i;indenida si existe un par de ndices i, j tales que i > 0 y j < 0.

    Si Q(x) = xT Ax tiene productos cruzados, es decir, si A no es una matriz diagonal, empleandoun cambio de variables ortogonal x = P y que elimine productos cruzados, tenemos que

    Q(x) = yT Dy = Q(y),

    con D diagonal. Como Q y Q tienen el mismo signo, y el signo de esta ultima esta determinadopor los elementos en la diagonal de D, que son los autovalores de A, tenemos el siguienteresultado.

    Teorema 2 Sea A R n n simetrica, y sean 1, . . . , n los autovalores de A. Entonces Q(x) =xT Ax es

    6

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    7/24

    d.p. si i > 0 para todo i;

    s.d.p. si i 0 para todo i;d.n. si i < 0 para todo i;

    s.d.n. si i 0 para todo i;indenida si existe un par de ndices i, j tales que i > 0 y j < 0.Ejemplo 2 Clasicar la forma cuadratica en R 3, Q(x) = xT Ax, con

    A =2 3 03 2 40 4 2

    .

    Como A es simetrica y sus autovalores son: 7 , 2 y 3, tenemos que Q(x) es indenida.Ejemplo 3 Determinar para que valores de a, la forma cuadr atica en R 3, Q(x) = x21 +2 ax 1x2 +x22, es denida positiva.

    Como Q(x) = xT Ax con

    A = 1 aa 1 ,

    basta con determinar para que valores de a los autovalores de A son positivos.Como

    det( A I ) = (1 )2 a2 = 0 = a + 1 = 1 a,tenemos que Q(x) es denida positiva si y solo si

    a + 1 > 0 1a > 0 a > 1 a < 1 | a| < 1.1.3. Conjuntos de Nivel

    Vamos a ver ahora como el cambio de variables que elimina los productos cruzados nos ayudaen el estudio de los conjuntos de nivel de una forma cuadr atica. (En este punto se presuponeque el alumno conoce las ecuaciones canonicas de las conicas y las cu adricas.)

    Dada una forma cuadr atica Q : R n R , para c R se dene el conjunto de nivel c como N c(Q) = {x R n : Q(x) = c}.

    Es decir, N c(Q) es el conjunto de todos los puntos de R n en los cuales Q toma el valor c. Si Qrepresenta una temperatura, el conjunto de nivel es lo que se conoce como isoterma, si Q fueseuna energa potencial en R 3, entonces el conjunto de nivel es lo que usualmente se denominasupercie equipotencial.

    Para determinar que tipo de conjunto es N c(Q), empleando un cambio de variables x = P yque elimine productos cruzados, tenemos que Q(x) = Q(y) = yT Dy con D diagonal, y que, paraun dado c R , Q(x) = c Q(y) = c.Entonces, teniendo en cuenta la interpretaci on geometrica del cambio de variables, tenemos queel conjunto de nivel N c(Q) se obtiene rotando adecuadamente el conjunto de nivel N c( Q) (losejes yi se hacen coincidir con las rectas generadas por las columnas de P ). En particular, ambosconjuntos de nivel tienen la misma forma geometrica.

    7

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    8/24

    Ejemplo 4 Consideremos la forma cuadratica Q : R 2 R , Q(x) = x21 8x1x2 5x22. Queremosgracar el conjunto de nivelQ(x) = x21 8x1x2 5x22 = 21.

    De acuerdo con lo que vimos en el Ejemplo 1, si consideramos el cambio de variable x = P y,con

    P = 2 5

    1 51 5

    2 5,

    tenemos que en terminos de la variable y, los elementos del conjunto de nivel buscado vericanla ecuaci on

    3y21 7y22 = 21,o, equivalentemente, dividiendo ambos miembros por 21,

    y21( 7)2

    y22( 3)2 = 1 ,

    que es la ecuacion canonica de una hiperbola de ejes y1 = 0, y2 = 0, y cuyo gr aco es, recordandola interpretaci on geometrica del cambio de variable:

    + x 1

    + y 1

    + y 2+ x 2

    7

    7

    3

    3

    Figura 2:

    Ejemplo 5 Consideremos ahora la forma cuadr atica Q(x) = xT Ax con

    A =5 8 108 11 2

    10 2 2.

    Queremos identicar que tipo de supercie es el conjunto de nivel N 36(Q) = {x R 3 : Q(x) =36}.

    8

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    9/24

    Los autovalores de A son 1 = 18, 2 = 9 y 3 = 9, y sus correspondientes autoespaciosson:

    S 1 = gen221

    , S 2 = gen1

    2

    2

    , y S 3 = gen2

    12

    Entonces, con el cambio de variable ortogonal x = P y, donde

    P =

    23 13 2323

    23

    13

    13 23 23

    es la matriz que se obtiene poniendo como columnas los generadores de los autoespacios previa-mente normalizados, tenemos que

    Q(x) = 36 Q(y) = 36 ,siendo Q(y) = 18 y21 + 9 y22 9y23 .Pero

    18y21 + 9 y22 9y23 = 36 o, equivalentemente ,

    y21( 2)2 +

    y2222

    y2322

    = 1 ,

    es la ecuacion de un hiperboloide de una hoja, cuyo graco es el siguiente:

    x 3

    x 1

    x 2

    y 1

    y 3

    y 2

    Figura 3:

    2. Optimizaci on de formas cuadraticas con restricciones

    El problema que nos interesa resolver ahora es el siguiente: dada una forma cuadr aticaQ(x) = xT Ax, hallar los valores m aximo y mnimo de Q (x )x 2 , x = 0, o, alternativamente, los

    9

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    10/24

    maximos y mnimos de Q(x) bajo la restriccion x = 1, restricci on que tambien podemosescribir xT x = 1.La resoluci on del problema es sencilla si Q(x) carece de productos cruzados. Para ilustrarlo

    consideremos la forma cuadratica Q : R 4 R , con Q(x) = 3 x21 + 3 x22 2x23 5x24.Como 2x23 3x23 y 5x24 3x24, tenemos que3x21 + 3 x

    22 2x23 5x24 3x21 + 3 x22 + 3 x23 + 3 x24 = 3 x 2. (1)

    Por otro lado, dado que 3 x21 5x21, 3x22 5x22 y 2x23 5x23, resulta3x21 + 3 x

    22 2x23 5x24 3x21 + 3 x22 + 3 x23 + 3 x24 = 3 x 2. (2)

    Entonces, de (1) y (2) deducimos que

    5 x 2 Q(x) 3 x 2 x R 4,con lo cual

    5 Q(x)

    x 2 3 x R 4 {0}.Por lo tanto,

    maxx =0

    Q(x)x 2 3 y mnx =0

    Q(x)x 2 5.

    Veamos ahora que el maximo es 3 y que el mnimo es 5. Para probarlo basta exhibir unpar de vectores xM , xm tales que Q (x M )x 2 = 3 y

    Q (x m )x 2 = 5, por ejemplo xM = [1 0 0 0]T y

    xm = [0 0 0 1]T . Tambien sirven xM = [1 0 0 0]T y xm = [0 0 0 1]T . Es decir, tanto elmaximo como el mnimo se alcanzan en mas de un vector.Para hallar todos los maximizantes, determinemos primero para que valores de x R 4 valela igualdad Q(x) = 3 x 2. Planteando

    3x21 + 3 x22 2x23 5x24 = 3 x21 + 3 x22 + 3 x23 + 3 x24 5x23 + 8 x24 = 0 x3 = 0 , x4 = 0 ,

    concluimos queQ(x) = 3 x 2 x = [x1 x2 0 0]T .

    En resumen,

    maxx =0

    Q(x)x 2

    = 3 y el maximo se alcanza en los vectores no nulos de la forma x = [x1 x2 0 0]T .

    Si ahora imponemos la restricci on

    x = 1, es inmediato que

    maxx =1

    Q(x) = 3 y que el maximo se alcanza en los x = [x1 x2 0 0]T con x = 1 .Respecto de los minimizantes, procediendo como antes, pero buscando ahora aquellos x quesatisfacen la igualdad Q(x) = 5 x 2, concluimos que

    mnx =0

    Q(x)x 2

    = 5 y el mnimo se alcanza en los vectores no nulos de la forma x = [0 0 0 x4]T .

    10

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    11/24

    Bajo la restriccion x = 1 es inmediato quemnx =1

    Q(x) = 5 y que el maximo se alcanza en los x = [0 0 0 x4]T con x = 1 ,

    que en este caso son s olo dos, x = [0 0 0 1]T y x = [0 0 0

    1]T .

    Observe que en este ejemplo el maximo y el mnimo de valor que toman los cocientes Q (x )x 2(x = 0) (denominados cocientes de Rayleigh), son, respectivamente, el m aximo y el mnimocoeciente de la forma cuadratica. Ademas, los maximizantes (minimizantes) son los vectoresque tienen nulas las componentes correspondientes a los coecientes de la forma cuadr atica queson distintos del maximo (mnimo).

    Caso general

    Estudiemos ahora el caso general, es decir Q(x) = xT Ax con A R n n simetrica.Sean P ortogonal y D diagonal tales que A = P DP T . Recordemos que D tiene en su diagonal

    a los autovalores de A y que las columnas de P son autovectores de A.Llamemos M y m al maximo y al mnimo autovalor de A respectivamente, y supongamos

    que hemos ordenado los autovalores de A en forma decreciente, que M tiene multiplicidad r yque m tiene multiplicidad k, es decir

    M = 1 = = r < r +1 < nk+1 = = n = m .Entonces, si P = [u1 un ] tenemos que

    S M = gen {u1, . . . , u r } y S m = gen {un k+1 , . . . , u n }.Con el cambio de variable x = P y la forma cuadr atica Q adquiere la expresion

    Q(x) = Q(y) = yT Dy = 1y21 + + n y2n . (3)Teniendo en cuenta que

    i y2i = M y2i para todo 1 i r y i y2i M y2i para todo r + 1 i n, (4)deducimos inmediatamente la desigualdad

    Q(x) = 1y21 + + n y2n M (y21 + + y2n ) = M y 2. (5)Como P es ortogonal, y por lo tanto y = x , resulta

    Q(x) M x 2 x R n .Por otra parte, teniendo en cuenta (3) y que

    i y2i m y2i para todo 1 i n k y i y2i = m y2i para todo n k + 1 i n,resulta la desigualdad

    Q(x) = 1y21 + + n y2n m (y21 + + y2n ) = m y 2, (6)11

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    12/24

    y de all, teniendo en cuenta nuevamente que x = y , obtenemosQ(x) m x 2 x R n .

    En resumen, hemos probado que

    m x2

    Q(x) M x2

    , x R n

    ,y por lo tanto que

    maxx =0

    Q(x)x 2 M y mnx =0

    Q(x)x 2 m .

    Ahora veamos que el m aximo es M y que el mnimo es m . Para ello basta exhibir vectoresxM y xm tales que Q (x M )x 2 = M y

    Q (x m )x 2 = m .

    Como estamos interesados en hallar todos los maximizantes y todos los minimizantes, pro-cedamos como en el ejemplo anterior. Primero busquemos los x que verican la igualdad

    Q(x) = M x 2.

    Como x = P y, x = y y Q(x) = yT

    Dy , esto es equivalente a buscar los y que verican laigualdad

    1y21 + + n y2n = M y 2.De (4) se deduce inmediatamente que estos resultan ser todos los y de la forma

    y = [y1 yr 0 0]T .Luego, los x que verican Q(x) = max x 2 son aquellos de la forma

    x = P [y1 yr 0 0]T = y1u1 + y2u2 + + yr u r .Como

    {u1, . . . , u r

    } es base de

    S M , hemos demostrado que

    Q(x) = M x 2 x S M .Por lo tanto,

    maxx =0

    Q(x)x 2

    = M y el maximo se alcanza en los x S M {0}.Respecto de los minimizantes, procediendo en forma similar se deduce que

    Q(x) = m x 2 x S m ,con lo cual

    mnx =0Q(x)

    x 2 = m y el mnimo se alcanza en los x S m

    {0}.Si ahora imponemos la restricci on x = 1, de lo anterior resulta inmediatamente que

    maxx =1

    Q(x) = M , mnx =1

    Q(x) = m ,

    que el maximo se alcanza en los x S M tales que x = 1 y que el mnimo se alcanza en losx S m tales que x = 1.

    Hemos demostrado el siguiente

    12

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    13/24

    Teorema 3 (Rayleigh) Sea A R n n simetrica y Q(x) = xT Ax. Sean M y m los autovalores m aximo y mnimo de A respectivamente, y sean S M y S m los respectivos autoespacios. Entonces 1. m x 2 Q(x) M x 2 x R n (Desigualdad de Rayleigh).

    Adem as, Q(x) = m x 2 si y s olo si x S m y Q(x) = M x 2 si y s olo si x S M .2. max x =0 Q (x )x 2 = M y el m aximo se alcanza en los x S M {0}.3. mn x =0

    Q (x )x 2 = m y el mnimo se alcanza en los x S m {0}.

    En particular, max x =1 Q(x) = M (resp. mn x =1 Q(x) = m ) y el m aximo (resp. mnimo)se produce en los autovectores unitarios asociados a M (resp. m ).

    Ejemplo 6 Consideremos la forma cuadr atica Q(x) = xT Ax con

    A =3 1 2

    1 3 22 2 0

    .

    Su polinomio caracterstico es p() = ( + 2)( 4)2,

    con lo cual, los autovalores maximo y mnimo de A son M = 4, m = 2. Por lo tantomaxx =1

    Q(x) = 4 y mnx =1

    Q(x) = 2.Para hallar los maximizantes y minimizantes debemos hallar primero los autoespacios aso-

    ciados a los autovalores maximo y mnimo. Calculando obtenemos

    S M = gen{[1 1 1]T , [1 1 0]T } y S m = gen {[1 1 2]T }.Entonces Q(x) sujeto a la restriccion x = 1 alcanza el mnimo en los vectores unitarios deS

    m , que en este caso son s olo dos

    v1 = 1 6

    1 6

    2 6

    T

    y v2 = 1 6

    1 6

    2 6

    T

    .

    Respecto de los maximizantes, estos son los vectores unitarios de S M , es decir, los de la formax = [1 1 1]T + [1 1 0]T con x = 1 .

    Para obtener una expresi on algo mas explcita de los maximizantes, es conveniente traba jar conuna b.o.n del autoespacio, ya que si {u1, u2}es b.o.n de S M , dado que 1u1 + 2u2 2 = 21 + 22,tenemos que los x que maximizan Q sujeto a la restriccion son aquellos de la forma

    x = 1u1 + 2u2 con 21 + 22 = 1 .

    Como 1 31 3

    1 3T

    , 1 2 1 2 0T

    es b.o.n. de S M , entonces los maximizantes sonlos x R 3 de la forma:

    x = 1 1 3

    1 3

    1 3

    T

    + 2 1 2

    1 2 0

    T

    , 21 + 22 = 1 .

    Notamos que en este caso hay un numero innito de maximizantes y que todos ellos se encuentransobre la circunferencia de radio 1 centrada en el origen que est a contenida en el plano S M .

    13

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    14/24

    Ejemplo 7 Minimizar

    Q(x) = 49

    x21 80

    9 x1x2

    1259

    x22 sujeto a la restriccion 4x21 + 25 x

    22 = 9 .

    En este problema la dicultad radica en que la restricci on no es de la forma x21 + x22 = 1 que

    ya sabemos manejar. Lo que hacemos entonces en primer lugar es un cambio de variable quetransforme nuestra restricci on en una de la forma estandar.

    Dividiendo por 9 la restriccion, esta queda

    49

    x21 + 25

    9 x22 = 1 .

    Si consideramos el cambio de variable z1 = 23 x1 y z2 = 53 x2 (con lo cual x1 =

    32 z1 y x2 =

    35 z2),

    la restricci on se escribe z21 + z22 = 1, que es lo que queramos.Reemplazando en la expresion de Q(x), x1 y x2 por sus expresiones en funcion de z1 y z2,

    obtenemos la forma cuadr atica equivalente

    Q(z) = z21 8z1z2 5z

    22 .

    Luego, minimizar Q(x) con x sujeto a la restriccion 4x21 + 25 x22 = 9 es equivalente a minimizarQ(z) con z sujeto a la restriccion z21 + z22 = 1, es decir,

    mn4x 21 +25 x

    22 =9

    Q(x) = mnz 21 + z

    22 =1

    Q(z),

    y los minimizantes de Q(x) est an relacionados con los de Q(z) a traves del cambio de variableinverso x1 = 32 z1 y x2 =

    35 z2

    Resolvamos entonces primero el problema en la variable z. La matriz simetrica asociada a laforma cuadr atica Q(z) es

    A = 1 44 5 ,cuyos autovalores son 1 = 3 y 2 = 7.Por lo tanto

    mnz 21 + z

    22 =1

    Q(z) = 7,y, como

    S 2 = gen {[1 2]T },los minimizantes son

    zm = 1

    52

    5T

    y zm =

    1

    5 2

    5T

    .

    Entoncesmn

    4x 21 +25 x22 =9

    Q(x) = 7,y, aplicando el cambio de variable inverso a zm y zm , los minimizantes de Q(x) son:

    xm = 32 5

    65 5

    T

    y xm = 32 5

    65 5

    T

    .

    14

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    15/24

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    16/24

    Luego, llamando A = B 1AB 1, tenemos que

    maxR (x )=1

    Q(x) = m axz T z=1

    zT A z,

    y que x maximiza Q(x) sujeto a la restriccion R(x) = 1 si y s olo si x = B 1z y z maximizazT A z sujeto a zT z = 1. Lo mismo vale si cambiamos maximo por mnimo.

    Como A es simetrica, si M (A ) y m (A ) son el maximo y el mnimo autovalor de A ,respectivamente, y S M (A ) y S m (A ) son los correspondientes autoespacios, tenemos que

    (a)

    maxR (x )=1

    Q(x) = M (A ) y mnR (x )=1

    Q(x) = m (A ); (7)

    (b) el m aximo (mnimo) se alcanza en los x R n de la forma x = B 1z con z S M (A )(resp. z S m (A ) ) tal que z = 1.

    Con esto hemos resuelto el problema planteado. Sin embargo esta soluci on no es del todosatisfactoria por dos motivos: 1) tiene el inconveniente de que hay que calcular las matricesB , B 1 y A , y los autovalores m aximo y mnimo de esta ultima y sus correspondientesautoespacios; 2) no esta expresada directamente en funci on de los datos originales del problema,que son las matrices A y B .

    Para resolver estas deciencias necesitamos hallar la relaci on entre los autovalores y autoes-pacios de A y las matrices A y B . El siguiente resultado nos brinda esa informaci on.

    Teorema 4 Sean A R n n simetrica y B R nn simetrica y denida positiva. Sea B R n nsimetrica y tal que B 2 = B.Entonces, son equivalentes:

    1. es autovalor de A = B 1AB 1;2. es autovalor de B1A.

    Adem as, si x y z son tales que z = B x ( x = B 1z), entonces

    A z = z B1Ax = x.Demostraci on. Como B = B B , tenemos que

    B 1AB 1 I = B 1(A B )B 1 = B 1B (B1A I )B 1,y por lo tanto que

    det( B 1AB 1 I ) = det( B 1)det( B )det( B1A I )det( B 1).Teniendo en cuenta que det( B ) = det 2(B ) y que det( B 1) = det( B )1, obtenemos la igualdad

    det( B 1AB 1 I ) = det( B1A I ).Por lo tanto A y B1A tienen el mismo polinomio caracterstico y en consecuencia los mismosautovalores. Con esto queda demostrada la equivalencia entre 1. y 2.

    16

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    17/24

    Respecto de la segunda parte del teorema, supongamos que z = B x y que A z = z .Entonces

    (B 1AB 1)(B x) = B x B 1Ax = B x Ax = (B )2x = Bx B1Ax = x.Supongamos ahora que z = B x y que B

    1Ax = x . Entonces, teniendo en cuenta que

    x = B 1z y que B = B 2 tenemos que

    B1Ax = x AB 1z = BB 1z B 1AB 1z = B 1BB 1z A z = z,con lo cual naliza la demostracion del teorema.

    Note que del teorema anterior y del hecho que la matriz A = B 1AB 1 es simetrica, ypor tanto diagonalizable y con todos sus autovalores reales, se deduce el siguiente

    Corolario 1 Sean A R n n simetrica y B R n n simetrica y denida positiva. Entonces B

    1A es diagonalizable y sus autovalores son reales.

    Combinando lo hallado en (7) con el Teorema 4 obtenemos la siguiente soluci on al problemade hallar los extremos de una forma cuadr atica sujeta a una restricci on con matriz denidapositiva.

    Teorema 5 Sean A R n n simetrica y B R n n simetrica y denida positiva. Consideremos Q(x) = xT Ax y R(x) = xT Bx .Sean M (A, B ) y m (A, B ) los autovalores m aximo y mnimo de B1A respectivamente, y

    sean S M (A, B ) y S m (A, B ) los respectivos autoespacios. Entonces 1. maxR (x )=1 Q(x) = M (A, B ) y el m aximo se alcanza en los x S M (A, B ) que satisfacen

    la restricci on R(x) = 1 ;2. mn R (x )=1 Q(x) = m (A, B ) y el mnimo se alcanza en los x S m (A, B ) que satisfacen la restricci on R(x) = 1 .

    Observaci on 1 Respecto del c alculo de M (A, B ) y m (A, B ) y de sus correspondientes auto-espacios, es util tener en cuenta que es autovalor de B 1A si y solo si det(A B ) = 0 y quex satisface B 1Ax = x si y solo si Ax = Bx .

    En efecto, la primera equivalencia se debe a que

    det( B1A I ) = det( B1(A B )) = det( B1)det( A B )mientras que la segunda es inmediata.

    Luego M (A, B ) y m (A, B ) son, respectivamente, la m axima y la mnima solucion de laecuaci on det( A B ) = 0.Autovalores y autovectores generalizados. A las races de la ecuacion det( A B ) = 0,se los denomina autovalores generalizados del par de matrices ( A, B ), mientras que a los x = 0que satisfacen la ecuacion Ax = Bx se los denomina autovectores generalizados asociados alautovalor generalizado .

    17

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    18/24

    Ejemplo 8 Con el objeto de aplicar lo expuesto, consideremos el siguiente problema:

    Hallar el m aximo de Q(x) = x21 + 2 x22 sujeto a 2x

    21 + 2 x1x2 + 2 x

    22 = 1 .

    En este caso Q(x) = xT Ax y R(x) = xT Bx , con

    A = 1 00 2 y B = 2 11 2 .

    Notar que B es simetrica y denida positiva.Luego, para hallar el maximo es necesario hallar M (A, B ) que es la mayor soluci on de la

    ecuaci ondet( A B ) =

    1 2 2 2

    = (1 2)(2 2) 2 = 0 .Como las soluciones de esta ecuacion son

    1 = 1 + 33

    1, 57735 y 2 = 1

    33

    0, 42265,

    tenemos que M (A, B ) = 1.Por lo tanto

    maxR (x )=1

    Q(x) = 1 + 33

    .

    Respecto de los vectores en los cuales se alcanza este m aximo, debemos hallar las soluciones dela ecuaci on

    (A 1B )x = 0que satisfacen R(x) = 1.

    Como

    Nul( A 1B ) = gen 1 1 + 32T

    ,

    si llamamos v = 1 1+ 32

    T , tenemos que los vectores que maximizan Q(x) y cumplen la

    restricci on R(x) = 1 son los x R 2 de la forma x = v que satisfacenR(x) = R(v ) = 2R(v) = 1 = 1/R (v).

    Luego, hay dos vectores que maximizan Q(x) sujeto a la restriccion R(x) = 1:

    xM =

    1/R (v) v y xM =

    1/R (v) v.

    Ejemplo 9 Consideremos el problema planteado en el Ejemplo 7, en el cual se pide minimizar

    Q(x) = 49

    x21 80

    9 x1x2

    1259

    x22 sujeto a la restriccion 4x21 + 25 x

    22 = 9 .

    La restricci on puede escribirse

    R(x) = 49

    x21 + 25

    9 x22 = x

    T Bx T = 1 ,

    18

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    19/24

    conB =

    49 00 259

    ,

    y B es denida positiva. Entonces podemos aplicar lo desarrollado.En primer lugar hallamos los autovalores generalizados del par ( A, B ), donde A es la matriz

    simetrica asociada a Q(x):

    det( A B ) = 181

    4 4 4040 125 25

    = 100

    81 (2 + 4 21) =

    10081

    ( 3)( + 7) .Entonces m (A, B ) = 7 y

    mn4x 21 +25 x

    22 =9

    Q(x) = mnR (x )=1

    Q(x) = 7.

    Para hallar los minimizantes, debemos calcular los autovectores generalizados correspondien-tes al autovalor generalizado m (A, B ) = 7.

    Para ellos hallamos primero

    Nul( A + 7 B ) = Nul19

    32 4040 50

    = gen {[5 4]T }.

    Entonces el mnimo se alcanza en los x de la forma x = [5 4]T tales que R(x) = 2R([5 4]T ) = 2 5009 = 1. Luego = 310 5 , con lo cual los puntos que minimizan Q(x)son

    xm = 32 5

    65 5

    T

    y xm = 32 5

    65 5

    T

    ,

    los cuales coinciden con los hallados en el Ejemplo 7 por otro metodo.

    Ejemplo 10 Hallar los puntos de la curva de ecuaci on

    2x21 + 2 x1x2 + x22 = 1

    cuya distancia al origen es mnima .La distancia del punto x al origen es x . Por lo tanto, debemos hallar los puntos x que

    pertenecen a la curva dada y minimizan la funci on f (x) = x . En otras palabras, debemoshallar el mnimo de f (x) sujeto a la restriccion 2x21 + 2 x1x2 + x22 = 1. Como los x que minimizanx son exactamente los mismos que minimizan Q(x) = x 2, buscamos

    mn2x 21 +2 x 1 x 2 + x

    22 =1

    Q(x).

    Llamando R(x) = 2 x21 + 2 x1x2 + 2 x22, tenemos que R(x) = xT Bx con

    B = 2 11 2

    que es simetrica y denida positiva.Como Q(x) = xT Ix , el mnimo de Q(x) sujeta a la restriccion R(x) = 1 es el mnimo

    autovalor de la matriz B1I = B1 (Teorema 5) y se alcanza en los autovectores de B1

    19

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    20/24

    asociados a ese autovalor. Como los autovalores de B1 son los inversos de los de B , y los de Bson M (B ) = 3 y m (B ) = 1 tenemos que m (B1) = 1 / 3, con lo cual

    mnR (x )=1

    x 2 = 13

    = mnR (x )=1

    x = 13.Respecto de los minimizantes, estos son los x S m (B 1 ) (B1) tales que R(x) = 1. Como

    S m (B 1 ) (B1) = S M (B ) (B ) = gen {[1 1]T }y R([1 1]T ) = 2R([1 1]T ) = 6 2 = 1 si y solo si = 1/ 6, tenemos que los x quemaximizan la distancia al origen son

    xm = 16[1 1]T y xm = 16[1 1]T .Note que la norma de ambos es

    1

    3, que es la mnima posible para los vectores de la curva.

    El problema planteado tambien puede resolverse en forma geometrica de la siguiente manera.Como los autovalores de B son M (B ) = 3 y m (B ) = 1, y los correspondientes autoespaciosson

    S M (B ) (B ) = gen {[1 1]T } y S m (B ) (B ) = gen {[1 1]T }tenemos que con el cambio de variables x = P y, con

    P = 1 2 1 21 2 1 2 ,

    la ecuaci on R(x) = 1 es equivalente a

    R(x) = 3 y21 + y21 =

    y21a2

    + y22b2

    = 1 con a = 1 3 , b = 1 ,

    con lo cual los puntos que satisfacen la restricci on R(x) = 1 se encuentran sobre un elipsecentrada en el origen cuyo eje menor se encuentra sobre la recta generada por u = [1/ 2 1/ 2]T ,que es la primera columna de P , es decir, sobre S M (B ) (B ), y tiene longitud 2 a, y cuyo eje mayorse encuentra sobre la recta generada por v = [1/ 2 1/ 2]T , que es la segunda columna de P ,es decir, sobre S m (B ) (B ), y tiene longitud 2 b (ver Figura 4.). Luego, los puntos m as cercanosal origen se encuentran en los extremos del eje menor y su distancia al origen es precisamente

    a. Como esos puntos pertenecen a S M (B )(B ) y tienen norma a =

    1

    3 , ellos son

    xm = 16[1 1]T y xm = 16[1 1]T .Una tercera forma de resolver el problema es mediante la desigualdad de Rayleigh. En efecto,

    como los autovalores de B son M (B ) = 3 y m (B ) = 1, se tiene que:

    20

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    21/24

    1 0.5 0 0.5 11

    0.8

    0.6

    0.4

    0.2

    0

    0.2

    0.4

    0.6

    0.8

    1

    x1

    x2

    uv

    y1y2

    xm=a u

    xm* =au

    a

    a

    b

    b

    Figura 4:

    (a)

    1 R(x)

    x 2 3 x = 0 = 1

    3 x 2

    R(x) 1 x = 0 .Por lo tanto,

    13 x 2 1 x : R(x) = 1 .

    Entonces x 2 1/ 3 para todo x que satisface la restriccion R(x) = 1.(b) Como

    R(x) = 3 x 2 x S M (B ) (B ),tenemos que

    x S M (B )(B ) y R(x) = 1 = x 2 = 13

    y, viceversa,x 2 =

    13

    y R(x) = 1 = x S M (B )(B ).Luego, de (a) y (b) concluimos nuevamente que

    mnR (x )=1

    x 2 = 13

    y que el mnimo se alcanza en los x S M (B ) (B ) que satisfacen R(x) = 1 .Dadas dos formas cuadraticas Q(x) y R(x), cuando R(x) no es denida positiva, es posible

    que no existan el m aximo o el mnimo de Q(x) sujeto a la restriccion R(x) = 1. Para elloconsideremos el siguiente:

    21

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    22/24

    Ejemplo 11 Hallar, si existen, el maximo y el mnimo de Q : R 2 R , Q(x) = x 2, sujeto ala restricci on 32x21 + 52 x1x2 + 7 x22 = 180.La restricci on 32x21 + 54 x1x2 + 7 x22 = 180 puede escribirseR(x) =

    1

    180

    [

    32x21 + 54 x1x2 + 7 x

    22] = 1,

    y R(x) es claramente indenida ( R [1 0]T < 0 y R [0 1]T > 0). Por lo tanto no puede aplicarselo desarrollado en la seccion. Sin embargo este problema puede resolverse de la siguiente manera.La forma cuadratica Q(x) = x 2 representa el cuadrado de la distancia de x al origen. Por lotanto Q(x) alcanzar a su maximo en los puntos del conjunto de nivel N 1(R) que se encuentrenmas alejados del origen y su mnimo en aquellos x N 1(R) mas cercanos al origen. Para hallartales puntos, primero determinemos que clase de conjunto es N 1(R). Como R(x) = xT Bx con

    B = 1180

    32 2626 7

    y los autovalores de B son 1 = 19 y 2 =

    14 , y los correspondientes autoespacios son

    S 1 = gen {[1 2]T } y S 2 = gen {[2 1]T },con el cambio de variable ortogonal x = P y, con

    P = 1 5 2 52 5 1 5 ,

    tenemos que

    R(x) = 1 y21

    32 y2222

    = 1 .

    Por lo tanto N 1(R) es una hiperbola, cuyos ejes son los autoespacios S 1 y S 2 . Los puntos m ascercanos al origen del conjunto N 1(R) son los vertices de la hiperbola, mientras que no existenpuntos que maximicen la distancia al origen, ya que el conjunto no es acotado. Respecto de losvertices xm y xm de la hiperbola, estos tienen coordenadas ym = (3 , 0) e ym = ( 3, 0) respectodel sistema de referencia y1y2. (Ver gura 5.)

    Por lo tanto

    xm = P ym = 3 5

    6 5

    T

    y xm = P ym = 3 5

    6 5

    T

    .

    Como Q(xm ) = xm 2 = 9 tenemosmn

    R (x )=1Q(x) = 9 .

    Como la hiperbola es un conjunto no acotado, no existe m axR (x )=1 Q(x).

    Desigualdad de Rayleigh generalizada

    En lo que sigue veremos una generalizacion de la desigualdad de Rayleigh, que es util en muchascircunstancias.

    22

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    23/24

    15 10 5 0 5 10 1515

    10

    5

    0

    5

    10

    15

    y1

    y2

    x1

    x2

    3

    3

    xm

    xm*

    Figura 5:

    Teorema 6 Sean A R n n simetrica y B R n n simetrica y denida positiva.Sean M (A, B ) y m (A, B ) el m aximo y el mnimo autovalor de B 1A. Sean Q(x) = xT Ax

    y S (x) = xT Bx . Entonces

    m (A, B )S (x) Q(x) M (A, B )S (x) x R n .Adem as, Q(x) = m (A, B )S (x) si y s olo si Ax = m (A, B )Bx y Q(x) = M (A, B )S (x) si y s olosi Ax = M (A, B )Bx .

    Demostraci on. Por el Teorema 5, tenemos que

    maxS (x )=1

    Q(x) = M (A, B ),

    y que el maximo se alcanza sobre los x S M (A, B ) que satisfacen S (x) = 1.Por lo tantoQ(x) M (A, B ) x : S (x) = 1 .

    Como

    S x

    S (x)

    = 1

    S (x)

    2

    S (x) = 1 ,

    Tenemos que

    Q x

    S (x) M (A, B ).

    Como tambien

    Q x

    S (x)=

    1S (x)

    Q(x),

    23

  • 7/25/2019 13. Formas Cuadraticas Apunte de Mancilla

    24/24

    resultaQ(x) M (A, B )S (x) x R n .

    Respecto de la igualdad Q(x) = M (A, B )S (x),

    Q(x) = M (A, B )S (x) Q x

    S (x) = M (A, B )

    x

    S (x) S M (A, B ).

    Como x S M (A, B ) si y solo si Ax = M (A, B )Bx , tenemos entonces queQ(x) = M (A, B )S (x) Ax = M (A, B )Bx.

    La desigualdadm (A, B )S (x) Q(x) x R n

    y queQ(x) = m (A, B )S (x) Ax = m (A, B )Bx,

    se prueban en forma similar.

    24